攝影/翁芊儒
工研院在今年ICT TechDay(資通訊科技日)中,展示AI應用於各行業的解決方案,包括時尚服飾業線上線下的個性化推薦與智慧試衣、餐飲業顧客的行為偵測、跨攝影機的影像識別技術等,也展出了推動AI落地而開發的多項工具,如深度神經網路(DNN)推論加速晶片的客製化技術、以及訓練DNN模型的管理平臺。
O2O服飾試穿推薦「易賞」
服飾產業能透過AI技術,加值線上與線下消費的體驗,國際上不乏應用案例,具代表性的例子有Amazon的Echo Style Check,能用Alexa聲控相機拍攝不同穿搭照片,再由內建AI推薦時下流行穿搭;或像阿里巴巴設立了AI服飾店,根據淘寶50萬組時尚達人穿搭,提供個性化衣著搭配或單品穿搭建議。
趁著服飾業AI熱潮,工研院也推出一套涵蓋線上與線下的智慧時尚應用方案,稱為「易賞」,以服飾電商超過500萬件的服飾圖像標記作為訓練資料,擷取出服飾特徵,包括款式(上半身、下半身或連身套裝)、顏色、袖長、下襬長度、口袋、領口、紋理等標記,訓練出AI模型來辨識服飾風格,省去人工標記的成本,不但可以進一步應用於消費者的個性化推薦,也能藉由銷售數據,即時分析受歡迎的風格,抓住時尚的趨勢與潮流。
線上的應用主要在於服飾屬性辨識與智慧推薦,線下則是要打造沉浸式情境試衣間,讓消費者透過平板或手機選出喜歡的服飾,進入試衣間後,會由人員或自走車來配送衣服到試衣間旁邊,而每件衣服上都有感應裝置,當衣服被拿取,試衣間內會場景根據衣服的風格來轉變,比如拿取宴會風格的衣服,背景將自動切換為宴會場景;此外,試衣間內也提供手機自拍架,讓消費者能輕鬆自拍與親友分享,藉此來提供更好的試穿體驗。
工研院資通所經理連俊宏表示,工研院要藉著易賞的應用,讓消費者有良好的試衣體驗來增加購買機率,並透過個人消費數據進一步個性化推薦不同風格的商品;同時,也要讓經營者藉由銷售數據洞悉服飾潮流的趨勢,來調整各種服飾的進貨與庫存量,進而減少庫存、降低滯銷風險。
首先,先站到攝影機與面板前方,透過影像辨識,系統會自動分析顧客的衣著款式、風格等特徵,並根據顧客衣著風格來推薦店內同風格的服飾。
試衣間內部會有背景螢幕,隨著顧客拿起不同風格的衣服,看板畫面也會隨之改變,如宴會風格的衣服會對應宴會風格的背景。
餐飲業專用顧客行為影像識別
工研院另外也發表了一套餐飲業專用的AI影像顧客行為識別技術。首先,在結帳台前,用數位看板等感應裝置分析顧客人臉屬性,包括年齡、性別、表情等,接著與後端POS機的餐點內容做整合,來進一步推測不同年齡、性別的消費者點餐內容的差異,可供業者結合行銷手法進一步加值運用。
此外,這套系統也能偵測座位狀態,包括是否空桌、可否帶位,或是桌面待清理等,都可以直接透過系統更新,讓服務人員更快速清出空位、帶入新顧客,來提升營運效率;此外,系統也能偵測顧客舉手的行為,是什麼時間點、幾桌?即時通知服務人員回應顧客需求,而第一線服務員也能在服務過後,回到後臺註記下服務內容,比如這次桌邊服務是幫客人倒水、換餐具或是遞紙巾?精準紀錄下這些資訊。
工研院資通所經理蘇奕宇表示,曾有人懷疑行為偵測等功能是否為AI而AI,並沒有真正改善餐飲業的痛點,然而,餐飲業者在提升服務品質過程中需要精準資訊,比如藉由偵測舉手行為並精準記錄服務內容,可以用來推測服務人員為何常幫客人換餐具的原因,是否因餐具清潔有問題;或者經常要倒茶水的解方,可能是每桌事先備好一壺茶水等。唯有蒐集這些細節資訊,才能讓人力運用更有彈性、做好成本控管,進而改善消費者體驗。
經濟部去年預估,全臺餐飲業市場逐年成長4%,今年將超過突破5,000億元。蘇奕宇表示,但餐飲業入行門檻低、變動步調快、營運彈性大,隨著競爭越來越激烈,提升服務品質、消費者創新體驗,成了餐廳長期經營的關鍵。
點餐時可以偵測人臉屬性;結合監控攝影機,也能偵測顧客舉手行為與餐桌狀態。
跨攝影機的影像識別平臺
工研院研發了一套與監視器結合的影像人物辨識平臺MEDUSA(Massive Enitities Detecting in Ubiquitous Surveillence Application),不僅建立一個平臺提供跨攝影機影像識別,也有即時分析影像的儀表板,可偵測特定行為異常的入侵者,立即報警。不同於常見監視器系統主要以人員監看或錄影回放為主的基本功能。截至今年第二季,這套系統已經在工研院內與部分商場等5個以上的場所,開始試營運與驗證。
這套系統的應用方式,是在一個封閉場域裝設好監視器後,若有非驗證的人員進入,出入口監視器首先會偵測人物,並萃取人物的影像特徵,再跟場域內多支監視器進行人物影像特徵比對,同時藉由管理系統,將該入侵狀態的事件內容、時間、位置輸出到儀表板,或將異常資訊傳送到警衛人員的App來報警,達到人機協同合作的目的。
蘇奕宇表示,以工研院約40公尺長的辦公場域為例,在監控畫面中,若有人員在兩個出入口刷卡後進入,客人頭上會顯示Guest ID,職員則會顯示員工ID等資訊,儀表板能監控每個人的實際狀況;然而,這時若有人突然從逃生門、安全門進入該場域,系統將馬上偵測到異常並即時報警,也能根據不同場域的設定顯示不同異常狀態,例如是禁區遭入侵、或是不該有人的時段卻有人出現等。
該系統的另一個特色,則是快速部署,「中小型場域在2-4小時內就能完成布建,並開始實際運作,像昨天在展示會場布建6支監視器,總共花4小時。」蘇奕宇也強調,這個系統開發的目的不是要取代現有的保全,而是透過健全的影像偵測系統,讓現場保全人力能在關鍵時刻發揮作用。
監視器可以偵測並非從出入口進出的人員。
影像分析資訊會傳送至儀表板或手機App,即時發出告警。
客製化設計DNN推論加速晶片
專門用於加速DNN模型推論的晶片,稱為「DNN推論加速晶片」。由於加速晶片需要配合不同DNN模型與實際應用情境來進行客製化設計,但目前市面上並無一套系統化的開發工具,因此,工研院引用了開源深度學習加速器架構 NVDLA(Nvidia Deep Learning Accelerator)作為基礎架構,提供企業一套從架構設計到驗證的晶片設計方法,縮短企業設計晶片的時程、能快速搶進AI晶片市場。
由於DNN模型的網絡通常很龐大,為了部署到運算效能有限的晶片中,除了藉由減少數據從記憶體搬運的次數來降低功耗,更直觀的方法是運用平行化運算的架構來加快運算速度。然而,平行化加速運算會受限於資料傳輸的頻寬(Memory Bandwidth),且每個DNN模型在不同運算效能(GOPs)與頻寬(GB/s)下,會得到不同的每秒傳輸幀數(FPS),因此在設計上有其最佳化的設定,「這是模型本身的特質,因此需要客製化硬體架構。」工研院資通所技術組長朱元華表示。
NVDLA是Nvidia 2017年公開釋出產品Xavier中的深度學習加速器,允許使用者修改原始碼,再製成自己的產品,也就是說,提供他人客製化自己的AI推論加速器,且由於 NVDLA涵蓋了AI運算中重要的運算子(operator),包括卷積(Convolutional)、逐元素(Element-Wise)、池化(Pool)、非線性(Nonlinear)等處理器(Processor),因此能適用多種DNN模型。「假設企業想開發特定模型的AI晶片,使用開源架構是一個很好的起手式,只要在後續的設計上多著力即可。」
客製化設計AI推論加速晶片的流程。
訓練DNN模型的管理平臺
除了DNN推論加速晶片的設計工具,工研院也推出一套用來訓練DNN模型的平臺,要讓企業縮短建置AI環境的時間。這個平臺從資料庫、人員權限、模型版本、運算資源都能管理,例如資料庫的管理,使用者可以建立各個專案中已標記/未標記的資料等,而不同人員權限可以開啟的資料庫、專案、運算資員也不同。
使用者需要訓練AI模型時,先建立專案,能使用平臺內建的開源演算法,或是自己開發演算法來訓練模型,而每一次訓練過程調整的參數,可以建立成歷史紀錄中的不同版本,日後可以一鍵回顧每一次的版本資料與訓練情形;此外,系統也提供Jupyter Notebook讓用戶開發演算法,用戶可以在此上傳自己的程式碼來訓練,甚至可以安裝所需的軟體,只要在開發完成後將整個環境儲存,下次就能用同樣的環境來訓練模型。
運算資源的管理,則是靠系統自行排程,將各專案的模型自動部署到沒有在運行的GPU上,假設GPU 1、2都有在用,系統就會排程到GPU 3或4去做運算,也能設定運算資源的使用上限;而系統介面則可以監測GPU的使用率、溫度、記憶體用量等,隨時掌握運算資源的使用情形。目前,這個平臺主要提供部署於私有雲之上,目前尚未能在公有雲上使用。
DNN模型管理平臺介面。
熱門新聞
2024-12-24
2024-08-14
2024-12-20
2024-12-22
2024-12-23
2024-12-23