工研院大秀AI研發新成果，O2O服飾試穿推薦、餐飲顧客影像識別，還有自動偵測入侵者的監視器

工研院推出一套涵蓋線上與線下的智慧時尚應用方案，稱為「易賞」，線上的應用主要在於服飾屬性辨識與智慧推薦，線下則是要打造沉浸式情境試衣間。

圖片來源:

攝影/翁芊儒

工研院在今年ICT TechDay（資通訊科技日）中，展示AI應用於各行業的解決方案，包括時尚服飾業線上線下的個性化推薦與智慧試衣、餐飲業顧客的行為偵測、跨攝影機的影像識別技術等，也展出了推動AI落地而開發的多項工具，如深度神經網路（DNN）推論加速晶片的客製化技術、以及訓練DNN模型的管理平臺。

O2O服飾試穿推薦「易賞」

服飾產業能透過AI技術，加值線上與線下消費的體驗，國際上不乏應用案例，具代表性的例子有Amazon的Echo Style Check，能用Alexa聲控相機拍攝不同穿搭照片，再由內建AI推薦時下流行穿搭；或像阿里巴巴設立了AI服飾店，根據淘寶50萬組時尚達人穿搭，提供個性化衣著搭配或單品穿搭建議。

趁著服飾業AI熱潮，工研院也推出一套涵蓋線上與線下的智慧時尚應用方案，稱為「易賞」，以服飾電商超過500萬件的服飾圖像標記作為訓練資料，擷取出服飾特徵，包括款式（上半身、下半身或連身套裝）、顏色、袖長、下襬長度、口袋、領口、紋理等標記，訓練出AI模型來辨識服飾風格，省去人工標記的成本，不但可以進一步應用於消費者的個性化推薦，也能藉由銷售數據，即時分析受歡迎的風格，抓住時尚的趨勢與潮流。

線上的應用主要在於服飾屬性辨識與智慧推薦，線下則是要打造沉浸式情境試衣間，讓消費者透過平板或手機選出喜歡的服飾，進入試衣間後，會由人員或自走車來配送衣服到試衣間旁邊，而每件衣服上都有感應裝置，當衣服被拿取，試衣間內會場景根據衣服的風格來轉變，比如拿取宴會風格的衣服，背景將自動切換為宴會場景；此外，試衣間內也提供手機自拍架，讓消費者能輕鬆自拍與親友分享，藉此來提供更好的試穿體驗。

工研院資通所經理連俊宏表示，工研院要藉著易賞的應用，讓消費者有良好的試衣體驗來增加購買機率，並透過個人消費數據進一步個性化推薦不同風格的商品；同時，也要讓經營者藉由銷售數據洞悉服飾潮流的趨勢，來調整各種服飾的進貨與庫存量，進而減少庫存、降低滯銷風險。

首先，先站到攝影機與面板前方，透過影像辨識，系統會自動分析顧客的衣著款式、風格等特徵，並根據顧客衣著風格來推薦店內同風格的服飾。

試衣間內部會有背景螢幕，隨著顧客拿起不同風格的衣服，看板畫面也會隨之改變，如宴會風格的衣服會對應宴會風格的背景。

餐飲業專用顧客行為影像識別

工研院另外也發表了一套餐飲業專用的AI影像顧客行為識別技術。首先，在結帳台前，用數位看板等感應裝置分析顧客人臉屬性，包括年齡、性別、表情等，接著與後端POS機的餐點內容做整合，來進一步推測不同年齡、性別的消費者點餐內容的差異，可供業者結合行銷手法進一步加值運用。

此外，這套系統也能偵測座位狀態，包括是否空桌、可否帶位，或是桌面待清理等，都可以直接透過系統更新，讓服務人員更快速清出空位、帶入新顧客，來提升營運效率；此外，系統也能偵測顧客舉手的行為，是什麼時間點、幾桌？即時通知服務人員回應顧客需求，而第一線服務員也能在服務過後，回到後臺註記下服務內容，比如這次桌邊服務是幫客人倒水、換餐具或是遞紙巾？精準紀錄下這些資訊。

工研院資通所經理蘇奕宇表示，曾有人懷疑行為偵測等功能是否為AI而AI，並沒有真正改善餐飲業的痛點，然而，餐飲業者在提升服務品質過程中需要精準資訊，比如藉由偵測舉手行為並精準記錄服務內容，可以用來推測服務人員為何常幫客人換餐具的原因，是否因餐具清潔有問題；或者經常要倒茶水的解方，可能是每桌事先備好一壺茶水等。唯有蒐集這些細節資訊，才能讓人力運用更有彈性、做好成本控管，進而改善消費者體驗。

經濟部去年預估，全臺餐飲業市場逐年成長4％，今年將超過突破5,000億元。蘇奕宇表示，但餐飲業入行門檻低、變動步調快、營運彈性大，隨著競爭越來越激烈，提升服務品質、消費者創新體驗，成了餐廳長期經營的關鍵。

點餐時可以偵測人臉屬性；結合監控攝影機，也能偵測顧客舉手行為與餐桌狀態。

跨攝影機的影像識別平臺

工研院研發了一套與監視器結合的影像人物辨識平臺MEDUSA（Massive Enitities Detecting in Ubiquitous Surveillence Application），不僅建立一個平臺提供跨攝影機影像識別，也有即時分析影像的儀表板，可偵測特定行為異常的入侵者，立即報警。不同於常見監視器系統主要以人員監看或錄影回放為主的基本功能。截至今年第二季，這套系統已經在工研院內與部分商場等5個以上的場所，開始試營運與驗證。

這套系統的應用方式，是在一個封閉場域裝設好監視器後，若有非驗證的人員進入，出入口監視器首先會偵測人物，並萃取人物的影像特徵，再跟場域內多支監視器進行人物影像特徵比對，同時藉由管理系統，將該入侵狀態的事件內容、時間、位置輸出到儀表板，或將異常資訊傳送到警衛人員的App來報警，達到人機協同合作的目的。

蘇奕宇表示，以工研院約40公尺長的辦公場域為例，在監控畫面中，若有人員在兩個出入口刷卡後進入，客人頭上會顯示Guest ID，職員則會顯示員工ID等資訊，儀表板能監控每個人的實際狀況；然而，這時若有人突然從逃生門、安全門進入該場域，系統將馬上偵測到異常並即時報警，也能根據不同場域的設定顯示不同異常狀態，例如是禁區遭入侵、或是不該有人的時段卻有人出現等。

該系統的另一個特色，則是快速部署，「中小型場域在2-4小時內就能完成布建，並開始實際運作，像昨天在展示會場布建6支監視器，總共花4小時。」蘇奕宇也強調，這個系統開發的目的不是要取代現有的保全，而是透過健全的影像偵測系統，讓現場保全人力能在關鍵時刻發揮作用。

監視器可以偵測並非從出入口進出的人員。

影像分析資訊會傳送至儀表板或手機App，即時發出告警。

客製化設計DNN推論加速晶片

專門用於加速DNN模型推論的晶片，稱為「DNN推論加速晶片」。由於加速晶片需要配合不同DNN模型與實際應用情境來進行客製化設計，但目前市面上並無一套系統化的開發工具，因此，工研院引用了開源深度學習加速器架構 NVDLA（Nvidia Deep Learning Accelerator）作為基礎架構，提供企業一套從架構設計到驗證的晶片設計方法，縮短企業設計晶片的時程、能快速搶進AI晶片市場。

由於DNN模型的網絡通常很龐大，為了部署到運算效能有限的晶片中，除了藉由減少數據從記憶體搬運的次數來降低功耗，更直觀的方法是運用平行化運算的架構來加快運算速度。然而，平行化加速運算會受限於資料傳輸的頻寬（Memory Bandwidth），且每個DNN模型在不同運算效能（GOPs）與頻寬（GB/s）下，會得到不同的每秒傳輸幀數（FPS），因此在設計上有其最佳化的設定，「這是模型本身的特質，因此需要客製化硬體架構。」工研院資通所技術組長朱元華表示。

NVDLA是Nvidia 2017年公開釋出產品Xavier中的深度學習加速器，允許使用者修改原始碼，再製成自己的產品，也就是說，提供他人客製化自己的AI推論加速器，且由於 NVDLA涵蓋了AI運算中重要的運算子（operator），包括卷積（Convolutional）、逐元素（Element-Wise）、池化（Pool）、非線性（Nonlinear）等處理器（Processor），因此能適用多種DNN模型。「假設企業想開發特定模型的AI晶片，使用開源架構是一個很好的起手式，只要在後續的設計上多著力即可。」

客製化設計AI推論加速晶片的流程。

訓練DNN模型的管理平臺

除了DNN推論加速晶片的設計工具，工研院也推出一套用來訓練DNN模型的平臺，要讓企業縮短建置AI環境的時間。這個平臺從資料庫、人員權限、模型版本、運算資源都能管理，例如資料庫的管理，使用者可以建立各個專案中已標記／未標記的資料等，而不同人員權限可以開啟的資料庫、專案、運算資員也不同。

使用者需要訓練AI模型時，先建立專案，能使用平臺內建的開源演算法，或是自己開發演算法來訓練模型，而每一次訓練過程調整的參數，可以建立成歷史紀錄中的不同版本，日後可以一鍵回顧每一次的版本資料與訓練情形；此外，系統也提供Jupyter Notebook讓用戶開發演算法，用戶可以在此上傳自己的程式碼來訓練，甚至可以安裝所需的軟體，只要在開發完成後將整個環境儲存，下次就能用同樣的環境來訓練模型。

運算資源的管理，則是靠系統自行排程，將各專案的模型自動部署到沒有在運行的GPU上，假設GPU 1、2都有在用，系統就會排程到GPU 3或4去做運算，也能設定運算資源的使用上限；而系統介面則可以監測GPU的使用率、溫度、記憶體用量等，隨時掌握運算資源的使用情形。目前，這個平臺主要提供部署於私有雲之上，目前尚未能在公有雲上使用。

DNN模型管理平臺介面。

O2O服飾試穿推薦「易賞」

餐飲業專用顧客行為影像識別

跨攝影機的影像識別平臺

客製化設計DNN推論加速晶片

訓練DNN模型的管理平臺

熱門新聞