AI趨勢周報第144期：16支辨識引擎打造數位布片資料庫，臺新創要當紡織界Google Search

臺灣新創Frontier除了利用AWS辨識模型來判斷布片花色、自動貼標外，也融合了臺科大的智慧影像辨識模型，甚至是醫療MR影像專用的AI技術，來強化布片辨識的精細度。

圖片來源:

攝影／王若樸

重點新聞(0925～1001)

影像辨識 紡織 Frontier

臺新創以16支辨識引擎打造數位布片資料庫，要當紡織界Google Search

臺灣新創Frontier主打紡織企業雲平臺，瞄準紡織業數位化痛點，以一套數位布片資料庫和內建的16支辨識引擎，來優化布片偵測、校正和分類等作業，把布片上傳流程從50分鐘縮短為3分鐘，連Zara母公司Inditex、Under Armour和全球最大的數位成衣設計公司Virtuality Fashion都愛用。

Frontier共同創辦人暨執行長趙均埔指出，紡織業工作流程要數位化，第一步就是建立布料樣本資料庫。目前，全球只有3家廠商提供布片資料庫服務，以其中的美國廠商來說，因布片上傳後，還得仰賴人工判斷、分類，因此整個布片上傳、建檔流程，就得花上50分鐘。而Frontier將平臺建於AWS上，利用AWS和其他工具來自動辨識布片、校正顏色、降噪、貼標和歸類等作業；趙均埔指出，該平臺共有16支辨識引擎，除了7支為AWS外，他們還採用北科大的智慧影像辨識技術，甚至還有醫療MRI病灶辨識技術，來強化對布片細節的偵測。此外，該平臺也透過自然語言處理API，來優化布料搜尋和詢價等功能。

他指出，有了數位布片庫，一件成衣的設計時間可從原本的45天縮短為1天，製成時間也從300天縮短為7天，也不會產生庫存。也因為該平臺提供聊天功能，趙均埔指出，文字傳遞結合布片辨識，也提升疫情期間的溝通效率。（詳全文）

工研院 自拍無人機 辨識

用上千張網紅照片訓練AI，工研院無人機自動捕捉最佳角度

工研院日前在年度技術日上，展示一款新研發的自拍無人機，可自動尋找最佳拍攝角度來拍照，免除過去須手動調整的不便。這款無人機所配置的辨識模型，是由上千張專業攝影師拍攝的網美照片訓練而成；工研院指出，拍攝時，AI模型會根據鏡中人的關節姿勢，比對訓練資料集中相似的照片，進而採取類似的拍攝角度和畫面裁切，自動調整飛行高度和遠近等。

工研院也表示，未來，這款無人機可協助警方於偏遠地區巡邏，從空中視角來判斷異常活動，比如夜間盜伐，再結合後臺通報系統，來即時辦案、懲處。（詳全文）

自然語言處理 參數 pQRNN PRADO

就算參數少300倍，Google新NLP模型也能達BERT水準

Google近日發表一項研究成果，團隊在去年打造的自然語言處理（NLP）模型PRADO基礎上，開發出pQRNN模型，可讓模型以少量參數，就能達到BERT等級的高階表現。

pQRNN PRADO由三個模組組成，分別是投射操作（Projection operation）、密集瓶頸層（Dense Bottleneck Layer），以及QRNN編碼器。投射操作可將文本中的Token轉換為三元向量，密集瓶頸層可學習與NLP任務相關的每個單字特徵，而QRNN編碼器不須預處理，就能從輸入的文本中學習上下文特徵。經測試，pQRNN PRADO參數雖比BERT少了300倍，且也未進行預訓練，就能在NLP任務表現上，達到與BERT相當的水準。隨後，Google也在GitHub上開源PRADO模型。（詳全文）

AI平臺預測 XGBoost 機器學習模型

Google正式推出AI平臺預測服務，要優化機器學習工作流程

Google近日發布AI平臺預測（AI Platform Prediction）正式版，開發者可用於雲端，來準備、建立、執行和共享機器學習模型。該平臺建於Google Kubernetes Engine後端，具高靈活、低延遲等特性。進一步來說，AI平臺預測讓開發者更容易部署以XGBoost、scikit等框架訓練的模型，也提供新的Compute Engine機器類型和Nvidia加速器，讓使用者依其所需來選擇。除此之外，AI平臺預測也提供模型預測的資訊和視覺化工具，來解釋模型產出預測結果的原因。AI平臺預測為完全託管、無叢集的服務，而且，要是使用者發送過多流量，Google將分配管理，以免模型過載。（詳全文）

Google LipSync 群眾外包

Google發起對嘴挑戰賽，靠群眾外包來訓練AI模型

Google日前發起一場AI挑戰賽LipSync，要請使用者為一首歌對嘴，來完成Google的AI實驗。LipSync的目標，是要衡量使用者用手機或桌機對嘴的準確度。實驗會以相機拍攝用戶的臉部表情，再以瀏覽器上的Google TensorFlow.js facemesh模型，即時分析用戶嘴巴、唇部特徵點，來評估對嘴是否準確，但不會錄下任何聲音，資料也不會回傳至Google。

Google指出，這項實驗是要協助訓練AI，來了解人說話時的表情。這些知識可建立一套系統，來追蹤無法正常說話的族群，像是肌萎縮性側索硬化症（ALS，俗稱漸凍人症）患者，甚至未來能利用語音合成技術來替他們發聲。最後，Google將開放LipSync的程式碼和技術文件下載。（詳全文）

微軟 擴充套件 程式碼

程式語言擴充套件Pylance推新功能，程式碼可讀性更高

微軟近日更新了語言伺服器擴充套件Pylance功能，新增著色和自動匯入支援等功能。Pylance是今年7月時，微軟在VS Code上新推出的Python程式語言擴充套件。

Pylance以靜態類型檢查工具Pyright為基礎，提供豐富的類型資訊，且能助開發者編寫高品質的程式碼。其中，最新的語義著色功能能以顏色突出顯示程式碼，提高整體程式碼的可讀性。再來，Pylance自動匯入完成功能也有所改進，開發者能在完成工作提示中，看到即將被添加到檔案中的匯入陳述式預覽。（詳全文）