圖片來源: 

攝影/王若樸

微軟今(27日)宣布臺灣微軟AI研發中心擴建落成,除了現場展示臺灣AI團隊的研發成果,像是應用於Windows 10的企業級人臉防偽辨識系統,以及可辨識反光、皺褶甚至潦草手寫的文字光學字元辨識(OCR)系統之外,臺灣微軟表示,AI研發中心將繼續發揮臺灣在電腦視覺的優勢外,也鎖定了使用者意圖認知和AI垂直產業應用領域,要瞄準行政院5+2產業創新計畫中的智慧製造和智慧醫療,將AI技術帶進這些產業,以及中小企業。

微軟雲端計算與人工智慧事業部全球資深副總裁郭昱廷表示,微軟十分看重電腦視覺領域的研究,去年,微軟在臺成立AI研發中心,臺灣團隊短短一年就拿下了微軟總部的核心AI研發專案,包括人臉防偽辨識、文字OCR等電腦視覺應用,並交出漂亮成績單,「特別是收據OCR,不到半年就開發出令人驚豔的辨識模組,總部也相當肯定,認為全球沒有其他軟體能夠媲美。」也因為臺灣團隊表現優異,微軟總部決定擴大在臺AI研發中心的規模,要吸引更多人才來開發、優化更多微軟全球性的服務。

人臉辨識防偽達企業級水準,收據OCR連皺褶、反光和手寫都難不倒

今日,臺灣微軟AI研發中心首席研發總監暨清大資工系教授賴尚宏也與同仁在現場展示研究成果,首先是應用於微軟Windows 10的人臉辨識解鎖系統Windows Hello。他解釋,這套辨識系統由紅外線3D深度感測相機與深度學習模型打造,其中的相機模組,是由微軟與臺灣廠商共同設計、生產,而深度學習模型則由臺灣團隊開發,主要是要讓使用者可安全、快速登入系統。

為展示辨識系統的辨識精準度,賴尚宏也利用同仁的彩色大頭照、高解析度大頭照做成的人臉面具,以及大尺寸、由電子墨水列印的黑白大頭照來測試登入系統。如果系統辨識為同仁本人(真人),就會出現綠色框,反之則為紅色框。結果顯示,不論是彩色大頭照還是黑白大頭照,都難以騙過系統(如下圖),能夠達到身分認證的安全性要求。微軟表示,3D人臉防偽技術適用於企業門禁、資訊安全管理方面。

不過,郭昱廷也強調,企圖破解人臉辨識系統的手法層出不窮,臺灣團隊也將持續優化系統,以因應新型態詐騙手段。

接下來則是文字OCR辨識功能。首先,臺灣微軟AI研發中心同仁拿出一包餅乾包裝袋,將其後方的營養成分表以手機拍下,再上傳到自家的社群協作平臺Microsoft Teams,使用內建的OCR辨識系統來偵測相片中的文字。

結果顯示,舉凡文字、數字、條碼,不論是否皺褶、反光,只要是照片中的營養成分表皆能辨識出,甚至連潦草的手寫文字也可以(如下圖)。

另一方面,AI研發中心同仁也拿了一張美國的英文收據來測試,同樣以手機拍照、上傳至Microsoft Teams,再交由系統辨識。由於美國收據沒有固定格式,每家店都可能有自己的格式,因此,微軟利用自家自然語言處理技術(NLP),來從中萃取資訊,並進行分類和檢索(如下圖)。

結果顯示,系統可順利辨識出店家名稱、地址、消費時間,甚至是手寫的消費金額,並將這些資訊自動歸類,降低手動分類的麻煩。

郭昱廷指出,這款文字OCR適用於名片、表格、文件、收據等,並已應用於微軟內部的報帳系統,另外,也在Azure平臺上提供預覽版本(Preview),供使用者下載。同時,這套收據OCR系統也持續擴增辨識語言,以供不同國家的企業使用。

微軟AI研發中心擴建,將鎖定電腦視覺、使用者意圖認知、AI垂直產業應用

隨著AI研發中心擴建,未來除了持續鎖定電腦視覺應用,還要發展使用者意圖認知和AI垂直產業應用。使用者意圖認知是要打造精準的使用者偏好模型,來開發更多貼近使用者行為的應用。郭昱廷表示,臺灣AI研發中心團隊目前進行的專案中,其中之一就是關於使用者意圖認知的Bing廣告預測。

而AI垂直產業應用則是臺灣微軟AI研發中心的長期目標。施立成提到,有別於針對對AI投資規模最大的金融業,這次臺灣微軟要鎖定行政院5+2產業創新計畫中的智慧製造、智慧醫療,發展工業4.0,同時也要結合臺灣硬體產業,發展AI生態圈。

總統蔡英文也在席中表示,過去,只有專家才能接觸AI,而現在則大量應用於生活中,像是健康助理、商業分析等。她也指出,AI的發展除了靠技術,還靠想像力,而民主自由的臺灣人才,滿足這個條件。她期許微軟臺灣AI研發中心可成為下一世代的關鍵技術的重要推手。文◎王若樸


Advertisement

更多 iThome相關內容