【臺灣人臉辨識實例：訊連科技】全球臉部辨識20強的秘密，追加百萬亞洲臉只為多準0.9%

除了擁有全球TOP20強的辨識準度，訊連的人臉辨識引擎，也能偵測性別、年紀和情緒，還能辨識真人或是假人的2D照片。另外也能使用在小如視訊攝影機的裝置，甚至連中低階手機都能用。（攝影／洪政偉）

不同於以往中國、俄羅斯獨大，以威力導演影片剪輯聞名的臺灣老牌影音後製軟體商訊連科技（CyberLink ），在今年3月全球知名FRVT臉部辨識測試大賽，首度以自家提交的人臉辨識演算法參賽，就獲得全球評比第18名，完全不輸一線大廠，甚至認臉速度更達全球第3，還比中國頂尖人臉大廠依圖、商湯更快，「臺灣人臉辨技術一點都不輸國外」訊連科技董事長暨執行長黃肇雄自豪地說。

臺廠首度登上全球人臉辨識排行榜TOP 20

FVRT是由美國NIST（國家標準暨技術研究院）所舉辦的全球人臉辨識基準評測，是當今少數極具公信力與知名度的全球臉部辨識評比之一。因為全程測試不公開測試資料集，僅由參賽者提交算法，FRVT直接測試這些算法性能，並定期公布成績排名。就連測試硬體都嚴格規範，要求皆使用通用x86伺服器來測試，也禁用GPU加速，用來測試每個算法的人臉辨識水平，看誰的演算法更強，也讓它成為業界公認或慣用的臉部辨識能力指標，不只開發團隊，許多知名人臉辨識大廠也都參加，如日本NEC、微軟等，用它展現自己的人臉辨識技術水準。

臺灣今年首度有來自本土的臉部辨識廠商參賽，訊連科技在今年3月NIST舉行的人臉辨識大賽第一次參賽，就擠進全球人臉辨識TOP 20排名。前20名排行，其中，中國有7家上榜、俄羅斯3家，德國與日本2家，美國、英國、法國、南非與澳洲各1家，訊連是第一家上榜的臺灣業者。

在50多組參賽隊伍中，訊連提交的人臉辨識演算法，在百萬分之一誤認率的正面臉部（1比1辨識）測試上，以2.10%的FNMR拒認率（False non-Match Rate），排名第18名，還比日本東芝排更前面，甚至在辨識速度，更以0.4秒反應速度拿下全球第3，還快過準度第一名的依圖。

黃肇雄表示，這次參加比賽提交的人臉辨識演算法，採用的是該公司自行開發的人臉辨識引擎FaceMe，目前已被使用在不少國產裝置或設備上，如攝影機、服務機器人、車機等，但連他自己都料想不到，首度參加就可以獲得好佳績。除了NIST外，在去年參加的另一場MegaFace挑戰賽，成績也名列前茅，以98.41％準確率（TAR）拿下第12名。

雖然，訊連跨入臺灣人臉辨識市場僅1年多，看似剛入門的新手，但其實，早從10年前，訊連就開始投入人臉辨識的相關研究，並搭配旗下YouCam網路視訊產品先後運用在人臉登入、虛擬上妝等應用，讓用戶能以自己註冊的人臉登入PC等裝置，或是進行視訊會議時，可以手機鏡頭搭配App，就能替素顏臉龐快速上妝，甚至一般難畫的眉毛、睫毛，也難不倒它。該App至今已超過8億次下載。

黃肇雄也以自家化妝App來說明人臉辨識概念，辨識時會先需要找出100個臉部特徵，包含臉型、眼睛、唇型、眉毛等，來偵測臉部上妝位置，才有辦法替素顏人臉畫出滿意的妝容，而不會畫歪，或畫得不對稱。「相同的道理，今天一張臉可以抽取出100多個特徵，再用這些特徵來比對資料庫裡的人臉，如果有一組臉型特徵比對最相近，就可以說，這兩張臉是同一人，這就是人臉辨識。」

過去2年，深度學習人臉辨識技術獲得許多重大突破，甚至辨識度更首度超越人類水平，達到99%以上，開始在全球掀起了一股刷臉應用風潮，但是臺灣卻遲遲沒有跟上這波熱潮，黃肇雄直言：「直到去年初，臺灣還是缺少一個成熟好用的本土刷臉引擎」，他認為，一旦臺灣沒有自己的人臉引擎，到最後只能用別國，尤其是中國製的人臉引擎，不只臺灣企業很容易用到，而政府若要用時，也容易產生國安疑慮。這正是他決定要自己做的原因，要打造一套臺灣能用的臉部辨識引擎。經過數個月的開發，訊連也在去年9月推出自己的人臉辨識產品FaceMe。

訊連科技執行長黃肇雄指出，目前很難有一種人臉辨識模型適用所有人種、年齡，因此想要讓臉部辨識能力能夠在地化，來符合在地化應用的辨識需求，就需要用在地人臉資料。（攝影／洪政偉）

只需百萬張在地化的亞洲人臉資料訓練，就可替模型準度再提高0.9%

訊連這套人臉辨識引擎，是以多達一千萬張的國外人臉當作訓練素材，建立深度學習人臉辨識模型，除了可以在Windows、Linux或Android 和 iOS 等手機作業系統上執行，訊連還依硬體需求推出大小模型兩個版本，前面的這個版本的TAR辨識度有達到98.50％，雖然準確度很高，但需要搭配性能較好的CPU與GPU來執行，也是訊連這次NIST參賽提交的版本。

後者，則是一個瘦身過的輕量版本，雖然辨識度比前一個版本低了約4%左右，但是模型體積卻是大大的降低，只須要原本模型大小的五十分之一，從原先250MB的容量大小，減到只剩4MB，這也意謂著，這個人臉辨識模型，可以在更小型的運算硬體或AIoT裝置來執行，甚至，連中低階手機都能用，更重要的是，人臉辨識率依然有到94.12%的水準。

除了兩種認臉模型之外，訊連甚至還進一步推出一個亞洲人臉辨識的專用版本，這是以原本4MB大小的深度學習模型，再增加了100萬張的亞洲臉孔進行訓練。根據訊連的測試數據，用來測試亞洲人臉時，辨識率可達到99.8％，還比用千萬張臉訓練的通用版本的98.9%，還能再提高了0.9%的準度。

但不能小看這0.9%辨識率提升的重要性，因為這個版本的模型是以原先通用版各種優化算法、參數調整、模型調校，都沒能提高亞洲臉孔的辨識能力，等於是加入這100萬張亞洲臉孔的作法，讓訓練出來的人臉模型，可以更準確地認出每一張臉，而減少認錯人或誤認人的情形。除了擁有全球TOP20強的辨識準度，訊連的人臉辨識引擎，也能用於偵測性別、年紀和情緒，還能辨識真人或是假人的2D照片。

不過，黃肇雄坦言，目前很難有一種人臉辨識模型可以適用所有人種、年齡，而且辨識結果還一樣高，因此想要讓人臉辨識能力能夠在地化，來符合在地應用的辨識需求，就得要有在地人臉資料，才可以辨識得好，例如警政機關，想要認得臺灣人犯，就需要有這方面的臺灣人臉資料做訓練，才能獲得更好的臉部辨識效果，如此一來，才不會發生錯把普通人認成嫌疑犯的烏龍。「這也是為何我們要打造亞洲人臉辨識專用版本的原因。」他說。

不只是傳統1比1臉部測試，訊連今年6月還進一步挑戰難度更高的1比N辨識的人臉測試，要從數千萬筆的人臉資料庫中，找出目標人臉。

熱門新聞