不同於以往中國、俄羅斯獨大,以威力導演影片剪輯聞名的臺灣老牌影音後製軟體商訊連科技(CyberLink ),在今年3月全球知名FRVT臉部辨識測試大賽,首度以自家提交的人臉辨識演算法參賽,就獲得全球評比第18名,完全不輸一線大廠,甚至認臉速度更達全球第3,還比中國頂尖人臉大廠依圖、商湯更快,「臺灣人臉辨技術一點都不輸國外」訊連科技董事長暨執行長黃肇雄自豪地說。
臺廠首度登上全球人臉辨識排行榜TOP 20
FVRT是由美國NIST(國家標準暨技術研究院)所舉辦的全球人臉辨識基準評測,是當今少數極具公信力與知名度的全球臉部辨識評比之一。因為全程測試不公開測試資料集,僅由參賽者提交算法,FRVT直接測試這些算法性能,並定期公布成績排名。就連測試硬體都嚴格規範,要求皆使用通用x86伺服器來測試,也禁用GPU加速,用來測試每個算法的人臉辨識水平,看誰的演算法更強,也讓它成為業界公認或慣用的臉部辨識能力指標,不只開發團隊,許多知名人臉辨識大廠也都參加,如日本NEC、微軟等,用它展現自己的人臉辨識技術水準。
臺灣今年首度有來自本土的臉部辨識廠商參賽,訊連科技在今年3月NIST舉行的人臉辨識大賽第一次參賽,就擠進全球人臉辨識TOP 20排名。前20名排行,其中,中國有7家上榜、俄羅斯3家,德國與日本2家,美國、英國、法國、南非與澳洲各1家,訊連是第一家上榜的臺灣業者。
在50多組參賽隊伍中,訊連提交的人臉辨識演算法,在百萬分之一誤認率的正面臉部(1比1辨識)測試上,以2.10%的FNMR拒認率(False non-Match Rate),排名第18名,還比日本東芝排更前面,甚至在辨識速度,更以0.4秒反應速度拿下全球第3,還快過準度第一名的依圖。
黃肇雄表示,這次參加比賽提交的人臉辨識演算法,採用的是該公司自行開發的人臉辨識引擎FaceMe,目前已被使用在不少國產裝置或設備上,如攝影機、服務機器人、車機等,但連他自己都料想不到,首度參加就可以獲得好佳績。除了NIST外,在去年參加的另一場MegaFace挑戰賽,成績也名列前茅,以98.41%準確率(TAR)拿下第12名。
雖然,訊連跨入臺灣人臉辨識市場僅1年多,看似剛入門的新手,但其實,早從10年前,訊連就開始投入人臉辨識的相關研究,並搭配旗下YouCam網路視訊產品先後運用在人臉登入、虛擬上妝等應用,讓用戶能以自己註冊的人臉登入PC等裝置,或是進行視訊會議時,可以手機鏡頭搭配App,就能替素顏臉龐快速上妝,甚至一般難畫的眉毛、睫毛,也難不倒它。該App至今已超過8億次下載。
黃肇雄也以自家化妝App來說明人臉辨識概念,辨識時會先需要找出100個臉部特徵,包含臉型、眼睛、唇型、眉毛等,來偵測臉部上妝位置,才有辦法替素顏人臉畫出滿意的妝容,而不會畫歪,或畫得不對稱。「相同的道理,今天一張臉可以抽取出100多個特徵,再用這些特徵來比對資料庫裡的人臉,如果有一組臉型特徵比對最相近,就可以說,這兩張臉是同一人,這就是人臉辨識。」
過去2年,深度學習人臉辨識技術獲得許多重大突破,甚至辨識度更首度超越人類水平,達到99%以上,開始在全球掀起了一股刷臉應用風潮, 但是臺灣卻遲遲沒有跟上這波熱潮,黃肇雄直言:「直到去年初,臺灣還是缺少一個成熟好用的本土刷臉引擎」,他認為,一旦臺灣沒有自己的人臉引擎,到最後只能用別國,尤其是中國製的人臉引擎,不只臺灣企業很容易用到,而政府若要用時,也容易產生國安疑慮。這正是他決定要自己做的原因,要打造一套臺灣能用的臉部辨識引擎。經過數個月的開發,訊連也在去年9月推出自己的人臉辨識產品FaceMe。
訊連科技執行長黃肇雄指出,目前很難有一種人臉辨識模型適用所有人種、年齡,因此想要讓臉部辨識能力能夠在地化,來符合在地化應用的辨識需求,就需要用在地人臉資料。 (攝影/洪政偉)
只需百萬張在地化的亞洲人臉資料訓練,就可替模型準度再提高0.9%
訊連這套人臉辨識引擎,是以多達一千萬張的國外人臉當作訓練素材,建立深度學習人臉辨識模型,除了可以在Windows、Linux或Android 和 iOS 等手機作業系統上執行,訊連還依硬體需求推出大小模型兩個版本,前面的這個版本的TAR辨識度有達到98.50%,雖然準確度很高,但需要搭配性能較好的CPU與GPU來執行,也是訊連這次NIST參賽提交的版本。
後者,則是一個瘦身過的輕量版本,雖然辨識度比前一個版本低了約4%左右,但是模型體積卻是大大的降低,只須要原本模型大小的五十分之一,從原先250MB的容量大小,減到只剩4MB,這也意謂著,這個人臉辨識模型,可以在更小型的運算硬體或AIoT裝置來執行,甚至,連中低階手機都能用,更重要的是,人臉辨識率依然有到94.12%的水準。
除了兩種認臉模型之外,訊連甚至還進一步推出一個亞洲人臉辨識的專用版本,這是以原本4MB大小的深度學習模型,再增加了100萬張的亞洲臉孔進行訓練。根據訊連的測試數據,用來測試亞洲人臉時,辨識率可達到99.8%,還比用千萬張臉訓練的通用版本的98.9%,還能再提高了0.9%的準度。
但不能小看這0.9%辨識率提升的重要性,因為這個版本的模型是以原先通用版各種優化算法、參數調整、模型調校,都沒能提高亞洲臉孔的辨識能力,等於是加入這100萬張亞洲臉孔的作法,讓訓練出來的人臉模型,可以更準確地認出每一張臉,而減少認錯人或誤認人的情形。除了擁有全球TOP20強的辨識準度,訊連的人臉辨識引擎,也能用於偵測性別、年紀和情緒,還能辨識真人或是假人的2D照片。
不過,黃肇雄坦言,目前很難有一種人臉辨識模型可以適用所有人種、年齡,而且辨識結果還一樣高,因此想要讓人臉辨識能力能夠在地化,來符合在地應用的辨識需求,就得要有在地人臉資料,才可以辨識得好,例如警政機關,想要認得臺灣人犯,就需要有這方面的臺灣人臉資料做訓練,才能獲得更好的臉部辨識效果,如此一來,才不會發生錯把普通人認成嫌疑犯的烏龍。「這也是為何我們要打造亞洲人臉辨識專用版本的原因。」他說。
不只是傳統1比1臉部測試,訊連今年6月還進一步挑戰難度更高的1比N辨識的人臉測試,要從數千萬筆的人臉資料庫中,找出目標人臉。
熱門新聞
2024-11-29
2024-11-20
2024-11-15
2024-11-15
2024-12-19