【臺灣人臉辨識實例：中華電信】千分之一少數是關鍵，百萬人臉AI仍須在地圖庫才夠準

年初時，中華電信研究院已將自家人臉辨識引擎，先用來管理總公司內部數百名委外清潔員工的上班出勤，現在每位人員上下班，都會先通過一臺刷臉打卡機來進行簽到或是刷退，以取代傳統上下班打卡。（攝影／洪政偉）

十年研發，蒐羅全球百萬張人臉照片訓練的臉部辨識引擎，遇上自家員工的臉，竟然出了狀況。去年10月，中華電信研究院信心滿滿地展開了一項實測計畫，在實驗室測試辨識度高達99%的臉部辨識引擎，卻在辨識員工人臉時，效果大打折扣，常常會認不出來。

用了全球人臉公開資料庫訓練，準確率有世界級水準的自製臉部辨識技術，實測為何失準？他們靈機一動，改換用在地人臉，僅增加數千張亞洲臉孔，在辨識人臉時就有了近1成的提升，甚至還比原先百萬張國外人臉訓練的模型辨識效果更好，大大改善了原有臺灣人臉辨識度的不足。該院巨量資料研究所所長汪世昌說：「這正是人臉辨識要在臺灣落地的應用關鍵，只有用臺灣人臉資料，才能打造出最符合在地化使用的人臉應用。」

引進當紅的深度學習技術，1年內就讓人臉辨識準度明顯提升

負責中華電信自主技術研發的中華電信研究院，從事AI影像辨識研發長達10多年之久，約2008年左右開始投入人臉辨識技術開發，不過一開始，僅以傳統機器學習技術（如LBP）來進行人臉模型訓練時，辨識度最高僅有8成，難以達到商用的水準，直到2年前，引進當紅的深度學習技術後，短短1年內，就讓自家人臉辨識準確度有了大幅度提升。

汪世昌指出，深度學習技術的出現，解決傳統演算法的諸多瓶頸，像是對於表情、年齡、化妝、戴眼鏡等臉部不同變化，準確度就比傳統人臉辨識技術來得高；另外，對於光影、人臉角度的變化，也有更高的辨識容忍度。更重要的是，藉由大量資料進行訓練，就能持續改善模型的辨識率。

但想要提升辨識率，訓練資料就要越多越好，汪世昌也大方分享自家經驗，在LFW測試（公開人臉資料集評比）上，大約20萬張人臉訓練資料，TAR辨識率就可以達到98%，但他進一步指出，想要在提高辨識度，接下來就只能靠資料量與技術上來突破。

因此，在技術上，中華電信採用深度學習的CNN（卷積神經網路）技術，搭配TensorFlow機器學習框架來進行人臉辨識模型開發，一舉將臉部辨識提高到九成八的辨識率，這還只是使用2千多人共計20萬張人臉資料進行模型訓練的成果。接下來，再從原先2千人增加到1萬人，訓練資料量也翻了3倍，以多達60萬張人臉影像進行訓練，辨識率也因此在短短不到1年內，就推升到99％以上，「如今，我們的訓練人臉資料已達到100萬張，在進行LFW測試時，辨識率高達99.78%。」汪世昌說。

在訓練摸型的同時，中華電信研究團隊還針對人臉影像進行校正、調校尺寸，來持續優化模型提高認臉能力，甚至還開發自動過濾演算法，增加訓練可用的大量人臉至4萬人。汪世昌也透露，為了要縮短模型訓練時間，還引進了運算力更強的硬體，如要價不菲的深度學習專用硬體DGX-1等，來加快深度學習模型的訓練，以百萬張人臉為例，他說，原先每次訓練模型最少要花3天，現在，只用不到1天就能訓練完，開發人員可以更快觀看測試結果與進行模型參數調效，來持續優化模型，讓它的辨識效果可以越來越好。

中華電信研究院巨量資料研究所所長汪世昌認為，當人臉辨識的辨識率已達到98%或99%以上時，產業應用才是發展重心，想讓人臉辨識可以落地為實際應用，在地化人臉資料是關鍵。（攝影／洪政偉）

要用當地臉部資料做訓練，人臉辨識模型才能更貼近在地需求

但是，就算測試辨識效果再高，並無法真正反應出實際應用場景也是如此，汪世昌就認為，當人臉辨識的辨識率已達到98%或99%以上時，產業應用才是接下來的發展重心。「而要讓人臉辨識可以落地成為實際應用，在地化人臉資料是關鍵。」他說。

他也以自家人臉辨識引擎來說明沒有在地人臉資料的影響有多大。去年底，研究院在內部展開一項實測時，卻發現原本在實驗環境測試辨識率有高達99.6%的人臉辨識模型，卻認不太出自家員工，甚至辨識率連8成都不到。更進一步分析才發現，這些辨識容易出錯的人臉影像，大多是屬於側臉，而不是正臉，甚至只要臉部角度稍有偏差，就容易被誤認成別人或無法辨識，但認外國人臉時，就幾乎沒有這個問題。

但改加入了亞洲人臉孔資料後，再重新對員工來進行辨識，汪世昌表示，結果就完全不一樣，馬上就有了明顯的改善，辨識度從原先低於80％，進而提升到了87%～88%，甚至比原本百萬張人臉訓練出來的模型還提高了近1成的辨識率，這也才僅花了數千張亞洲人臉當作訓練樣本。汪世昌指出，這次學到的教訓，也讓他們決定要建立臺灣自己的人臉資料庫。

因為一開始蒐集的一百萬張人臉資料，絕大多數都是外國面孔，這正是造成訓練出來的模型辨識亞洲人會不準的原因，他解釋，因為這些西方人臉五官通常較為立體，相較之下，東方人臉輪廓較為扁平，因此，以這些臉部資料訓練開發出來的人臉辨識引擎，辨識出來的結果，就容易會有差異。

但是，想要讓人臉辨識在臺灣落地且能夠廣泛應用，就不能只會認正臉，就連側臉，或甚至不同臉部角度也都要能正確識別。因此，為了解決這個難題，他表示，才要增加訓練用的臺灣或東方人的臉孔，要讓自家人臉辨識引擎，不再只認得外國臉，也能認臺灣臉。

汪世昌也強調:「臺灣要發展人臉辨識，只有用自己在地人臉資料下去訓練，才能發展出符合臺灣在地化的人臉應用。」尤其是，未來只要是需要身分驗證的場所，都會是人臉辨識的應用範疇，但辨識過程中需要人臉特徵值做分析且涉及到個資隱私，需要高度資安保護，透過自行開發掌握關鍵技術，才能夠確保資安與個資保護。

年初院內已導入刷臉技術，委外員工出勤打卡先用

年初時，中華電信研究院也使用這套在地人臉辨識引擎，來開始管理總公司內部數百名委外清潔員工的上班出勤，現在每位人員上下班，都會先通過一臺刷臉打卡機來進行簽到或是刷退，以取代傳統上下班打卡。

這臺人臉打卡機就放置在門口警衛室旁出入走道，只要按下簽到鍵，以正臉面向鏡頭就會回傳照片到後端註冊人臉資料庫比對，大約2秒就能回傳辨識結果，一旦確定是本人，就會在螢幕上顯示姓名、完成簽到時間。

除了自己內部使用外，中華電信今年5月也推出商用服務，目前已有臺灣高科技業、建築業與政府部門採用，做為門禁、差勤管理的使用，另外也有花蓮大型購物中心，用於分析來客人流或VIP顧客識別等應用。

熱門新聞