開源照片管理工具digiKam發布了最新7.0的測試版,這個版本主要的更新是換掉舊有的臉部辨識技術,改採用深度學習演算法,以強化臉部辨識的功能,過去要6張臉照才能開始進行人臉辨識,但現在只要1張。

digiKam早從第二版開始,就提供了臉部偵測與辨識的功能,但因爲後臺使用的演算法較舊,無法有效支援自動化人臉管理工作流程。過去使用的方法是OpenCV函式庫中,基於特徵的級聯分類器(Cascade Classifier),用來隔離或是標記人臉。

這種舊方法無法提供高水準的偵測結果,雖然分析時可以獲得約80%的良好結果,但是用戶需要提供大量回饋,以協助程式確認是否偵測到人臉,且根據使用者在臭蟲管理系統上的反應,舊的人臉辨識功能無法良好地自動識別人臉並進行標記。

而其實早在2017年,社群就打算在digiKam的人臉辨識中使用深度學習技術,但是當時使用的是Dlib函式庫,其神經網路的表現不佳,因為計算速度慢,所以也只能當作概念的技術驗證,無法真正的應用在生產環境中。而在今年,這項計畫又被重新開啟,保留了部分想法,但是在偵測和辨識引擎上,則使用了更新的深度學習方法。

新的實作是基於OpenCV函式庫中的深度神經網路功能,將預學習資料模型用於臉部管理上,不需要學習階段就可以進行臉部偵測與辨識,整體執行速度更快且正確率達到97%,而且還能用於偵測非人像是狗的臉。新的神經網路模型的效能很好,可以偵測模糊、遮蔽、側面以及只有一部分的臉部。

而在臉部辨識方面,新的實作只需要一張照片就可以開始執行,這比起過去的實驗性功能,需要6張照片臉部辨識功能才可開始運作,效率明顯高出不少,當然,標記越多臉孔,臉部辨識功能的精確度就越好,現在的精確度可達95%,而過去的實作運算速度慢,且精確度一直無法突破75%。運算效能也獲得大幅度的改進,由於新實作支援多核心運算,因此可以加快計算速度。

由於新的實作允許使用其他預學習資料模型,因此官方預告,他們還會將偵測與辨識功能,擴展應用到諸如紀念碑、植物與動物等不同類型的物體上。目前測試階段發現了一些記憶體洩漏的複雜問題,開發團隊正著手解決中。

熱門新聞

Advertisement