臉書(Facebook)周四在Machine Learning@Scale大會上公佈其人工智慧影像辨識技術Lumos的開發進度,不需標籤就能辨識圖片中的人物或物件,還可以辨識跑步、舞蹈等十多項動作。
相較於其他大廠不斷公佈自己在人工智慧(AI)上的進展,臉書則是悄悄開發了AI平台FBLearner Flow。從一開始AI Research部門的小專案到可以大規模執行,FBLearner Flow現在已是臉書電腦視覺團隊的主要引擎,每個月進行120萬次AI實驗。
Lumos是在FBLearner Flow上發展而成的圖片及影片辨識技術,臉書擁有數十億張照片,就成了訓練Lumos的現成資源。臉書現在十多個團隊已經在Lumos上建立超過200個視覺模型,可用於各種不良內容偵測、打擊垃圾郵件以及自動為圖片加圖說等用途。
去年起臉書將Lumos用於改善自動文字替代(automatic alt text, AAT),為視障人士描述圖片內容。臉書應用機器學習部門總監Joaquin Quiñonero Candela指出,經過一年多的演進Lumos不但可以為圖片加上圖說,還可以辨識出圖片中12種行為,包括圖片中人走動、跳舞、騎馬、彈奏樂器等。
他表示,現在可作為其他便利用途,像是加快搜尋,例如臉書昨日宣佈已開發完成結合Lumos的新圖像搜尋系統。臉書使用物件辨識和圖像嵌入(images embeddings)訊號來強化圖片搜尋的排序與精準度,以確保搜尋系統真正理解圖片的實際內容
運用最新的自動圖片分類器(classifier)技術,未來使用者想不起某張相片拍攝者或拍攝時間時, 輸入「黑色T恤」,就能從他自己或親友分享的照片中快速而輕鬆找到最相關的圖片,而不再需依賴標籤或圖說文字。臉書表示,下一步是將Lumos的電腦視覺能力運用到影片中。
熱門新聞
2024-12-24
2024-12-22
2024-08-14
2024-12-20
2024-11-29