臉書AI影像辨識技術Lumos，不需標籤就能快速辨識搜尋人物及動作

Lumos可辨識一系列相似影像中人們騎乘在馬上各種行為。

圖片來源:

Facebook

臉書（Facebook）周四在Machine Learning@Scale大會上公佈其人工智慧影像辨識技術Lumos的開發進度，不需標籤就能辨識圖片中的人物或物件，還可以辨識跑步、舞蹈等十多項動作。

相較於其他大廠不斷公佈自己在人工智慧（AI）上的進展，臉書則是悄悄開發了AI平台FBLearner Flow。從一開始AI Research部門的小專案到可以大規模執行，FBLearner Flow現在已是臉書電腦視覺團隊的主要引擎，每個月進行120萬次AI實驗。

Lumos是在FBLearner Flow上發展而成的圖片及影片辨識技術，臉書擁有數十億張照片，就成了訓練Lumos的現成資源。臉書現在十多個團隊已經在Lumos上建立超過200個視覺模型，可用於各種不良內容偵測、打擊垃圾郵件以及自動為圖片加圖說等用途。

去年起臉書將Lumos用於改善自動文字替代（automatic alt text, AAT），為視障人士描述圖片內容。臉書應用機器學習部門總監Joaquin Quiñonero Candela指出，經過一年多的演進Lumos不但可以為圖片加上圖說，還可以辨識出圖片中12種行為，包括圖片中人走動、跳舞、騎馬、彈奏樂器等。

他表示，現在可作為其他便利用途，像是加快搜尋，例如臉書昨日宣佈已開發完成結合Lumos的新圖像搜尋系統。臉書使用物件辨識和圖像嵌入（images embeddings）訊號來強化圖片搜尋的排序與精準度，以確保搜尋系統真正理解圖片的實際內容

運用最新的自動圖片分類器（classifier）技術，未來使用者想不起某張相片拍攝者或拍攝時間時，輸入「黑色T恤」，就能從他自己或親友分享的照片中快速而輕鬆找到最相關的圖片，而不再需依賴標籤或圖說文字。臉書表示，下一步是將Lumos的電腦視覺能力運用到影片中。

熱門新聞