去年5月Google展示人工智慧(AI)影像辨識技術Google Lens,周三Google表示,經過一年半的進展,現在Google Lens已經能辨識超過10億個物件。

Google Lens是以AI和電腦視覺為基礎的影像文字辨識技術,讓用戶可以手機拍攝食譜後,將其食材加入購物清單,或拍攝名片後加入聯絡人名單。為了訓練Google Lens,開發小組打造了自家光學字元辨識(OCR)引擎,再結合經由Google 搜尋和知識圖譜(Knowledge Graph)累積對語言的知識,再以Google Books掃瞄而來的不同字元、語言、字體、及圖畫來訓練機器學習演算法。

碰到很難辨認數字0或英文字母O,這時Google Lens會運用Google 搜尋的語言和拼字矯正模型來判斷,一如Google可以將bannana修正為banana,因此Google Lens看得懂c00kie可能意思是cookie。

Google表示,現在他們利用自家OCR引擎做其他用途,像是讀取產品標籤,現在Lens已經能辨識超過10億種產品,是一年半推出時的4倍。

除了讀取圖像中的文字外,在美國地區 Google Lens還增加圖像商品速搜並整合圖片搜尋功能,使用者只要用手機對著衣服、立燈或其他家飾物品,Google Lens還顯示類似的商品,並提供商品的比價和評比等資訊。

熱門新聞

Advertisement