Google Thing Translator讓使用者對準物體拍照後,會立即顯示該物體的英文名稱和另一種語言的名稱。

圖片來源: 

攝影/王若樸

Google於3月21日宣佈啟動「智慧臺灣計畫」,也在場外展示幾項AI相關的應用程式,不僅將圖像識別技術結合搜尋、翻譯功能,還能夠創作音樂,這些應用包括了Google Lens、Google Thing Translator、Giorgio Camera和A.I. Duet。

首先,要介紹的是智慧鏡頭:Google Lens。這款應用程式結合了圖像識別技術和龐大的圖像資料庫,而使用者只要透過手機拍照,Google Lens就會對該相片即時分析,並顯示相片主體的資訊。

這款應用程式除了適用於Google自家的手機,也能讓Android的使用者在Google相簿中使用。使用者對某一物體拍照後,可在Google相簿中打開相片,按下Google Lens圖標,就能對相片進行分析,能辨識的物品大致可分為名勝地標、書籍、電影海報和藝術品等,連植物和動物也行。一旦辨識出後,Google Lens還會顯示相關訊息,比如將鏡頭對準上圖的西門紅樓,就會搜尋顯示了該建築歷史。

Google也以影像辨識為基礎推出Google Thing Translator,這是一款開源的應用程式,利用人工智慧和圖像辨識技術,讓使用者對準物體拍照後,不需上傳、就能針對該相片進行即時翻譯,顯示英語及譯入語(也就是想翻譯的語言),並配合發音。目前支援的語言有10種,包括:西班牙文、英文、法文、德文、義大利文、簡體中文、日文、韓文、印度文和荷蘭文。

其中,Thing Translator結合了Google的Cloud Vision API以及Translate API。當使用者拍照後,Cloud Vision就會分析影像、偵測影像主體,將影像快速分類,比如「帆船」、「獅子」或「艾菲爾鐵塔」 。之後,再透過Translate API,將影像名稱以英文和譯入語顯示。

如果你覺得影像翻譯沒意思,那麼可以試試Giorgio Camera。這款活潑的App除了用到圖像識別技術,還結合了文字轉語音的技術;使用者對準物體拍照後,Giorgio Camera就會創作出一段押韻歌詞,搭配音樂唱Rap。這款App運用到Google的Cloud Vision API,先辨識圖像中的物體,然後再透過Mary TTS,將文字轉換成語音,變成歌曲。

除了能跟使用者互動的歌唱應用程式,另外一款跟音樂相關的應用,還有Google A.I. Duet。這是一款機器學習應用程式,連結了電腦與鋼琴,可以隨著彈奏者的曲風和速度,創作出相仿的樂曲。研究人員以TensorFlow和專門打造互動式音樂的Tone.js來開發A.I. Duet,當時就已將各種不同的旋律納入程式裡,讓A.I. Duet學習。經過一段時間後,這套應用程式建立屬於自己的音樂資料庫。

因此,當使用者彈奏鋼琴時,A.I. Duet會將彈奏者的旋律和曲風與雲端資料庫中的音樂進行對比,立即產生風格相近的音樂。如果彈奏者只彈白鍵,A.I. Duet產生的音樂就會避免黑鍵;如果彈奏者隨意彈奏,A.I. Duet也會產生隨意的旋律。重點是,如果彈奏者經常使用這套應用程式,那麼它所產生的音樂就會越貼近彈奏者。

 

熱門新聞

Advertisement