Google在台秀AI 應用，拍照就能搜尋、翻譯，還能創作音樂

Google Thing Translator讓使用者對準物體拍照後，會立即顯示該物體的英文名稱和另一種語言的名稱。

圖片來源:

攝影／王若樸

Google於3月21日宣佈啟動「智慧臺灣計畫」，也在場外展示幾項AI相關的應用程式，不僅將圖像識別技術結合搜尋、翻譯功能，還能夠創作音樂，這些應用包括了Google Lens、Google Thing Translator、Giorgio Camera和A.I. Duet。

首先，要介紹的是智慧鏡頭：Google Lens。這款應用程式結合了圖像識別技術和龐大的圖像資料庫，而使用者只要透過手機拍照，Google Lens就會對該相片即時分析，並顯示相片主體的資訊。

這款應用程式除了適用於Google自家的手機，也能讓Android的使用者在Google相簿中使用。使用者對某一物體拍照後，可在Google相簿中打開相片，按下Google Lens圖標，就能對相片進行分析，能辨識的物品大致可分為名勝地標、書籍、電影海報和藝術品等，連植物和動物也行。一旦辨識出後，Google Lens還會顯示相關訊息，比如將鏡頭對準上圖的西門紅樓，就會搜尋顯示了該建築歷史。

Google也以影像辨識為基礎推出Google Thing Translator，這是一款開源的應用程式，利用人工智慧和圖像辨識技術，讓使用者對準物體拍照後，不需上傳、就能針對該相片進行即時翻譯，顯示英語及譯入語（也就是想翻譯的語言），並配合發音。目前支援的語言有10種，包括：西班牙文、英文、法文、德文、義大利文、簡體中文、日文、韓文、印度文和荷蘭文。

其中，Thing Translator結合了Google的Cloud Vision API以及Translate API。當使用者拍照後，Cloud Vision就會分析影像、偵測影像主體，將影像快速分類，比如「帆船」、「獅子」或「艾菲爾鐵塔」。之後，再透過Translate API，將影像名稱以英文和譯入語顯示。

如果你覺得影像翻譯沒意思，那麼可以試試Giorgio Camera。這款活潑的App除了用到圖像識別技術，還結合了文字轉語音的技術；使用者對準物體拍照後，Giorgio Camera就會創作出一段押韻歌詞，搭配音樂唱Rap。這款App運用到Google的Cloud Vision API，先辨識圖像中的物體，然後再透過Mary TTS，將文字轉換成語音，變成歌曲。

除了能跟使用者互動的歌唱應用程式，另外一款跟音樂相關的應用，還有Google A.I. Duet。這是一款機器學習應用程式，連結了電腦與鋼琴，可以隨著彈奏者的曲風和速度，創作出相仿的樂曲。研究人員以TensorFlow和專門打造互動式音樂的Tone.js來開發A.I. Duet，當時就已將各種不同的旋律納入程式裡，讓A.I. Duet學習。經過一段時間後，這套應用程式建立屬於自己的音樂資料庫。

因此，當使用者彈奏鋼琴時，A.I. Duet會將彈奏者的旋律和曲風與雲端資料庫中的音樂進行對比，立即產生風格相近的音樂。如果彈奏者只彈白鍵，A.I. Duet產生的音樂就會避免黑鍵；如果彈奏者隨意彈奏，A.I. Duet也會產生隨意的旋律。重點是，如果彈奏者經常使用這套應用程式，那麼它所產生的音樂就會越貼近彈奏者。

熱門新聞