Google已經將人工智慧用於語音辨識和圖像辨識上,周三再宣佈將在網頁與行動版Google Translate使用最新神經機器翻譯(Google neural machine translation, GNMT)系統,並用於中文翻英文的工作。
Google Brain團隊研究員Quoc Le及Mike Schuster指出,Google Translate自10年前推出以來,使用的是以字詞為基礎的機器翻譯方式,數年前,Google開始運用遞歸神經網路(Recurrent Neural Networks,RNN)來學習在不同語言翻譯中,輸入與翻譯輸出句子的比對。相較於傳統字詞為基礎的機器方式是將句子切成字和詞再獨立翻譯,但運用神經網路的翻譯則是將整個輸入句視為一個單元。一開始兩者的翻譯精準度並沒有相差太多,但經過改進,神經網路翻譯開始超越舊式技術。
以一個中文語句翻譯成英文為例,新系統將一個中文句編碼為一組向量(vectors),每個向量都表示句子讀到目前的意義。在讀完整個中文句子才開始翻譯的解碼過程,每讀一次逐步產生一個英文字,直到產出完整句子。而在產出英文字時,系統會注意特定字詞在中文句中的權重。
以中文新聞的翻譯為例(下圖),可看出傳統以字詞為基礎的機器翻譯技術(PBMT)、Google神經機器翻譯(GNMT)及人工翻譯的差異。
目前GNMT還是會犯許多人類不會犯的錯,像是漏字或特定與罕見字詞翻錯,以及翻譯未考量前後文,但是已經有長足進步,例如以維基百科及數家新聞網站上抓取的句子進行的數種主要語言的翻譯測試中,已經讓錯誤率較原有翻譯降低55-85%。
而在配合Google早先公佈的機器學習工具組TensorFlow及Tensor處理單元(TPU)下,Google決定將GNMT用於Google Translate網頁及Web版所有中翻英的工作。目前,Google Translate App一天大約可完成1800萬次翻譯。Google表示,未來幾個月還會將新系統用於其他語言的翻譯上。
Google積極運用人工智慧技術於多項服務,包括Inbox by Gmail及近日公佈的Google Allo 助理等。
熱門新聞
2024-12-03
2024-12-02
2024-11-29
2024-12-02
2024-11-30