圖片來源: 

微軟

微軟在其翻譯服務Translator中,又加入12種新語言和方言,包括巴什基爾語、迪維希語、藏語、土庫曼語、維吾爾語和烏茲別克語等,當前全球總共有8,460萬人使用這些語言。微軟提到,在加入12種語言之後,Translator已經可以支援100種語言,語言覆蓋人數達到56.6億人。

由於主流語言資源多,因此翻譯服務要提供像是英語、華語、印地語、阿拉伯語和西班牙語,相對簡單許多,而近年來由於技術的進步,人工智慧技術也逐漸可以對資源匱乏或是瀕臨滅絕的語言,提供翻譯服務。

微軟的機器翻譯服務,使用一種稱為Z-code的多語言人工智慧模型,該模型能夠結合同一家族語言,像是印地語、馬拉地語和古吉拉特語等印度語,透過讓各個語言模型相互學習,降低達到高品質翻譯所需要的資料量。微軟舉例,當翻譯模型使用相關的法語、葡萄牙語、西班牙語和義大利語資料一起訓練,羅馬尼亞語的翻譯品質會得到提升。

微軟提到,藉由共通性和遷移學習,能同時改進整個語言家族的翻譯品質,而且減少資料需求,對資源有限或是母語人口減少,而瀕臨滅絕的語言,得以建立語言模型。


熱門新聞

Advertisement