Amazon Alexa正在開發可模擬已逝人士講話的技術

在本周開發者大會re:Mars上，Alexa資深副總裁暨首席科學家Rohit Prasad展示Alexa開發中的技術，號稱可以在聽取不到1分鐘的聲音錄音後，模仿出任何「高品質」的聲音，而不必再像以前花大量時間來後製。

本周在拉斯維加斯舉行的開發者大會re:Mars上，Amazon高層透露AI語音助理技術Alexa的研發進度，包括可模擬任何人的聲音，例如用已過世祖母的聲音為小男孩講床邊故事。

在實體開發者大會的開幕演說上，Alexa資深副總裁暨首席科學家Rohit Prasad展示Alexa的最新開發成果。他展示的一則影片中，一名小男孩在床邊故事時間對Amazon Echo智慧喇叭中的Alexa問能不能讓祖母為他講完《綠野仙蹤》（The Wizard of Oz）。影片中，Alexa即以這位已在天上的祖母聲音，開始講故事。

Prasad指出，這是Alexa開發中的技術，號稱可以在聽取不到1分鐘的聲音錄音後，模仿出任何「高品質」的聲音，而不必再像以前花大量時間來後製。他說過去二年許多人的親人在疫情中離世，Amazon這項技術旨在保留對親人的回憶。

Prasad說Alexa的祕訣在於把它當成語音轉換，而非語音合成的任務來解決。Amazon並未進一步提供細節，也不願說明這項技術何時會問世。

Amazon同時還展示可清楚與訂餐廳的消費者互動的AI助理。

在AWS的部落格文章中，Prasad說明在Re:Mars大會上展示的可概括化AI（Generalizable Intelligence，GI），這類AI並非全知全能，而是更實用的AI技術，具有3種特點，包括能完成多種任務、能快速適應多變環境，以及利用很少的人力輸入即可學習新概念和行為，基本上就是人類學習新事物和生存的方法。

雖然能讓已逝的親人的聲音或影像再現對親屬很有意義，但媒體指出，這類過於擬真的AI技術可能將遭致倫理規範的嚴格檢視。

微軟昨日公布更新版負責任AI的指導準則。除了限制臉部辨識API的存取及適用情境，微軟也將模擬人聲的Azure AI自訂神經網路語音（Custom Neural Voice）服務加入控管框架，限制可以使用的客戶、明確定義可使用情境，並且清楚告知聽者，以避免欺騙與之對話的人類。

熱門新聞