AWS更新其通訊服務Amazon Chime的軟體開發工具包,加入即時語音通話分析功能,可執行包括語音轉錄、情感分析和說話者搜尋任務,而且開發者只要操作管理控制臺,就能夠在音訊應用程式簡單地整合這些機器學習功能。

Amazon Chime SDK新提供的語音通話分析功能,分別為情感分析和說話者搜尋。情感分析可以判斷說話者的語氣,像是積極、中立或是消極態度。該情感分析技術應用機器學習,對詞彙、語言資訊,諸如字詞選擇和語法結構,以及聲學和語調上的資訊,像是音高、音量和語速進行綜合分析,以進一步判斷語音中的情感。

除了情感分析之外,用戶還可以使用Amazon Chime SDK開發說話者搜尋應用,透過在現有語音資料庫比對說話者語音特徵,找出包含說話者的通話記錄和轉錄文字。說話者搜尋僅需要一個簡短的語音樣本,系統便可以迅速找出相關的音訊紀錄,這項功能的應用除了可以查詢特定說話者的相關資料外,也能夠應用在即時通訊中,替不同的說話者添加標記。

用戶在AWS管理控制臺就能簡單整合這些功能,不需要編寫任何整合程式碼,只要選擇轉錄或是語音分析等服務,AWS系統便會自動處理人工智慧服務與應用程式的整合,用戶在控制臺中可以定義分析資料發送的位置,同時語音分析也可以向Lambda函式和SNS等服務發送即時通知。

用戶可以使用Amazon QuickSight或Tableau建構儀表板,以獲取即時的語音分析結果,而語音分析也可以透過事件,發布到Amazon EventBridge生成即時警示,將這些事件路由到用戶選擇的目標。音訊分析功能的付費方式,根據用戶使用情況收費,收費基礎為每分鐘所分析的資料,目前用戶已經可以在AWS美東、美西和歐洲地區使用到該新功能。

熱門新聞

Advertisement