Google宣布在BigQuery中預覽Vertex AI語音轉文字模型,這項新功能可讓用戶更簡單地轉錄語音檔案,並將其與其他結構化資料結合,合併分析並建置創新人工智慧用例。這項功能更新使得用戶得以透過SQL根據資料微調轉錄模型,在BigQuery中執行語音轉文字工作。

過去Google雲端用戶要轉錄語音資料,需要自己建立獨立的人工智慧工作管線,這些工作管線並沒有與BigQuery直接整合,客戶需要編寫自定義基礎設施,再將轉錄的資料傳輸到BigQuery進行分析。而新的Google的語音轉文字V2 API提供多功能轉錄服務,用戶可以針對不同類型的語音音訊,像是客服通話或醫療錄音,選擇合適的專門模型。此外,模型也可以根據用戶的資料進行調整,以提高轉錄準確性。

在BigQuery中,用戶可以創建物件表格,這些表格和Cloud Storage中的語音檔案相關聯,如此便能夠提供高精細度的存取控制,允許管理員設定列級的存取政策強化資料安全。當要進行轉錄時,用戶需要在BigQuery中註冊現成或是經微調的轉錄模型,並使用SQL透過物件表格呼叫啟用,轉錄結果會以BigQuery表格的文字欄位回傳。

當語音轉換成為文字之後,用戶有三種方式可以對文字資料進行分析,第一是使用BigQuery ML進行自然語言處理,像是辨識客戶支援通話中的情緒或是產品回饋分類,第二種則是將轉錄的後設資料和儲存在BigQuery表格中的其他結構資料進行整合分析,例如辨識出在通話中表現出負面情緒,但是高終身價值的客戶,或是從客戶回饋中篩選出最受歡迎的產品特性,第三種則是從BigQuery呼叫語言模型PaLM API,執行摘要、分類,以及針對轉錄的文字進行問答等操作。

熱門新聞

Advertisement