Google BigQuery整合Vertex AI語音轉文字模型服務，分析語音內容更簡單

Google宣布在BigQuery中預覽Vertex AI語音轉文字模型，這項新功能可讓用戶更簡單地轉錄語音檔案，並將其與其他結構化資料結合，合併分析並建置創新人工智慧用例。這項功能更新使得用戶得以透過SQL根據資料微調轉錄模型，在BigQuery中執行語音轉文字工作。

過去Google雲端用戶要轉錄語音資料，需要自己建立獨立的人工智慧工作管線，這些工作管線並沒有與BigQuery直接整合，客戶需要編寫自定義基礎設施，再將轉錄的資料傳輸到BigQuery進行分析。而新的Google的語音轉文字V2 API提供多功能轉錄服務，用戶可以針對不同類型的語音音訊，像是客服通話或醫療錄音，選擇合適的專門模型。此外，模型也可以根據用戶的資料進行調整，以提高轉錄準確性。

在BigQuery中，用戶可以創建物件表格，這些表格和Cloud Storage中的語音檔案相關聯，如此便能夠提供高精細度的存取控制，允許管理員設定列級的存取政策強化資料安全。當要進行轉錄時，用戶需要在BigQuery中註冊現成或是經微調的轉錄模型，並使用SQL透過物件表格呼叫啟用，轉錄結果會以BigQuery表格的文字欄位回傳。

當語音轉換成為文字之後，用戶有三種方式可以對文字資料進行分析，第一是使用BigQuery ML進行自然語言處理，像是辨識客戶支援通話中的情緒或是產品回饋分類，第二種則是將轉錄的後設資料和儲存在BigQuery表格中的其他結構資料進行整合分析，例如辨識出在通話中表現出負面情緒，但是高終身價值的客戶，或是從客戶回饋中篩選出最受歡迎的產品特性，第三種則是從BigQuery呼叫語言模型PaLM API，執行摘要、分類，以及針對轉錄的文字進行問答等操作。

熱門新聞