Google在雲端控制臺中,替語音轉文字(Speech to Text,STT)API添加直覺地視覺化使用者介面,透過降低使用障礙,要讓開發人員更容易地應用STT API開發功能和服務。

STT API供開發人員使用Google的自動語音辨識和轉錄技術,將語音快速地轉為文字,隨著人工智慧的發展,越來越多的應用程式需要加入語音功能,而STT API便能滿足這項需求。STT API涵蓋廣泛的使用案例,包括聽寫、字幕到簡短的語音命令等。

雖然呼叫API已經大幅降低使用機器學習技術的難度,但是要使用STT也並非一項簡單的事,特別是要追求人工智慧達到高準確度,需要經過仔細測試和調整。

過去開發人員需要手動仔細試驗STT API,剛開始使用Google雲端的開發者,需要熟悉整合概念,並且建構自己的工具和腳本,閱讀文件才能理解API呼叫方法,官方提到,這些過程繁瑣又耗時,使得模型量測、改進和自定義過程困難重重。

而新發布的STT API視覺化介面,可以大幅簡化這些過程,該工具讓開發人員更容易在產品和服務整合STT API,而這次的更新,還能夠讓開發人員,使用模型適應(Model Adaptation)功能,管理並快速迭代自定義的STT模型。

模型適應允許開發人員,將需要的單詞列表和權重應用在模型上,針對專門領域用例自定義STT。由於模型適應是可重用和可組合的,因此一旦開發人員在STT雲端控制臺中看到良好的結果,就能夠部署到整個解決方案中。

目前STT雲端控制臺和模型適應API,已經可以在所有Google雲端地區和語言使用,並且供所有Google雲端用戶存取,不需對底層API使用支付額外的費用。


熱門新聞

Advertisement