Google雲端語音轉文字API加入視覺化介面，降低AI模型使用障礙

Google在雲端控制臺中，替語音轉文字（Speech to Text，STT）API添加直覺地視覺化使用者介面，透過降低使用障礙，要讓開發人員更容易地應用STT API開發功能和服務。

STT API供開發人員使用Google的自動語音辨識和轉錄技術，將語音快速地轉為文字，隨著人工智慧的發展，越來越多的應用程式需要加入語音功能，而STT API便能滿足這項需求。STT API涵蓋廣泛的使用案例，包括聽寫、字幕到簡短的語音命令等。

雖然呼叫API已經大幅降低使用機器學習技術的難度，但是要使用STT也並非一項簡單的事，特別是要追求人工智慧達到高準確度，需要經過仔細測試和調整。

過去開發人員需要手動仔細試驗STT API，剛開始使用Google雲端的開發者，需要熟悉整合概念，並且建構自己的工具和腳本，閱讀文件才能理解API呼叫方法，官方提到，這些過程繁瑣又耗時，使得模型量測、改進和自定義過程困難重重。

而新發布的STT API視覺化介面，可以大幅簡化這些過程，該工具讓開發人員更容易在產品和服務整合STT API，而這次的更新，還能夠讓開發人員，使用模型適應（Model Adaptation）功能，管理並快速迭代自定義的STT模型。

模型適應允許開發人員，將需要的單詞列表和權重應用在模型上，針對專門領域用例自定義STT。由於模型適應是可重用和可組合的，因此一旦開發人員在STT雲端控制臺中看到良好的結果，就能夠部署到整個解決方案中。

目前STT雲端控制臺和模型適應API，已經可以在所有Google雲端地區和語言使用，並且供所有Google雲端用戶存取，不需對底層API使用支付額外的費用。

熱門新聞