圖片來源: 

OpenAI

OpenAI昨(30)日宣布可提供即時擬真AI語音的Realtime API降價,部份服務降價最高80%,並新增5種聲音選擇。

10月初公布預覽版的Realtime API提供原生語音輸入、語音輸出的人聲生成,中間無需文字轉換,讓開發人員得以打造支援多模態能力的AI聊天機器人。目前支援文字、語音的輸出、輸入,也支援函式呼叫。Realtime API可讓開發商創造的AI聊天機器人和使用者流暢對答有如真人。OpenAI Realtime原有5種人聲,今天再增加5種新選擇,強調提供AI助理更豐富表現力。

本周OpenAI還進一步降價Realtime API中快取文字輸入(cached text input)費用50%,快取聲音輸入(cached audio input)更降價80%。快取輸入是Realtime API的一部份,可將提示中重覆使用輸入的字詞快取起來,可加速對談過程中的提示處理速度、降低延遲性,而且節省API使用成本,不過只有輸入1024字詞以上的提示才適用快取。

根據OpenAI的訂價,使用快取的Realtime API費用是未快取的50%,詳細價格則依存取的模型版本而異,降價前的價格從GPT-4o-mini的$0.075/百萬字詞,到o1-preview的$7.50/百萬字詞。

熱門新聞

Advertisement