OpenAI接連推出新服務,本周再公布二項新服務,分別是GPT-4o 64K長輸出模型以及可以逼真人聲對話的ChatGPT進階語音模式(Voice Mode)功能。
本周稍早OpenAI推出實驗性版本的GPT-4o長輸出(long output)模型。這個模型下,每次提示最多可輸出64K token的回應,讓開發人員可以實驗具有更長completion(即ChatGPT提供完整的回答)的新應用場景。64K token是5月上線的GPT-4o最大輸出詞元(4K token)的16倍。
GPT-4o長輸出模型目前以Alpha測試開放使用,模型名稱為gpt-4o-64k-output-alpha。雖然是測試版,但OpenAI表示,就推論觀點而言,更長completion意謂更高成本,因此輸入費用為6.00美元/100萬token,輸出費用為18美元/100萬token。
至於如何加入試用,根據OpenAI討論區一名用戶的說法,開發人員可以透過API發送https://api.openai.com/v1/models/gpt-4o-64k-output-alpha呼叫,如果有回傳結果,表示用戶有權加入測試。
第二項服務則是能以逼真人聲和用戶對話的ChatGPT進階語音模式(Voice Mode),向一小部分用戶開放。OpenAI說明進階語音模式比5月向世人展示時,能執行更即時、更自然的互動,允許用戶打岔,還能感受並回應用戶情緒。
5月OpenAI公布以多模態模型GPT4o為基礎的GPT 4.0時,展示令人驚豔的對話能力。GPT 4.0語音模式設計上可提供5種聲音,預定6月底上線,但其中一個名為Sky的聲音卻被爆出和美國女演員Scarlett Johansson極為相似,她本人也發聲抗議OpenAI未經過其同意使用其聲音。OpenAI雖然否認用了Johansson的聲音,但隨後仍然移除Sky,並延後一個月推出語音模式。該公司聲稱是為了「強化模型偵測和拒絕某些內容的能力」。
ChatGPT進階語音模式最新上線的聲音是除了Sky以外的4種。OpenAI表示,這些預設聲音是以聲優的聲音為基礎製成,並且讓ChatGPT無法冒充他人,包括個人或公眾人物的聲音,也會禁止這些預設聲音以外的聲音輸入。
長輸出模型及進階語音模式是繼GPT-4o mini模型及相關微調工具後,OpenAI推出GPT-4o的最新服務。
這波開放中,OpenAI僅允許特定用戶透過Alpha測試計畫使用ChatGPT進階語音模式,該公司計畫在未來幾周內逐步開放給更多付費Plus方案用戶,而在秋天開放所有Plus方案用戶使用。
熱門新聞
2024-11-18
2024-11-20
2024-11-12
2024-11-15
2024-11-15
2024-11-19