在Google發表可以流暢與用戶對話的Gemini Live同一天,OpenAI也正式公告,ChatGPT升級使用多模態模型GPT-4o。

上周媒體就已發現OpenAI悄悄發布了新版GPT-4o模型的更新版本,強調整體效能更快,前端回應表現也更好。模型更新版本名為GPT-4o-2024-08-06,主要提供給付費用戶,涵括以ChatGPT提示介面或API存取二種管道。有人覺得連免費的ChatGPT都更強大了。

多模態模型允許用戶上傳程式碼、圖片或聲音檔作為輸入提示,ChatGPT也可以根據提示生成圖片。ChatGPT本來就以DALL-E-3模型為基礎生成圖片。ChatGPT升級到GPT-4o的意義在於,由於模型原生支援多模態資料,理應可以更快輸出回應,且生成品質也更好。

但由於OpenAI沒有提供詳細說明,因此新模型提供了什麼改進或不同功能,或是ChatGPT免費版是否也使用新版本模型,都沒有獲得官方證實。有用戶覺得ChatGPT理解能力更好了,不過也有用戶認為雖然改用了新模型,但輸入的圖片品質似乎沒什麼不同。

目前可以確定的是,以提示介面和API存取的是不同版本GPT-4o。OpenAI對VentureBeat說明,提供給API存取的是更為開發人員優化的功能。例如在Azure平臺提供的GPT-4o版本簡化模型結構化輸出(structured output)的過程,允許開發人員指明希望從AI模型直接輸出的格式,產生的資料可無縫整合到其他系統,有助於提升開發生產力。

熱門新聞

Advertisement