根據OpenAI提供的數據,在程式競賽測試(Codeforces)測試中,o3-mini-high表現高過前代模型。(圖片來源/OpenAI)

繼兩周前執行長Sam Altman預告,OpenAI上周宣布具推理能力的小型AI模型OpenAI o3-mini,已部署到ChatGPT及API供付費方案用戶及開發人員使用。

OpenAI是於去年12月新消息12連發中,公布最新一代具推理能力的旗艦模型o3,並預告o3-mini將是最先推出的同系列模型。

OpenAI指出,o3-mini保有OpenAI o1-mini的低成本及低延遲性,但進一步拓展小模型的效能及速度,具備優異的STEM(科學、數學和程式撰寫)能力。o1仍是OpenAI最主要的通用知識推理模型,但是在需要精準和速度的STEM領域o3-mini提供另類選擇。在ChatGPT中,o3-mini使用中等推理能力,兼顧速度和答案的精準性。

對開發人員而言,o3 mini也是OpenAI第一個提供高呼聲開發功能的小型模型,像是函式呼叫、結構式輸入及開發人員訊息等。和o1-mini相同,o3-mini也支援串流。開發人員有低、中、高三種推理能力,可以選擇用於不同使用場景。這種彈性讓o3-mini可以在解決複雜任務時更積極思考,或是在考量延遲性時優化速度。

根據OpenAI提供的數據,在AIME 2024數學標竿測試中,o3-mini-high推理能力等級模型得分在87.3,優於o1-preview的56.7及o1-mini的63.6。科學解題的GPQA Diamond測試中,o3-mini-high(79.7)也高於o1-preview(78.3)及o1-mini(60.0)。程式競賽測試(Codeforces)及軟體工程(SWE-bench Verified)測試中,o3-mini-high也都高過另二個前代模型。

圖片來源/OpenAI

o3-mini現在也能整合搜尋功能,可提供即時網頁答案及連結。OpenAI說致力於將搜尋整合至所有推理模型,o3-mini是早期原型。

不過目前o3並不支援視覺功能,需要的用戶還是得繼續使用o1-mini。

o3-mini現在已部署到ChatGPT及API。API部分,即日起o3-mini已經部署到API使用層級3到5特定開發人員的Chat Completions API、Assistants API及Batch API。

在ChatGPT部分,Plus、Team和Pro用戶現在就可以存取o3-mini,企業方案用戶2月可以開始使用。在模型選擇器中的o1-mini將由o3-mini取代,提供更高速限和更低延遲性。Plus和Team用戶每天互動訊息,由o1-mini的50則提高為o3-mini的150則。所有付費用戶都可以在模型選擇器,選擇回應時間耗時較久的o3-mini-high,Pro用戶則可以無上限選擇o3-mini及o3-mini-high。

免費方案用戶也可以試用o3-mini,方法是選擇訊息輸入列的「Reason」圖示。o3也是第一個提供給免費ChatGPT用戶的推理模型。

OpenAI指出,由於持續提升模型數理推理能力,和GPT-4相比,現在OpenAI的模型每字詞使用價格已降低95%,未來該公司會持續朝此發展。

OpenAI此舉顯然部分是回應橫空出世的中國新興開源模型DeepSeek。DeepSeek V3模型多項效能測試超越Meta Llama,令美國AI科技公司繃緊神經,加快研發及推出作業。

熱門新聞

Advertisement