OpenAI具推理能力的模型o3-mini正式推出

根據OpenAI提供的數據，在程式競賽測試（Codeforces）測試中，o3-mini-high表現高過前代模型。（圖片來源／OpenAI）

繼兩周前執行長Sam Altman預告，OpenAI上周宣布具推理能力的小型AI模型OpenAI o3-mini，已部署到ChatGPT及API供付費方案用戶及開發人員使用。

OpenAI是於去年12月新消息12連發中，公布最新一代具推理能力的旗艦模型o3，並預告o3-mini將是最先推出的同系列模型。

OpenAI指出，o3-mini保有OpenAI o1-mini的低成本及低延遲性，但進一步拓展小模型的效能及速度，具備優異的STEM（科學、數學和程式撰寫）能力。o1仍是OpenAI最主要的通用知識推理模型，但是在需要精準和速度的STEM領域o3-mini提供另類選擇。在ChatGPT中，o3-mini使用中等推理能力，兼顧速度和答案的精準性。

對開發人員而言，o3 mini也是OpenAI第一個提供高呼聲開發功能的小型模型，像是函式呼叫、結構式輸入及開發人員訊息等。和o1-mini相同，o3-mini也支援串流。開發人員有低、中、高三種推理能力，可以選擇用於不同使用場景。這種彈性讓o3-mini可以在解決複雜任務時更積極思考，或是在考量延遲性時優化速度。

根據OpenAI提供的數據，在AIME 2024數學標竿測試中，o3-mini-high推理能力等級模型得分在87.3，優於o1-preview的56.7及o1-mini的63.6。科學解題的GPQA Diamond測試中，o3-mini-high（79.7）也高於o1-preview（78.3）及o1-mini（60.0）。程式競賽測試（Codeforces）及軟體工程（SWE-bench Verified）測試中，o3-mini-high也都高過另二個前代模型。

圖片來源／OpenAI

o3-mini現在也能整合搜尋功能，可提供即時網頁答案及連結。OpenAI說致力於將搜尋整合至所有推理模型，o3-mini是早期原型。

不過目前o3並不支援視覺功能，需要的用戶還是得繼續使用o1-mini。

o3-mini現在已部署到ChatGPT及API。API部分，即日起o3-mini已經部署到API使用層級3到5特定開發人員的Chat Completions API、Assistants API及Batch API。

在ChatGPT部分，Plus、Team和Pro用戶現在就可以存取o3-mini，企業方案用戶2月可以開始使用。在模型選擇器中的o1-mini將由o3-mini取代，提供更高速限和更低延遲性。Plus和Team用戶每天互動訊息，由o1-mini的50則提高為o3-mini的150則。所有付費用戶都可以在模型選擇器，選擇回應時間耗時較久的o3-mini-high，Pro用戶則可以無上限選擇o3-mini及o3-mini-high。

免費方案用戶也可以試用o3-mini，方法是選擇訊息輸入列的「Reason」圖示。o3也是第一個提供給免費ChatGPT用戶的推理模型。

OpenAI指出，由於持續提升模型數理推理能力，和GPT-4相比，現在OpenAI的模型每字詞使用價格已降低95%，未來該公司會持續朝此發展。

OpenAI此舉顯然部分是回應橫空出世的中國新興開源模型DeepSeek。DeepSeek V3模型多項效能測試超越Meta Llama，令美國AI科技公司繃緊神經，加快研發及推出作業。

熱門新聞