OpenAI釋出GPT-4.1以取代GPT-4o

OpenAI周一（4/14）釋出了GPT-4.1、GPT-4.1 mini與GPT-4.1 nano，宣稱它們的性能全面勝過現有的GPT-4o及GPT-4o mini，所支援的脈絡長達100萬個Token，知識截止時間為2024年6月。不過，GPT-4.1將僅透過API供應，ChatGPT則由持續改善的GPT-4o負責，至於原本規畫中的GPT-4.5，現在OpenAI則說它只是個預覽版，GPT-4.1擁有許多類似或超越的表現，因此準備在今年的7月14日關閉GPT-4.5。

GPT-4.1、GPT-4.1 mini與GPT-4.1 nano等3個不同等級的型號，都支援100萬Token的脈絡長度，其中的GPT-4.1能力最強，適合複雜任務，每輸入/輸出百萬個Token的售價各為2美元及8美元，適用於企業級代理人、高精度AI助理，以及科學研究；GPT-4.1 mini屬於中階模型，每輸入/輸出百萬個Token的售價各為0.4及1.6美元，適用於中大型應用、快速建置原型及自動客服系統等；GPT-4.1 nano每輸入/輸出百萬個Token的售價各為0.1與0.4美元，適合邏輯明確及結構化的簡單任務，像是分類或摘要等，可應用於手機或邊緣運算，執行速度也最快。

OpenAI比較了GPT-4o、GPT-4.5、GPT-4.1在許多基準測試上的表現，例如GPT-4.1在用來修復開放原始碼臭蟲的SWE-bench Verified測試中，取得了54.6%的成績，分別比GPT-4o及GPT-4.5高了21.4個百分點與26.6個百分點。或者是在評估指令遵循能力的Scale's MultiChallenge⁠評測上，GPT-4.1也有38.3%的成績，比GPT-4o多了10.5個百分點。在理解影片的Video-MME⁠測試中，GPT-4.1在長篇且無字幕的類別中取得了72%的成績，比GPT-4o多出6.7個百分點。

此外，GPT-4.1及GPT-4.1 mini的延遲度，也低於GPT-4o與GPT-4o mini。

GPT-4.1可處理多達100萬個Token的脈絡，遠高於GPT-4o的12.8萬個，OpenAI認為這使得GPT-4.1非常適合處理大型的程式碼庫或者是大量的長文件。

至於原本準備上架，卻突然宣布腰斬的GPT-4.5，OpenAI則解釋，GPT-4.5是個研究預覽版本，目的是為了探索與試驗一個大型且運算密集的模型，已從開發人員的回饋中學到許多，準備在未來的模型中嵌入GPT-4.5各種受到讚賞的特質，例如創造力、寫作品質與幽默感等。

熱門新聞