OpenAI周一(4/14)釋出了GPT-4.1、GPT-4.1 mini與GPT-4.1 nano,宣稱它們的性能全面勝過現有的GPT-4o及GPT-4o mini,所支援的脈絡長達100萬個Token,知識截止時間為2024年6月。不過,GPT-4.1將僅透過API供應,ChatGPT則由持續改善的GPT-4o負責,至於原本規畫中的GPT-4.5,現在OpenAI則說它只是個預覽版,GPT-4.1擁有許多類似或超越的表現,因此準備在今年的7月14日關閉GPT-4.5。

GPT-4.1、GPT-4.1 mini與GPT-4.1 nano等3個不同等級的型號,都支援100萬Token的脈絡長度,其中的GPT-4.1能力最強,適合複雜任務,每輸入/輸出百萬個Token的售價各為2美元及8美元,適用於企業級代理人、高精度AI助理,以及科學研究;GPT-4.1 mini屬於中階模型,每輸入/輸出百萬個Token的售價各為0.4及1.6美元,適用於中大型應用、快速建置原型及自動客服系統等;GPT-4.1 nano每輸入/輸出百萬個Token的售價各為0.1與0.4美元,適合邏輯明確及結構化的簡單任務,像是分類或摘要等,可應用於手機或邊緣運算,執行速度也最快。

OpenAI比較了GPT-4o、GPT-4.5、GPT-4.1在許多基準測試上的表現,例如GPT-4.1在用來修復開放原始碼臭蟲的SWE-bench Verified測試中,取得了54.6%的成績,分別比GPT-4o及GPT-4.5高了21.4個百分點與26.6個百分點。或者是在評估指令遵循能力的Scale's MultiChallenge⁠評測上,GPT-4.1也有38.3%的成績,比GPT-4o多了10.5個百分點。在理解影片的Video-MME⁠測試中,GPT-4.1在長篇且無字幕的類別中取得了72%的成績,比GPT-4o多出6.7個百分點。

此外,GPT-4.1及GPT-4.1 mini的延遲度,也低於GPT-4o與GPT-4o mini。

GPT-4.1可處理多達100萬個Token的脈絡,遠高於GPT-4o的12.8萬個,OpenAI認為這使得GPT-4.1非常適合處理大型的程式碼庫或者是大量的長文件。

至於原本準備上架,卻突然宣布腰斬的GPT-4.5,OpenAI則解釋,GPT-4.5是個研究預覽版本,目的是為了探索與試驗一個大型且運算密集的模型,已從開發人員的回饋中學到許多,準備在未來的模型中嵌入GPT-4.5各種受到讚賞的特質,例如創造力、寫作品質與幽默感等。

熱門新聞

Advertisement