OpenAI周二(8/20)發表了新一代大型語言模型(LLM)GPT-4o的微調服務,透過該服務,開發人員將能以客製化的資料集來調整GPT-4o,以取得更適合特定應用的成果。

今年5月上線的GPT-4o為GPT-4 Omni的簡寫,是OpenAI最新的旗艦版模型,它是個多模態LLM,可接受文字、音訊、圖像及影片之任何組合的輸入,並輸出任何組合的文字、音訊與圖像。它不管是在MMLU、GPQA、MATH、HumanEval或MGSM等基準測試上都勝過GPT-4-Turbo,但在閱讀理解與推論能力的DROP測試上則明顯落後。

OpenAI表示,微調服務將讓模型得以客製化回應的結構及語氣,或者是遵循特定領域的複雜指令,從撰寫程式碼到創意寫作,微調將替不同領域的模型性能帶來重大影響,且OpenAI未來也將繼續投資以擴充模型的客製化選項。

所有付費的開發者都可使用GPT-4o的微調服務,每100萬個Token的微調訓練成本為25美元,在推論上,每100萬個Token的輸入成本為3.75美元,100萬個輸出Token為15美元。

其實OpenAI不僅開放GPT-4o的微調服務,也開放GPT-4o mini的微調服務,兩者在9月23日以前,將分別免費提供每日100萬個及200萬個訓練Token。

致力於讓AI精確模仿人類執行任務的Cosine,即利用GPT-4o模型來微調旗下的AI軟體工程助理Genie,根據真實軟體工程師的工作案例進行訓練,讓模型能以特定方式作出回應,或是輸出特定格式,像是可直接提交到程式碼庫的修補程式。

而AI解決方案供應商Distyl在微調GPT-4o之後,在評估從自然語言查詢轉換至SQL查詢的BIRD-SQL基準測試中,準確率達到71.83%,雖然仍遠不及人類的92.96%,但高於RECAP+Gemini的69.03%、ByteBrain的68.87%,以及IBM ExSL+granite-20b-code的67.86%,在AI排行榜上一度名列第一。

此外,OpenAI也持續強調客戶的隱私權,指出微調模型完全由用戶所控制,包括所有的輸入與輸出,以確保用戶資料不會被共享或用來訓練其它模型。

熱門新聞

Advertisement