OpenAI推出GPT-4o微調服務

OpenAI周二（8/20）發表了新一代大型語言模型（LLM）GPT-4o的微調服務，透過該服務，開發人員將能以客製化的資料集來調整GPT-4o，以取得更適合特定應用的成果。

今年5月上線的GPT-4o為GPT-4 Omni的簡寫，是OpenAI最新的旗艦版模型，它是個多模態LLM，可接受文字、音訊、圖像及影片之任何組合的輸入，並輸出任何組合的文字、音訊與圖像。它不管是在MMLU、GPQA、MATH、HumanEval或MGSM等基準測試上都勝過GPT-4-Turbo，但在閱讀理解與推論能力的DROP測試上則明顯落後。

OpenAI表示，微調服務將讓模型得以客製化回應的結構及語氣，或者是遵循特定領域的複雜指令，從撰寫程式碼到創意寫作，微調將替不同領域的模型性能帶來重大影響，且OpenAI未來也將繼續投資以擴充模型的客製化選項。

所有付費的開發者都可使用GPT-4o的微調服務，每100萬個Token的微調訓練成本為25美元，在推論上，每100萬個Token的輸入成本為3.75美元，100萬個輸出Token為15美元。

其實OpenAI不僅開放GPT-4o的微調服務，也開放GPT-4o mini的微調服務，兩者在9月23日以前，將分別免費提供每日100萬個及200萬個訓練Token。

致力於讓AI精確模仿人類執行任務的Cosine，即利用GPT-4o模型來微調旗下的AI軟體工程助理Genie，根據真實軟體工程師的工作案例進行訓練，讓模型能以特定方式作出回應，或是輸出特定格式，像是可直接提交到程式碼庫的修補程式。

而AI解決方案供應商Distyl在微調GPT-4o之後，在評估從自然語言查詢轉換至SQL查詢的BIRD-SQL基準測試中，準確率達到71.83%，雖然仍遠不及人類的92.96%，但高於RECAP+Gemini的69.03%、ByteBrain的68.87%，以及IBM ExSL+granite-20b-code的67.86%，在AI排行榜上一度名列第一。

此外，OpenAI也持續強調客戶的隱私權，指出微調模型完全由用戶所控制，包括所有的輸入與輸出，以確保用戶資料不會被共享或用來訓練其它模型。

熱門新聞