OpenAI公布GPT-4o mini微調工具對抗最新Meta Llama 3模型，免費使用2個月

圖片來源:

OpenAI

Meta周三發布最新版大語言模型Llama 3.1，來勢洶洶，OpenAI則在宣布最新小模型GPT-4o mini不到一周後，再公布微調工具，提供免費使用特定用量2個月。

微調工具已可由API使用，一開始提供給tier 4和tier 5的用戶。OpenAI計畫會逐步推展到所有收費等級的用戶。從即日起到9月23日間，每日頭200萬字符（token）可免費使用。

可提供微調的模型包括部分已上線或實驗中的GPT-4和gpt-4o-mini。全部清單包括gpt-3.5-turbo-0125、gpt-3.5-turbo-1106、gpt-3.5-turbo-0613、babbage-002、davinci-002、gpt-4-0613（實驗中）和gpt-4o-2024-05-13，及gpt-4o-mini-2024-07-18（建議）。OpenAI相信以效能和易用性來說，gpt-4o-mini對大部分用戶而言是最適合的模型。

圖片來源／OpenAI

而微調收費方式也依使用的模型而異。若使用GPT-4o mini（2024-07-18），從提示輸入的費用為每輸入100萬字符為0.3美元，每輸出100萬字符則為1.2美元。若從Batch API輸入，則分別為0.15美元和0.6美元。

OpenAI指出，使用API微調模型，可允許用戶輸入更多的訓練範例，可提升GPT-4o mini模型生成結果的品質，而且由於用戶不需使用那麼長的提示，將能節省字符（及成本），延遲性也更低。OpenAI補充，微調工具可提升「few-shot learning」的效果。

所謂「few-shot learning」，是指利用範例告訴模型要如何執行任務。OpenAI說其文字生成模型原本已經在大量文字上預訓練，但為了讓模型更好用，他們又在提示中加入指令，偶爾也有一些範例，已經使用「few-shot learning」手法，今日啟用的微調功能，允許用戶提供大於提示的範例，因而提升了這類學習方法的效果。

GPT-4o-mini上周公布後，ChatGPT免費版、Plus、Team方案用戶已經可存取GPT-4o mini，取代GPT-3.5。下周Enterprise方案用戶也可開始存取。GPT-4o mini具備128K字符的context window，一次呼叫支援最多16K輸出字符，訓練資料集已更新到2023年10月。OpenAI宣稱GPT-4o mini理解能力超越Claude Haiku、Gemini Flash，它最終會和GPT-4o一樣具備多模能力，支援文字、圖片、影音輸入／輸出功能，目前GPT-4o mini僅在API支援文字和視覺。

熱門新聞