圖片來源: 

OpenAI

Meta周三發布最新版大語言模型Llama 3.1,來勢洶洶,OpenAI則在宣布最新小模型GPT-4o mini不到一周後,再公布微調工具,提供免費使用特定用量2個月。

微調工具已可由API使用,一開始提供給tier 4和tier 5的用戶。OpenAI計畫會逐步推展到所有收費等級的用戶。從即日起到9月23日間,每日頭200萬字符(token)可免費使用。

可提供微調的模型包括部分已上線或實驗中的GPT-4和gpt-4o-mini。全部清單包括gpt-3.5-turbo-0125、gpt-3.5-turbo-1106、gpt-3.5-turbo-0613、babbage-002、davinci-002、gpt-4-0613(實驗中)和gpt-4o-2024-05-13,及gpt-4o-mini-2024-07-18(建議)。OpenAI相信以效能和易用性來說,gpt-4o-mini對大部分用戶而言是最適合的模型。

圖片來源/OpenAI

微調收費方式也依使用的模型而異。若使用GPT-4o mini(2024-07-18),從提示輸入的費用為每輸入100萬字符為0.3美元,每輸出100萬字符則為1.2美元。若從Batch API輸入,則分別為0.15美元和0.6美元。

OpenAI指出,使用API微調模型,可允許用戶輸入更多的訓練範例,可提升GPT-4o mini模型生成結果的品質,而且由於用戶不需使用那麼長的提示,將能節省字符(及成本),延遲性也更低。OpenAI補充,微調工具可提升「few-shot learning」的效果。

所謂「few-shot learning」,是指利用範例告訴模型要如何執行任務。OpenAI說其文字生成模型原本已經在大量文字上預訓練,但為了讓模型更好用,他們又在提示中加入指令,偶爾也有一些範例,已經使用「few-shot learning」手法,今日啟用的微調功能,允許用戶提供大於提示的範例,因而提升了這類學習方法的效果。

GPT-4o-mini上周公布後,ChatGPT免費版、Plus、Team方案用戶已經可存取GPT-4o mini,取代GPT-3.5。下周Enterprise方案用戶也可開始存取。GPT-4o mini具備128K字符的context window,一次呼叫支援最多16K輸出字符,訓練資料集已更新到2023年10月。OpenAI宣稱GPT-4o mini理解能力超越Claude Haiku、Gemini Flash,它最終會和GPT-4o一樣具備多模能力,支援文字、圖片、影音輸入/輸出功能,目前GPT-4o mini僅在API支援文字和視覺。

熱門新聞

Advertisement