背景圖片來源/Maxim Berg on unsplash

OpenAI周四(1/25)再度更新旗下產品,包括更新GPT-3.5 Turbo模型,GPT-4 Turbo預覽模型,更新文字審核模型,還推出了兩個新的文字嵌入式模型text-embedding-3-small與text-embedding-3-large。另也宣布調降GPT-3.5 Turbo模型價格,每1,000個輸入標記(Token)為0.0005美元,降幅達50%,每1,000個輸出標記為0.0015美元,降幅為25%。

嵌入式模型(Embedding Models)是機器學習與AI系統用來效法人類了解複雜知識的方式,它將真實世界的物件轉為複雜的數學表示法,擷取真實世界的固有屬性與關係,於低維度空間表達高維度資料,令演算法的執行更有效率。

text-embedding-3-small的前輩為2022年12月推出的text-embedding-ada-002,相較於text-embedding-ada-002,text-embedding-3-small的多語言檢索(MIRACL)評測從31.4%提高至44%,常用的英文任務評測(MTEB)則從61%增加至62.3%。

此外,text-embedding-3-small的價格也遠低於text-embedding-ada-002,其每1,000個標記的費用只要0.00002美元,是text-embedding-ada-002的1/5。

OpenAI表示,雖然推出了新的text-embedding-3-small,也推薦用戶使用新的文字嵌入式模型,但並不會棄用舊版的text-embedding-ada-002,亦歡迎用戶繼續使用。

至於text-embedding-3-large則是OpenAI下一代的大型嵌入式模型,最多可建立3,072個維度的嵌入向量,相較於text-embedding-3-small與text-embedding-ada-002,其MIRACL的平均分數為54.9%,MTEB則是64.6%。text-embedding-3-large每1,000個標記的費用為0.00013美元。

OpenAI說明,訓練這兩個嵌入式模型所使用的特殊技術,允許開發者在嵌入時權衡效能與成本,依照實際需求並藉由維度API參數來控制嵌入的大小,在不損及重要概念的前提下,減少嵌入成本。

除了新的模型之外,OpenAI即將於下周推出新的GPT-3.5 Turbo模型gpt-3.5-turbo-0125,該模型提高了準確度,也修復了以非英語函數呼叫所造成的文字編碼錯誤問題。此外,GPT-3.5 Turbo的輸入價格調降了50%,輸出亦調降25%,距離上次OpenAI調降該模型價格還不到3個月。

更新的GPT-4 Turbo預覽版可更徹底完成程式碼生成任務,也減少了該模型有時會落下任務的懶惰狀況,並修復非英語UTF-8生成的錯誤。

審核API(Moderation API)是OpenAI為了讓開發者可辨識有害文字而開發的免費工具,不管是text-moderation-latest或text-moderation-stable都會採用最新的text-moderation-007版本。

熱門新聞

Advertisement