OpenAI推出兩個新的嵌入式模型，GPT-3.5 Turbo輸入價格減半

背景圖片來源／Maxim Berg on unsplash

OpenAI周四（1/25）再度更新旗下產品，包括更新GPT-3.5 Turbo模型，GPT-4 Turbo預覽模型，更新文字審核模型，還推出了兩個新的文字嵌入式模型text-embedding-3-small與text-embedding-3-large。另也宣布調降GPT-3.5 Turbo模型價格，每1,000個輸入標記（Token）為0.0005美元，降幅達50%，每1,000個輸出標記為0.0015美元，降幅為25%。

嵌入式模型（Embedding Models）是機器學習與AI系統用來效法人類了解複雜知識的方式，它將真實世界的物件轉為複雜的數學表示法，擷取真實世界的固有屬性與關係，於低維度空間表達高維度資料，令演算法的執行更有效率。

text-embedding-3-small的前輩為2022年12月推出的text-embedding-ada-002，相較於text-embedding-ada-002，text-embedding-3-small的多語言檢索（MIRACL）評測從31.4%提高至44%，常用的英文任務評測（MTEB）則從61%增加至62.3%。

此外，text-embedding-3-small的價格也遠低於text-embedding-ada-002，其每1,000個標記的費用只要0.00002美元，是text-embedding-ada-002的1/5。

OpenAI表示，雖然推出了新的text-embedding-3-small，也推薦用戶使用新的文字嵌入式模型，但並不會棄用舊版的text-embedding-ada-002，亦歡迎用戶繼續使用。

至於text-embedding-3-large則是OpenAI下一代的大型嵌入式模型，最多可建立3,072個維度的嵌入向量，相較於text-embedding-3-small與text-embedding-ada-002，其MIRACL的平均分數為54.9%，MTEB則是64.6%。text-embedding-3-large每1,000個標記的費用為0.00013美元。

OpenAI說明，訓練這兩個嵌入式模型所使用的特殊技術，允許開發者在嵌入時權衡效能與成本，依照實際需求並藉由維度API參數來控制嵌入的大小，在不損及重要概念的前提下，減少嵌入成本。

除了新的模型之外，OpenAI即將於下周推出新的GPT-3.5 Turbo模型gpt-3.5-turbo-0125，該模型提高了準確度，也修復了以非英語函數呼叫所造成的文字編碼錯誤問題。此外，GPT-3.5 Turbo的輸入價格調降了50%，輸出亦調降25%，距離上次OpenAI調降該模型價格還不到3個月。

更新的GPT-4 Turbo預覽版可更徹底完成程式碼生成任務，也減少了該模型有時會落下任務的懶惰狀況，並修復非英語UTF-8生成的錯誤。

審核API（Moderation API）是OpenAI為了讓開發者可辨識有害文字而開發的免費工具，不管是text-moderation-latest或text-moderation-stable都會採用最新的text-moderation-007版本。

熱門新聞