Google周二(9/24)更新Gemini 1.5 Flash與Gemini 1.5 Pro,釋出Gemini-1.5-Pro-002與Gemini-1.5-Flash-002,主要提高了這兩款模型的輸出速度,調高其速率限制,以及調降Gemini 1.5 Pro的價格。
Gemini 1.5是個多模態模型,支援200萬個Token的脈絡長度,它能處理長達1,000頁的PDF檔案,從超過1萬行程式碼的儲存庫中回答問題,也可自1小時的影片中擷取重要資訊。相較於今年5月的Gemini 1.5 Flash/Pro版本,新版不管是在 MMLU-Pro、MATH或HiddenMath等基準測試上都有明顯的長進,在視覺理解或生成Python程式碼也表現得更好。
此外,Gemini 1.5 Flash/Pro擁有一個更簡潔的表達方式,不管是在回答問題、進行摘要或汲取內容上,新模型的預設輸出長度都比前一版短了5~20%,以方便使用並降低成本。
本周Google亦宣布調降Gemini 1.5 Pro價格,前提是提示少於12.8萬個Token,那麼其輸入Token價格調降了64%,輸出Token則調降52%,新增快取Token價格亦降低了64%,且自今年的10月1日起生效,屆時每100萬個輸入Token的價格為1.25美元,每100萬個Token的輸出價格為2.5美元,可望降低使用Gemini 1.5 Pro的成本。
而所謂的速率限制指的是開發人員每分鐘可發送請求的次數(Requests Per Minute,RPM),其中,Gemini 1.5 Flash的速率限制從1000 RPM提高到2000 RPM,Gemini 1.5 Pro則從360 RPM提高到1000 RPM,且Google預計未來幾周將持續提高Gemini API的速率限制。
Gemini 1.5 Flash在速度上的改善則較為明顯,它的輸出速度是最初版本的2倍,延遲則只有原來的1/3。
圖片來源/Google
熱門新聞
2024-11-10
2024-11-12
2024-11-10
2024-11-11
2024-11-11
2024-11-11