
Google周三(3/12)發布了Gemma 3,意謂著Google於去年2月首度發表的Gemma輕量模型家族已來到第三代,Gemma 3提供了1B、4B、12B及27B參數等4種版本,可於單一的GPU或TPU上執行,除了將脈絡窗口長度從Gemma 2的8k Token,擴大至32k(1B)與128k之外,亦已支援超過140種語言,且除了1B之外的模型皆開始支援多模態,能夠理解圖像加上文字的輸入,但目前僅支援文字輸出。
Google替Gemma社群成立了Gemmaverse,以讓Gemma開發者交流彼此的創意,在Gemma問世的13個月以來,相關模型已有超過1億次的下載,開發者在Gemmaverse上分享了超過6萬個Gemma變種模型。
Google說明,Gemma 3採用與Gemma 2模型相同的研究與技術而打造,該系列著眼於可直接在手機、筆記型電腦及工作站等裝置上快速執行,協助開發者在人們需要的任何地方建置AI應用程式,開發者可根據硬體及性能需求,選擇最適合的模型規格。
最新的Gemma 3可替35種語言提供開箱即用的支援,也能支援逾140種語言的預訓練;除了1B之外的Gemma 3版本皆支援可同時輸入文字、圖像及短影音,並輸出文字;有了128k Token的脈絡長度,將允許應用程式處理及理解大量資訊;新版亦支援函數呼叫與結構化輸出,以協助自動化任務執行與打造代理體驗;Gemma 3導入了官方的量化版本,減少模型尺寸與運算要求,並維持高精度。
另一方面,Gemma 3在 Chatbot Arena 排行榜上的初步人類偏好評估中,超越了Llama-405B、DeepSeek-V3與o3-mini,這是個由人類盲測各種大型語言模型的流暢、準確或是可用性的即時排行榜,Gemma 3 27B目前排在第十名,勝過Llama-405B、DeepSeek-V3或o3-mini,而且即使DeepSeek R1在評測分數中微幅勝過了Gemma 3 27B,但DeepSeek R1使用了32個Nvidia H100的GPU,Gemma 3 27B卻只用了一個GPU。
同一天Google也發表了基於Gemma 3的ShieldGemma 2,這是個4B影像安全檢查器,可用來過濾危險內容、色情與暴力。
開發人員可透過Google AI Studio、Kaggle或Hugging Face下載Gemma 3系列的開源模型。
熱門新聞
2025-03-10
2025-03-10
2025-03-10
2025-03-10
2025-03-11