Google釋出1B/4B/12B/27B的 Gemma 3，開始支援多模態

圖片來源:

Google

Google周三（3/12）發布了Gemma 3，意謂著Google於去年2月首度發表的Gemma輕量模型家族已來到第三代，Gemma 3提供了1B、4B、12B及27B參數等4種版本，可於單一的GPU或TPU上執行，除了將脈絡窗口長度從Gemma 2的8k Token，擴大至32k（1B）與128k之外，亦已支援超過140種語言，且除了1B之外的模型皆開始支援多模態，能夠理解圖像加上文字的輸入，但目前僅支援文字輸出。

Google替Gemma社群成立了Gemmaverse，以讓Gemma開發者交流彼此的創意，在Gemma問世的13個月以來，相關模型已有超過1億次的下載，開發者在Gemmaverse上分享了超過6萬個Gemma變種模型。

Google說明，Gemma 3採用與Gemma 2模型相同的研究與技術而打造，該系列著眼於可直接在手機、筆記型電腦及工作站等裝置上快速執行，協助開發者在人們需要的任何地方建置AI應用程式，開發者可根據硬體及性能需求，選擇最適合的模型規格。

最新的Gemma 3可替35種語言提供開箱即用的支援，也能支援逾140種語言的預訓練；除了1B之外的Gemma 3版本皆支援可同時輸入文字、圖像及短影音，並輸出文字；有了128k Token的脈絡長度，將允許應用程式處理及理解大量資訊；新版亦支援函數呼叫與結構化輸出，以協助自動化任務執行與打造代理體驗；Gemma 3導入了官方的量化版本，減少模型尺寸與運算要求，並維持高精度。

另一方面，Gemma 3在 Chatbot Arena 排行榜上的初步人類偏好評估中，超越了Llama-405B、DeepSeek-V3與o3-mini，這是個由人類盲測各種大型語言模型的流暢、準確或是可用性的即時排行榜，Gemma 3 27B目前排在第十名，勝過Llama-405B、DeepSeek-V3或o3-mini，而且即使DeepSeek R1在評測分數中微幅勝過了Gemma 3 27B，但DeepSeek R1使用了32個Nvidia H100的GPU，Gemma 3 27B卻只用了一個GPU。

同一天Google也發表了基於Gemma 3的ShieldGemma 2，這是個4B影像安全檢查器，可用來過濾危險內容、色情與暴力。

開發人員可透過Google AI Studio、Kaggle或Hugging Face下載Gemma 3系列的開源模型。

熱門新聞