在激烈的AI競賽中,Google昨(11)日發表專為代理型AI(Agentic AI)時代打造的多模態語言模型Gemini 2.0,並開放Gemini 2.0 Flash實驗版,及公布3種AI代理(Agent)。
Google執行長Sundar Pichai指出,在去年底及今年8月推出Gemini 1.0和1.5迄今,公司以Gemini模型發展出7種產品,包括受許多人喜愛的多模態AI筆記應用程式NotebookLM,用戶超過20億。他說,今年以來Google投入研發代理人模型(Agentic Model),最新的Gemini 2.0是為代理型AI時代所打造的次世代模型,也是Google歷來最強大的模型。
如同前幾代,Gemini 2.0也是一個家族。作為代理型AI時代打造的模型,Gemini 2.0具備多模態輸出,原生生成圖片及輸出音訊的功能,並整合於Google Search及Maps。
Google今天公布了Gemini 2.0家族第一款模型,名為Gemini 2.0 Flash。它是以最受開發人員歡迎的1.5 Flash為基礎開發,在理解、數學、推理、事實貼近、圖像辨識、語音辨識及影像分析等多個標竿測試,大幅超越前一代Flash模型,甚至1.5 Pro模型。
Gemini 2.0 Flash目前還是實驗版,現已供開發人員透過Google AI Studio及Vertex AI在API中打造自己的AI應用程式。所有開發人員都能測試多模態輸入及文字輸出,而早鳥夥伴則還能試用語音生成及原生圖片生成功能。伴隨Gemini 2.0 Flash的公布,Google也釋出新的Multimodal Live API,後者具備即時音訊、影像串流輸入等工具。
Google預計2025年1月,會再推出更多參數量版本的Gemini 2.0模型。
現在Gemini 2.0 Flash實驗版將部署到Gemini AI助理中開放全球用戶使用。今天起可以從桌機和手機Web版Gemini的下拉選單,選擇Gemini 2.0 Flash使用,這模型很快也可以部署到Gemini App。
Google今天也公布了以Gemini 2.0為基礎的三個AI代理研究原型。一是以Gemini 2.0升級的Project Astra,它具有在混合及多種語言環境下轉換語言,且能理解不同腔調和罕見字。有了Gemini 2.0,可用於Google Search、Lens和Maps。
2個Gemini 2.0為基礎的AI代理,分別為Project Mariner和Jules。Project Mariner是可在瀏覽器執行的AI代理,以Gemini 2.0為基礎使其能理解像素、或是Web元素如文字、程式碼、圖片及表格,還能透過一款Chrome外掛來執行任務,像是讀取網頁、生成摘要。Jules則是可整合到GitHub工作流程的AI代理,能處理問題、建立規劃或執行,旨在加速開發,但全可由開發人員控制和監控。
熱門新聞
2024-12-10
2024-12-10
2024-12-08
2024-12-10
2024-12-11
2024-11-29