圖片來源: 

Google

2025世界通訊大會(World Mobile Congress,MWC)本周開幕,Google也宣布為Gemini Live增加AI代理人,包括能回答複雜問題、翻譯菜單或線上提供用戶穿搭建議。

Gemini Live是類似OpenAI ChatGPT的進階語音模式(Advanced Voice Mode),是可以和用戶流暢對談的聊天機器人。Google在MWC 2025上展示Gemini最新功能,包括可以多種語言解決複雜主題的問題、使用Circle to Search翻譯文字,例如菜單。此外Gemini Live還加入即時影像與Live共享螢幕(Share screen with Live)新功能。

這些功能將在本月部署到Android裝置版Gemini Advanced訂閱戶。Gemini Advanced為訂閱Google One AI Premium方案獲得的部份功能。

根據Google提供示範「與Live共享螢幕」的影片,從Gemini App按下Live鍵即可召喚出Gemini Live。當用戶詢問Gemini Live穿搭建議,系統會要求用戶按下相機App,好比和Gemini Live共享螢幕畫面。這時Gemini Live會和用戶就看到的衣褲來回對答,提供建議。

Gemini Live新功能的底層引擎來自Gemini 2.0為基礎的最新AI代理人Project Astra,它能在混合及多種語言環境下轉換語言,且能理解不同腔調和罕見字,可用於Google Search、Lens和Maps。Google並在12月推出推理AI模型Gemini 2.0 Flash Thinking實驗版,可以解決複雜的問題。

Google去年同時還公布另一AI代理人原型,名為Project Mariner。它是可在瀏覽器執行的AI代理,以Gemini 2.0為基礎使其能理解像素、或是Web元素如文字、程式碼、圖片及表格,還能透過一款Chrome外掛來執行任務,像是讀取網頁、生成摘要等。

熱門新聞

Advertisement