Google今日在Pixel 9手機系列產品發表大會上,同時宣布多項相關的AI功能,包括能流暢對話的Gemini Live,挑戰OpenAI ChatGPT進階語音模式(Advanced Voice Mode),以及將Gemini進一步整合到Android,以及YouTube等Google程式中。
Gemini Live是提供行動對話體驗的聊天助理,讓手機用戶可和Gemini流暢對話。用戶除了可以口說和Gemini來回對話外,甚至能在Gemini Live回應過程中打斷、或中途喊停一會再接續。Gemini Live也能於Gemini App背景執行或手機鎖定時和用戶對話,一如用戶講電話一般。為了讓Gemini對話更豐富,Google也加入10種聲音選項。
Gemini Live顯然是想挑戰日前才正式上線的ChatGPT進階語音模式(Advanced Voice Mode)。OpenAI 5月公布ChatGPT進階語音模式雖然表現令人驚豔,卻被爆其中一個聲音未經授權模仿了美國女星Scarlett Johansson,雖然OpenAI否認此事,卻也移除該聲音,並延後進階語音模式上線到8月初,該模式才正式提供5種聲音,但僅向一小部分用戶開放使用,而且設定種種限制,像是ChatGPT無法模仿他人聲音,也不允許其他聲音輸入。
Gemini Live即日已部署給訂閱Gemini Advanced方案的Android手機用戶,目前只支援英文,Google表示,幾個星期內會擴及iOS,並支援更多種語言。
除了Gemini Live外,Google也宣布未來幾個星期內多款程式如Keep、YouTube Music、Task和Utilities或是行事曆(Calendar)都會整合Gemini外掛,用戶不必切換應用即可讓Gemini執行任務,像是讓它從Gmail找出友人寄來的食譜,並將其中一項食材加入Keep採購清單,或是讓Gemini從Google相簿抓出音樂會傳單,查詢當天是否有空、並設定購票提醒。
Google也讓Android進一步整合Gemini。只要長按電源鍵,或說聲「Hey Google」,就能召喚出Gemini助理。用戶可點選「Ask about this screen」詢問問題,或在使用YouTube時點選「Ask about this video」,例如列出旅遊影片的餐廳清單,再叫出Gemini在Google Maps上標註。Gemini也不只能讀取螢幕內容,還能和既有應用互動,像是將Gemini生成的圖片直接丟進Gmail和Google Messages。
有別於Pixel 9系列上的AI功能以Gemini Nano為基礎,今日Gemini Live等新功能則是採用Google新模型如Gemini 1.5 Flash為底層技術,以提供較好的效能和回應品質。但Google不忘表示,新上線的功能仍可能會有回應時間需時較久,或是回應不準確或出現令人意外答案等問題。
Google表示,未來幾個月內該公司會致力於提升Gemini效能和品質,並預告,Gemini還會整合到Google Home、電話(Phone)和訊息等其他應用中。圖片來源/Google
熱門新聞
2024-11-25
2024-11-15
2024-11-15
2024-11-28
2024-11-25
2024-11-29