Google昨(28)日宣布Gemini AI服務改版,加入可客製的個人AI助理Gem,以及高品質圖片生成模型Imagen 3全面部署到免費及付費版服務。此外,生成人物圖片的功能也重新上線。
Gem是Google I/O曾預覽過的功能,是可客製化版本的Gemini。用戶可針對特定主題或目的客製化成特殊主題專家。用戶可自建一個專家團隊協助完成重大專案、為大型活動腦力激盪,或為社群平臺貼文撰寫標題。Google說,只要撰寫指令、給個名字就完成了,它還會記得用戶輸入的詳細指令,可節省重複性或困難任務的AI助理的開發時間。
過幾天,這項功能會推向有150多國家地區的Gemini Advanced、或是Business及Enterprise版本訂閱用戶。Gem共支援30多種語言,但Gemini應用程式必須同樣支援使用者所在的國家/地區和語言,才能在該程式中使用這項功能。
為協助用戶入手,Google已預建了一些用於困難任務的Gems。像是引導學習的學習教練、幫忙想點子的腦力激盪者、可制訂自我提升計畫的生涯規劃顧問、改善文法到文章結構的撰文編輯,以及撰寫程式的小幫手等。
另外,本月稍早只提供美國市場的圖像生成模型Imagen 3,未來幾天內將全面部署到Gemini AI助理。
Imagen 3為一潛在擴散模型(latent diffusion model),能根據用戶輸入的文字提示產生高品質圖片。Google說,DeepMind團隊大幅提升Imagen 3提示理解能力,使模型能了解並遵循落落長、充滿形容詞和複雜的提示,並生成細節繁複、色彩鮮豔、以及視覺設計更豐富的圖片。
Imagen 3在多項測試中,超越競爭者如DALL-E 3、Midjourney v6、Stable Diffusion(SD)3 Large、SD XL 1.0等模型。
由於Imagen剛上線時曾讓Gemini鬧出生成黑人美國開國元勛、或是女性教宗圖片的錯誤,讓Google延後Gemini人物圖片生成的服務上線。和Gem一樣,這項功能目前僅開放給Gemini Advanced、Business、和Enterprise方案用戶,僅提供英文版。Google說會持續改進其技術能力,以及安全與品質監控工具,也會提供清楚的產品原則。
Google說,Imagen 3內建安全護欄並遵循產品設計倫理原則。此外,一如Imagen 2,新版本也使用了Google自有開發的浮水印技術SynthID防範冒充真人創作。用戶握有控制權,若生成的圖不滿意也可令Gemini重新生成圖片。圖片來源/Google
熱門新聞
2024-10-23
2024-11-01
2024-09-27
2024-10-30