Google Gemini新增可客製化的個人助理Gem、全面部署Imagen 3圖片生成模型

圖片來源:

Google

Google昨（28）日宣布Gemini AI服務改版，加入可客製的個人AI助理Gem，以及高品質圖片生成模型Imagen 3全面部署到免費及付費版服務。此外，生成人物圖片的功能也重新上線。

Gem是Google I/O曾預覽過的功能，是可客製化版本的Gemini。用戶可針對特定主題或目的客製化成特殊主題專家。用戶可自建一個專家團隊協助完成重大專案、為大型活動腦力激盪，或為社群平臺貼文撰寫標題。Google說，只要撰寫指令、給個名字就完成了，它還會記得用戶輸入的詳細指令，可節省重複性或困難任務的AI助理的開發時間。

過幾天，這項功能會推向有150多國家地區的Gemini Advanced、或是Business及Enterprise版本訂閱用戶。Gem共支援30多種語言，但Gemini應用程式必須同樣支援使用者所在的國家/地區和語言，才能在該程式中使用這項功能。

為協助用戶入手，Google已預建了一些用於困難任務的Gems。像是引導學習的學習教練、幫忙想點子的腦力激盪者、可制訂自我提升計畫的生涯規劃顧問、改善文法到文章結構的撰文編輯，以及撰寫程式的小幫手等。

另外，本月稍早只提供美國市場的圖像生成模型Imagen 3，未來幾天內將全面部署到Gemini AI助理。

Imagen 3為一潛在擴散模型（latent diffusion model），能根據用戶輸入的文字提示產生高品質圖片。Google說，DeepMind團隊大幅提升Imagen 3提示理解能力，使模型能了解並遵循落落長、充滿形容詞和複雜的提示，並生成細節繁複、色彩鮮豔、以及視覺設計更豐富的圖片。

Imagen 3在多項測試中，超越競爭者如DALL-E 3、Midjourney v6、Stable Diffusion（SD）3 Large、SD XL 1.0等模型。

由於Imagen剛上線時曾讓Gemini鬧出生成黑人美國開國元勛、或是女性教宗圖片的錯誤，讓Google延後Gemini人物圖片生成的服務上線。和Gem一樣，這項功能目前僅開放給Gemini Advanced、Business、和Enterprise方案用戶，僅提供英文版。Google說會持續改進其技術能力，以及安全與品質監控工具，也會提供清楚的產品原則。

Google說，Imagen 3內建安全護欄並遵循產品設計倫理原則。此外，一如Imagen 2，新版本也使用了Google自有開發的浮水印技術SynthID防範冒充真人創作。用戶握有控制權，若生成的圖不滿意也可令Gemini重新生成圖片。圖片來源／Google

熱門新聞