Google Gemini Pro全球上線支援逾40種語言、公布圖像生成模型Imagen 2

圖片來源:

Google

繼去年12月的Gemini Ultra及Gemini Nano後，Google昨（1）日宣布Gemini Pro於全球上線，並推出中文、法語、日語等40多種語言版本。此外也推出結合Bard英文版的圖像生成AI模型Imagen 2。

今天起，Gemini Pro in Bard將支援40多種語言，包括中文、日語、法語、西語、德語、荷語、葡語、阿拉伯語、以及印度印地語（Hindi）、坦米爾語（Tamil）、泰盧固（Telugu）及馬拉雅拉姆語（Malayalam）在230多個國家及市場上線。這個進階AI大型語言模型具備進階理解、推論、文章摘要及寫程式等能力。

隨同Gemini Pro全球上線，其中的double-check功能也將提供多語支援。點下Google Bard的「G」，該功能可結合Google網頁搜尋，以便比對Bard搜尋來的網頁資訊。如果有突顯特定字詞，用戶可以點入了解是否和Google搜尋的資訊符合或衝突。

圖片來源／Google

此外，Google Bard英文版也有所強化，加入圖像生成AI模型Imagen 2。這模型讓用戶可以輸入文字描述，讓Google聊天機器人產出圖片。Imagen 2是基於擴散（diffusion-based）模型，強調能生成高品質圖片，並解決文字生成圖片的技術問題，像是手與人臉渲染失真，並避免視覺偽影等人為問題。

Google並說，Imagen 2基於AI倫理原則設計，會標示為AI生成的作品。它使用SynthID技術在圖像中嵌入可以機器辨識的浮水印，並以護欄技術防止Bard產出暴力、冒犯或不雅內容，也會限制產出名人圖片。

除了Bard外，Image 2也將用於Google其他AI服務如Image FX、SGE（Google生成式搜尋體驗）、及Vertex AI雲服務。

Google也公開了測試中的其他生成式AI工具，包括ImageFX、MusicFX及TextFX，現在可經由Google Labs試用。

其中ImageFX是以Imagen 2為底層的文字生成圖像工具，類似OpenAI的DALL-E、Meta的Imagine with Meta AI或微軟Designer。ImageFX主打提供expressive chips，指的是一系列關鍵字建議，讓用戶可以逐個測試生成不同感覺的圖片。

圖片來源／Google

文字生成音樂的MusicFX，現在可生成70秒的音樂、反覆段落、以expressive chips關鍵字建議探索提示，還能將創作和友人分享。另外，Google去年和Lupe Fiasco合作開發的AI工具TextFX，可幫助作詞者、作家等文字創作者，也在新版中改善了介面可使用性。

熱門新聞