圖片來源: 

Google

繼去年12月的Gemini Ultra及Gemini Nano後,Google昨(1)日宣布Gemini Pro於全球上線,並推出中文、法語、日語等40多種語言版本。此外也推出結合Bard英文版的圖像生成AI模型Imagen 2。

今天起,Gemini Pro in Bard將支援40多種語言,包括中文、日語、法語、西語、德語、荷語、葡語、阿拉伯語、以及印度印地語(Hindi)、坦米爾語(Tamil)、泰盧固(Telugu)及馬拉雅拉姆語(Malayalam)在230多個國家及市場上線。這個進階AI大型語言模型具備進階理解、推論、文章摘要及寫程式等能力。

隨同Gemini Pro全球上線,其中的double-check功能也將提供多語支援。點下Google Bard的「G」,該功能可結合Google網頁搜尋,以便比對Bard搜尋來的網頁資訊。如果有突顯特定字詞,用戶可以點入了解是否和Google搜尋的資訊符合或衝突。

圖片來源/Google

此外,Google Bard英文版也有所強化,加入圖像生成AI模型Imagen 2。這模型讓用戶可以輸入文字描述,讓Google聊天機器人產出圖片。Imagen 2是基於擴散(diffusion-based)模型,強調能生成高品質圖片,並解決文字生成圖片的技術問題,像是手與人臉渲染失真,並避免視覺偽影等人為問題。

Google並說,Imagen 2基於AI倫理原則設計,會標示為AI生成的作品。它使用SynthID技術在圖像中嵌入可以機器辨識的浮水印,並以護欄技術防止Bard產出暴力、冒犯或不雅內容,也會限制產出名人圖片。

除了Bard外,Image 2也將用於Google其他AI服務如Image FX、SGE(Google生成式搜尋體驗)、及Vertex AI雲服務。

Google也公開了測試中的其他生成式AI工具,包括ImageFX、MusicFX及TextFX,現在可經由Google Labs試用。

其中ImageFX是以Imagen 2為底層的文字生成圖像工具,類似OpenAI的DALL-E、Meta的Imagine with Meta AI或微軟Designer。ImageFX主打提供expressive chips,指的是一系列關鍵字建議,讓用戶可以逐個測試生成不同感覺的圖片。

圖片來源/Google

文字生成音樂的MusicFX,現在可生成70秒的音樂、反覆段落、以expressive chips關鍵字建議探索提示,還能將創作和友人分享。另外,Google去年和Lupe Fiasco合作開發的AI工具TextFX,可幫助作詞者、作家等文字創作者,也在新版中改善了介面可使用性。

熱門新聞

Advertisement