Google在AI大會上宣布文字轉影片模型Imagen,將開放特定國家用戶測試,此外,另一AI模型Phenaki產生的影片也首次問世。(圖片來源/Google)

Google上周在AI大會上宣布可將文字轉成影片的AI模型Imagen,將透過測試用App AI Test Kitchen開放特定國家用戶測試。此外,另一AI模型Phenaki產生的影片也首次問世。

Google執行長Sundar Pichai貼出一段藍色汽球與長頸鹿的影片,並說,這是Google首次分享以文字提示產生具有條理,並以Imagen Video系統增進品質的超高解析度影片。

 

Imagen、Phenaki是Google上個月公布的兩個文字轉影片的AI模型,前者強調具有深刻語言理解能力,能生成相片等級影片,而後者則能將多段文字提示合成長度較長、包含不同場景的影片。不同於Imagen僅能生成數秒影片,Phenaki則可生成長數分鐘的影片。

Imagen將透過AI Test Kitchen App開放給美、英、加拿大、澳洲、紐西蘭及肯亞的英語用戶測試。Google 8月宣布AI Test Kitchen App,主要用於測試Google AI技術。Google第一批測試的技術是對話AI模型LaMDA(Language Model for Dialogue Applications)。

9to5Google報導,最新在AI Test Kitchen App測試的Imagen包含2個主題,一是City Dreamer,用戶輸入關於對城市想像的一連串文字提示,由Imagen生成影片。Wobble也是由用戶輸入文字提示讓Imagen生成影片,只是主題變成了怪物。

Google希望能藉此挑戰OpenAI的 DALL-E 2、Stability AI的Stable Diffusion,或是Meta的Make-A-Video。OpenAI的DALL-E 2於9月正式開放所有用戶試用。Meta的Make-A-Video也已經在9月底開放給社群試用。

熱門新聞

Advertisement