位於京都的新創公司DataGrid,持續研發將創意人的工作交給人工智慧的「創意人工智慧」。該公司提出未來全新的人工智慧運用方式,研發出能「生成」偶像臉孔的人工智慧,作為一項「創意人工智慧」。
DataGrid社長岡田侑貴說明,「講到以往的人工智慧,幾乎都用來辨識、預測,很少看到創作的人工智慧。DataGrid希望藉由讓人工智慧做創意人的工作,刺激創意人的想像力,打造一個人類與人工智慧共同創作的社會。公司裡的十一名員工全都具備機器學習的專業背景,在學術上也與大學展開共同研究。另外,商業面上用創意人工智慧的成果,建立起能夠授權企業的商業模式。」
以深度學習來辨識偶像的特徵
DataGrid打造能自動生成偶像臉孔的創意型人工智慧應用。 |
二○一八年六月,該公司宣布研發創意人工智慧的應用軟體「偶像自動生成AI」。這項作業的概要,是讓運用深度學習的人工智慧以幾萬張偶像大頭照來學習,使人工智慧辨識出偶像的特徵。藉由學習了偶像臉孔特徵的人工智慧,來生成虛擬的偶像臉孔。因為有無限多變化,可以創造出擁有「偶像臉孔特徵」的人臉。
在具體的手法上,使用的是「生成對抗網路」(Generative Adversarial Network,GAN)。生成對抗網路是一種非監督式學習模型,從不給予正確答案的學習資料中,推導出結構和規則,並「生成」影像等成果。其中一個網路是試圖接近從給予的學習資料所獲得的資訊,另一個是判別真偽的網路,藉由兩者在互相對抗之下各自提高準確率,提高要求的影像等生成物的品質,因此以「對抗」為名。
岡田建立使用生成對抗網路的人工智慧模型,成功將偶像臉孔特徵做出頸部以上的高解析度(1024×1024)影像,但研發過程中面臨意想不到的狀況。「一開始使用偶像臉孔的影像來學習時,雖說看得出是臉部,但生成的大多是輪廓不完整的怪臉孔。其中一個原因是起初的資料量比較少,大概只有五千筆。另一方面,偶像的大頭照形形色色,有些影像中配戴了髮飾,或者比出勝利手勢,還有臉轉向側面的,因此有時頭髮上出現莫名其妙的圖案。最後增加了幾萬筆學習資料,在資料上有絕對的優勢,不過我深深體會到針對資料進行預處理,修正為適合學習的型態,這一點非常重要。」(岡田)
有了資料的預處理,加上自由度高的學習模型最佳化,並且有後處理(posttreatment)的機制,評估生成的影像,只留下好的顯示為成果。費盡心思,終於完成了偶像自動生成AI。
經過一番努力研發出的偶像自動生成AI,現階段還沒有明確的用途。岡田說明,不只是目前的「臉孔」,希望能用人工智慧來生成動態的虛擬偶像「全身」。這麼一來,在很多情境下都能以虛擬偶像來替代真人上場。「出現在電視廣告中的人物或電商服飾模特兒,未必一定得是真人。如果能用人工智慧模特兒來替代真人藝人,想降低成本的廣告或電商網站就能使用虛擬人物。」(岡田)即使因為成本而無法採用真人,生成高解析度且幾近真實的人物影像,同樣帶來新的創意。
生成「擬真影像」的技術有什麼用處?
使用生成對抗網路生成新資料的人工智慧,可說是DataGrid的核心技術。換言之,DataGrid的業務不只是偶像自動生成。
另一個接近偶像自動生成的領域是「內容(contents)自動生成」。運用生成對抗網路,以動畫人物或電玩遊戲中使用的地下迷宮(dungeon)作為學習資料建立模型,生成前所未有的「具備動畫人物特徵的影像」或「具備電玩遊戲地下迷宮特徵的圖形」。如果有效運用這類人工智慧,就不必像現在人工作業繪製一個個動畫人物,只要用生成對抗網路一次生成多個人物,然後「挑選」出來。
比方說,使用能生成無數個人物的特徵,在電玩遊戲中針對每個玩家有不同的客製化人物。事實上,經營線上電玩遊戲的Aeria便投資了DataGrid,共同推動以人工智慧生成人物影像的專案。目前除了規畫提供利用這項技術的電玩遊戲,未來還預計發展出讓人工智慧辨識玩家喜好並配合生成遊戲人物。
不只生成影像,還能應用於加工。「把照片變成梵谷名畫」之類廣受歡迎的手機應用程式,很容易建立影像濾鏡功能,根據某些特徵來改變圖像。除此之外,要提高畫質粗劣的影像的解析度,「超解析」(super-resolution)、「降噪」之類影像處理也能有效使用生成對抗網路,目前仍持續研究開發。超解析必須生成原本非以數據存在的畫素資訊,但這種「擬真創作補足」正是生成對抗網路最擅長的領域,「成功實現了比以往超解析更漂亮的超解析影像。」(岡田)降噪方面的成果同樣效果顯著,未來可望應用在影像和照片的數位修復作業或博物館。
第三個解決方案是「學習用資料的自動生成」。想在業務上運用人工智慧,想用深度學習打造模型,雖然有這樣的期望,卻礙於收集不到學習用的資料或數量太少,這些情況尋常可見。例如偵測異常的人工智慧,即使有大量正常的影像,通常顯示異常的影像很少。這時可以運用生成對抗網路,生成各種「具備異常特徵的影像」,以這種方式來增加學習用的資料。
「如果能把一百筆資料增加到一萬筆的各種變化,深度學習的準確率大幅提高。工廠內的異常影像、產品品管檢查時發現缺失的影像、行車紀錄器拍到汽車前方有人或動物衝出來的影像等,這些希望借助運用人工智慧的異常影像數量都很少。若以生成對抗網路生成的資料來補充,將有助於建立準確率高的人工智慧模型。」(岡田)
藉由DataGrid研發的人工智慧,能夠以各種形式「無中生有」。DataGrid和面對課題的夥伴企業共同運用這些功能。岡田表示,「到頭來,人工智慧單打獨鬥什麼事都做不了,重要的是『人工智慧×未知的X』。然而,要靠自己來打造X,工程太浩大。因此,我們希望與已經擁有X的其他公司合作,繼續推動創意人工智慧的實用化。」他非常看好創意人工智慧的未來。(摘錄整理自本書case 31)
書名 深度學習的商戰必修課:走在時代尖端的日本企業如何活用AI
日經xTREND/著;日本深度學習協會/監修;葉韋利/譯
臉譜出版
售價:420元
作者簡介
日經xTREND
新興市場創業人的數位策略媒體。針對正在開發企業新業務、致力行銷相關業務者,提供行銷、消費、技術、資料、創新等領域的最新相關實務資訊。
熱門新聞
2024-09-06
2024-09-06
2024-09-06
2024-09-06
2024-09-06
2024-09-06
2024-09-06
2024-09-06