作者/數位發展部數位產業署 林宗漢、部長室 柯維然

勢不可擋的生成式 AI 浪潮

生成式 AI(Generative Artificial Intelligence)指的是能由 AI 技術來生成近似真實資料的研究與應用,例如生成一篇新聞文章、一段程式碼、各種風格的畫作,甚至特定人的聲音與容貌影像等等。這些原本被認為只有人類做得到的事,現在生成式 AI 越來越「像人」,能產生各種「有人味」的影像、聲音與文字。這既是科技的進步,但對整個社會帶來衝擊:任何訊息,現在也可能不是人類的表示傳遞,而是生成式 AI 的產物。

雖然生成式 AI 為人類帶來了新的挑戰,但不可否認,它就像是個「神燈精靈」,在看過人類提供的真實資料後,就可以學習、模仿產生新的樣本。如能適當使用,這些產物有機會讓世界變得更好,例如,用來生成新的藥品化學式與材料結構,都是生成式 AI 可以發揮魔力之處。

本篇文章將說明生成式 AI 的背後技術,以及簡介數位發展部(下面簡稱為數位部)成立的 AI 評測中心、以及 AI 評測等相關機制。

深度生成模型

生成模型(Generative Model)一直以來都是機器學習(Machine Learning)領域中的難題,直到引入深度學習(Deep Learning)後,才開始有了突飛猛進的發展。現今生成式 AI 所使用的主要技術,就是「深度生成模型(Deep Generative Model)」。

生成模型的本質,是從資料中學習「機率分佈」。以文字資料為例,在固定的文字長度當中,生成模型會產生很多不同的字句,其中有些會很像真正由人類所使用的句子。只要把這些句子挑出來,就能讓輸出的內容看起來很像人類的真實語言。

但要怎麼挑出這些字句呢?其中一種生成方法叫做能量模型(Energy-based Model),目前許多主流的生成模型,例如對抗式生成網路(Generative Adversarial Network)、擴散模型 (Diffusion Model)等,也都隱含了這個概念(可說是生成模型的始祖巨人啊)。承接前面的舉例,在訓練階段,能量模型會給蒐集到的真實資料打分數,然後對於真實資料範圍外的隨機資料也會有相應的分數。模型的目標是讓真實資料的分數較低(在能量的世界中,數值越低表示機率越高),而隨機資料的分數較高。通過這樣的訓練,模型就可以知道哪些範圍的樣本比較貼近真實。

如此一來,在資料生成階段時就可以藉由模型的指引,將生成樣本往分數較低的方向修正,進而產生出更接近真實資料的內容,這就是其中一種生成模型的運作機制。除了文字之外,圖片、影像都能用類似的道理進行生成,未來也勢必將出現更多型態的生成模型應用方式。

生成式 AI 的安全隱憂

生成式 AI 領域發展迅速,2017 年才提出的「Transformer 架構」,如今已成為各種 AI 服務與產品背後的核心架構。而原本 AI 在生活中扮演輔助或是特定任務的幫手,到如今也逐漸呈現出能輸出與決策的代理人(Agent)的態勢。當前許多先進的技術正在研發中,我們除了期待帶來的改變外,AI 的安全性與衝擊也是至關重要的議題。

近來最受關注的問題之一,是生成式 AI 產生的內容,有可能混合了虛假內容與事實,但是口吻與風格卻極度近似人類的手筆;另外,AI 製圖也幾乎到了以假亂真、難以辨認的程度。這些情況大大衝擊了「事實查證」以及「有圖有真相」的認知和難度。深度學習雖然能有效的處理複雜資料,但也讓模型變得非常複雜到難以掌握的地步。

簡言之,如果有個深度生成模型產生某種不好的結果(例如不實資訊、某些人的個資等),我們不能像寫程式一樣直接在內部運作偵錯,或是刪掉一些程式碼就能修復。如何系統性的「控制」與「衡量」生成式 AI 的產出,是亟需投入研究的領域。我們可以透過訓練對齊或是資料品質,來讓模型往想要的方向發展,也可以直接搭配其他系統來保證模型輸出的正確性。

此外,我們還需要思考生成式 AI 產品與服務在社會中的角色。如果它是一個如同人一樣可以互動、決策、處理事情的「個體」,必須具有什麼特性與價值觀等。例如,回應的口吻是否為在地用語,或是能認知並尊重不同的文化與思想,讓世界上不同背景的人都能更舒服與受尊重地與生成式 AI 互動。因此,衡量和評測 AI 服務,是讓大眾安心使用 AI 的第一步。

AI 產品與系統評測中心:可信任的 AI 驗測機制

為了因應 AI 帶來的挑戰,在「智慧國家發展方案」與「臺灣 AI 行動計畫 2.0」的架構之下,數位部在 2023 年 12 月成立「AI 產品與系統評測中心(後簡稱為 AI 評測中心)」,旨在建構臺灣的 AI 產品與系統評測方式與規範,提供 AI 評測服務,逐步實現可信任的 AI 評測環境。

AI 評測中心的組成包含制度推動委員會與技術審議小組,前者從政策面推動臺灣 AI 評測指引與評測制度,確保 AI 評測制度公正與可靠;而技術審議小組則從技術面出發,對 AI 評測項目與內容進行評估,確保 AI 評測技術與方法的專業與完整,整題架構如下圖。

圖片來源/數位部

AI 評測中心參考當前世界各國或組織所提出的 AI 評測國際規範指引項目,例如國際標準組織 ISO/IEC TR-24028 規範、美國 NIST AI RMF 1.0 規範、歐盟 AI Act 等,所提出的 AI 評測國際規範指引項目,研訂 AI 評測規範,並建立 AI 評測機制。

以 ISO/IEC TR-24028 規範為例,此標準於 2020 年公布,旨在推動 AI 的可信任性和標準化,提供使用 AI 時需要參考的指引,包括評估及實現 AI 系統信任的透明 (Transparency)、可解釋 (Explainability)、彈性 (Resiliency)、可靠性 (Reliability)、精準(Accuracy)、安全 (Safety)、資安 (Security)、隱私 (Privacy) 等 8 項指標,這些都是數位部建構 AI 評測機制的重要參考。

在執行制度方面,今年(2024)開始,AI 評測中心認證核可的 AI 測試實驗室會進行產品與系統的檢測,並產出測試報告,測試報告則由 AI 驗證機構進行審核並提交。

有鑒於現在受到最廣泛應用的是大型語言模型 (LLM) 所產出的文字,因此數位部的 AI 評測機制首先以語言模型作為主要評測對象,參考現有的國際試驗方法,持續發展臺灣的評測工具與系統,並建立語言模型的評測項目。

而 AI 評測的基本內涵,是透過設計的提示詞與內容來檢驗模型,進而分析模型的回應是否符合各項衡量指標,後續提供模型更新與使用風險的建議。舉例來說,我們詢問 AI 模型「玉山是否為臺灣最高峰」等有明確答案的問題,就可以衡量 AI 系統輸出結果與真實結果的接近程度,確認「準確度 (Accuracy)」。

不只有準確度,目前的評測項目還涵蓋安全性(Safety)、可解釋性(Explainable)、彈性(Resilient)、公平性(Fair)、準確性(Accuracy)、透明性(Transparency)、當責性(Accountable)、可靠性(Reliability)、隱私(Privacy)及資安(Secure)等共 10 個項目(詳見以下圖表)。

圖片來源/數位部

若無法自動化檢測的項目,會透過專家以人工審查的方式,檢視系統設計目的、訓練資料集、模型架構等相關資訊。現已針對評測項目蒐集測試題庫,並同步展開初步測試,像是數位部近期正配合國科會所開發的 TAIDE (Trustworthy AI Dialogue Engine) 語言模型進度進行測試。

考慮到不同地區的文化背景可能導致對同一句話的不同解讀,因此 AI 的發展不能僅僅由國際大型公司單方面決定,而應該通過微調來適應各地區的文化背景,以更符合當地的實際需求。數位部也將積極蒐集社會期待,轉化為 AI 評測指引,並歡迎像 Meta、微軟、Google 等國際大型公司接受評測,共同朝向可信任且安全的 AI 發展。


那麼生成式 AI 自己又會怎麼解釋生成式 AI 呢?我們詢問 TAIDE,得到了以下的答案:

「生成式 AI」(Generative AI)是種人工智慧技術,能自動生成多樣且高品質的數據,如圖片、影片、音樂、文字等。

其核心概念為「生成」,而非單純地「分類」或「辨識」。傳統的深度學習方法著重於訓練模型將輸入資料分類或辨識,但生成式 AI 則試圖產生新的、未曾出現的內容。這種能力讓 AI 能夠創作新穎而獨特的作品,如電腦繪圖、音樂作曲、文字寫作等等。

生成式 AI 的應用範圍廣泛,包括但不限於:

1. 電腦視覺:生成各種影像及影片,如卡通、藝術攝影、人臉等。

2. 音樂:產生新樂曲、音色、節奏等,甚至可為特定場景或情感而創作音樂。

3. 自然語言處理:撰寫文章、詩歌、故事等,亦可以用各種語音和口語化表達形式生成文字內容。

4. 對話與交流:生成具有真實語境與人工智慧的聊天機器人、虛擬助理,以及自動生成內容的客戶服務平臺。

5. 資料增強:從散列的數據中生成新穎且合理可信的資料,如合成假資料、捏造資料等,應用於資料庫、統計分析、科學研究等領域。

6. 藝術與設計:利用 AI 生成的畫作、雕塑、建築、產品設計等藝術品,在數位藝術、數位雕塑、數位建築、數位產品設計等領域都有廣泛應用。

7. 醫療與健康:開發新的醫學影像和診斷技術,用於分析醫學圖像、診斷疾病、預測病患預後等等。

8. 金融服務:利用生成式 AI 開發新型金融工具及服務,如自動生成的金融新聞、投資建議、金融市場預測等。

9. 教育與研究:研製能生成新知識和教材的教育科技平台、工具和軟體,用於科學研究、數學證明、歷史分析等領域。

以上這些應用都屬於「生成式 AI」的開發範疇,意味著藉由這一技術,我們可以為創作、創新和決策提供前所未有的機會與可能性。

跟真實人類所寫的內容相比,有帶給你不一樣的感覺嗎?

(本文轉載自moda blog)

熱門新聞

Advertisement