【moda專欄】生成式 AI 的產業應用與發展趨勢

作者／數位發展部數位產業署林宗漢、部長室柯維然

勢不可擋的生成式 AI 浪潮

生成式 AI（Generative Artificial Intelligence）指的是能由 AI 技術來生成近似真實資料的研究與應用，例如生成一篇新聞文章、一段程式碼、各種風格的畫作，甚至特定人的聲音與容貌影像等等。這些原本被認為只有人類做得到的事，現在生成式 AI 越來越「像人」，能產生各種「有人味」的影像、聲音與文字。這既是科技的進步，但對整個社會帶來衝擊：任何訊息，現在也可能不是人類的表示傳遞，而是生成式 AI 的產物。

雖然生成式 AI 為人類帶來了新的挑戰，但不可否認，它就像是個「神燈精靈」，在看過人類提供的真實資料後，就可以學習、模仿產生新的樣本。如能適當使用，這些產物有機會讓世界變得更好，例如，用來生成新的藥品化學式與材料結構，都是生成式 AI 可以發揮魔力之處。

本篇文章將說明生成式 AI 的背後技術，以及簡介數位發展部（下面簡稱為數位部）成立的 AI 評測中心、以及 AI 評測等相關機制。

深度生成模型

生成模型（Generative Model）一直以來都是機器學習（Machine Learning）領域中的難題，直到引入深度學習（Deep Learning）後，才開始有了突飛猛進的發展。現今生成式 AI 所使用的主要技術，就是「深度生成模型（Deep Generative Model）」。

生成模型的本質，是從資料中學習「機率分佈」。以文字資料為例，在固定的文字長度當中，生成模型會產生很多不同的字句，其中有些會很像真正由人類所使用的句子。只要把這些句子挑出來，就能讓輸出的內容看起來很像人類的真實語言。

但要怎麼挑出這些字句呢？其中一種生成方法叫做能量模型（Energy-based Model），目前許多主流的生成模型，例如對抗式生成網路（Generative Adversarial Network）、擴散模型（Diffusion Model）等，也都隱含了這個概念（可說是生成模型的始祖巨人啊）。承接前面的舉例，在訓練階段，能量模型會給蒐集到的真實資料打分數，然後對於真實資料範圍外的隨機資料也會有相應的分數。模型的目標是讓真實資料的分數較低（在能量的世界中，數值越低表示機率越高），而隨機資料的分數較高。通過這樣的訓練，模型就可以知道哪些範圍的樣本比較貼近真實。

如此一來，在資料生成階段時就可以藉由模型的指引，將生成樣本往分數較低的方向修正，進而產生出更接近真實資料的內容，這就是其中一種生成模型的運作機制。除了文字之外，圖片、影像都能用類似的道理進行生成，未來也勢必將出現更多型態的生成模型應用方式。

生成式 AI 的安全隱憂

生成式 AI 領域發展迅速，2017 年才提出的「Transformer 架構」，如今已成為各種 AI 服務與產品背後的核心架構。而原本 AI 在生活中扮演輔助或是特定任務的幫手，到如今也逐漸呈現出能輸出與決策的代理人（Agent）的態勢。當前許多先進的技術正在研發中，我們除了期待帶來的改變外，AI 的安全性與衝擊也是至關重要的議題。

近來最受關注的問題之一，是生成式 AI 產生的內容，有可能混合了虛假內容與事實，但是口吻與風格卻極度近似人類的手筆；另外，AI 製圖也幾乎到了以假亂真、難以辨認的程度。這些情況大大衝擊了「事實查證」以及「有圖有真相」的認知和難度。深度學習雖然能有效的處理複雜資料，但也讓模型變得非常複雜到難以掌握的地步。

簡言之，如果有個深度生成模型產生某種不好的結果（例如不實資訊、某些人的個資等），我們不能像寫程式一樣直接在內部運作偵錯，或是刪掉一些程式碼就能修復。如何系統性的「控制」與「衡量」生成式 AI 的產出，是亟需投入研究的領域。我們可以透過訓練對齊或是資料品質，來讓模型往想要的方向發展，也可以直接搭配其他系統來保證模型輸出的正確性。

此外，我們還需要思考生成式 AI 產品與服務在社會中的角色。如果它是一個如同人一樣可以互動、決策、處理事情的「個體」，必須具有什麼特性與價值觀等。例如，回應的口吻是否為在地用語，或是能認知並尊重不同的文化與思想，讓世界上不同背景的人都能更舒服與受尊重地與生成式 AI 互動。因此，衡量和評測 AI 服務，是讓大眾安心使用 AI 的第一步。

AI 產品與系統評測中心：可信任的 AI 驗測機制

為了因應 AI 帶來的挑戰，在「智慧國家發展方案」與「臺灣 AI 行動計畫 2.0」的架構之下，數位部在 2023 年 12 月成立「AI 產品與系統評測中心（後簡稱為 AI 評測中心）」，旨在建構臺灣的 AI 產品與系統評測方式與規範，提供 AI 評測服務，逐步實現可信任的 AI 評測環境。

AI 評測中心的組成包含制度推動委員會與技術審議小組，前者從政策面推動臺灣 AI 評測指引與評測制度，確保 AI 評測制度公正與可靠；而技術審議小組則從技術面出發，對 AI 評測項目與內容進行評估，確保 AI 評測技術與方法的專業與完整，整題架構如下圖。

圖片來源／數位部

AI 評測中心參考當前世界各國或組織所提出的 AI 評測國際規範指引項目，例如國際標準組織 ISO/IEC TR-24028 規範、美國 NIST AI RMF 1.0 規範、歐盟 AI Act 等，所提出的 AI 評測國際規範指引項目，研訂 AI 評測規範，並建立 AI 評測機制。

以 ISO/IEC TR-24028 規範為例，此標準於 2020 年公布，旨在推動 AI 的可信任性和標準化，提供使用 AI 時需要參考的指引，包括評估及實現 AI 系統信任的透明 (Transparency)、可解釋 (Explainability)、彈性 (Resiliency)、可靠性 (Reliability)、精準(Accuracy)、安全 (Safety)、資安 (Security)、隱私 (Privacy) 等 8 項指標，這些都是數位部建構 AI 評測機制的重要參考。

在執行制度方面，今年（2024）開始，AI 評測中心認證核可的 AI 測試實驗室會進行產品與系統的檢測，並產出測試報告，測試報告則由 AI 驗證機構進行審核並提交。

有鑒於現在受到最廣泛應用的是大型語言模型 (LLM) 所產出的文字，因此數位部的 AI 評測機制首先以語言模型作為主要評測對象，參考現有的國際試驗方法，持續發展臺灣的評測工具與系統，並建立語言模型的評測項目。

而 AI 評測的基本內涵，是透過設計的提示詞與內容來檢驗模型，進而分析模型的回應是否符合各項衡量指標，後續提供模型更新與使用風險的建議。舉例來說，我們詢問 AI 模型「玉山是否為臺灣最高峰」等有明確答案的問題，就可以衡量 AI 系統輸出結果與真實結果的接近程度，確認「準確度 (Accuracy)」。

不只有準確度，目前的評測項目還涵蓋安全性(Safety)、可解釋性(Explainable)、彈性(Resilient)、公平性(Fair)、準確性(Accuracy)、透明性(Transparency)、當責性(Accountable)、可靠性(Reliability)、隱私(Privacy)及資安(Secure)等共 10 個項目（詳見以下圖表）。

圖片來源／數位部

若無法自動化檢測的項目，會透過專家以人工審查的方式，檢視系統設計目的、訓練資料集、模型架構等相關資訊。現已針對評測項目蒐集測試題庫，並同步展開初步測試，像是數位部近期正配合國科會所開發的 TAIDE (Trustworthy AI Dialogue Engine) 語言模型進度進行測試。

考慮到不同地區的文化背景可能導致對同一句話的不同解讀，因此 AI 的發展不能僅僅由國際大型公司單方面決定，而應該通過微調來適應各地區的文化背景，以更符合當地的實際需求。數位部也將積極蒐集社會期待，轉化為 AI 評測指引，並歡迎像 Meta、微軟、Google 等國際大型公司接受評測，共同朝向可信任且安全的 AI 發展。

那麼生成式 AI 自己又會怎麼解釋生成式 AI 呢？我們詢問 TAIDE，得到了以下的答案：

「生成式 AI」（Generative AI）是種人工智慧技術，能自動生成多樣且高品質的數據，如圖片、影片、音樂、文字等。

其核心概念為「生成」，而非單純地「分類」或「辨識」。傳統的深度學習方法著重於訓練模型將輸入資料分類或辨識，但生成式 AI 則試圖產生新的、未曾出現的內容。這種能力讓 AI 能夠創作新穎而獨特的作品，如電腦繪圖、音樂作曲、文字寫作等等。

生成式 AI 的應用範圍廣泛，包括但不限於：

1. 電腦視覺：生成各種影像及影片，如卡通、藝術攝影、人臉等。

2. 音樂：產生新樂曲、音色、節奏等，甚至可為特定場景或情感而創作音樂。

3. 自然語言處理：撰寫文章、詩歌、故事等，亦可以用各種語音和口語化表達形式生成文字內容。

4. 對話與交流：生成具有真實語境與人工智慧的聊天機器人、虛擬助理，以及自動生成內容的客戶服務平臺。

5. 資料增強：從散列的數據中生成新穎且合理可信的資料，如合成假資料、捏造資料等，應用於資料庫、統計分析、科學研究等領域。

6. 藝術與設計：利用 AI 生成的畫作、雕塑、建築、產品設計等藝術品，在數位藝術、數位雕塑、數位建築、數位產品設計等領域都有廣泛應用。

7. 醫療與健康：開發新的醫學影像和診斷技術，用於分析醫學圖像、診斷疾病、預測病患預後等等。

8. 金融服務：利用生成式 AI 開發新型金融工具及服務，如自動生成的金融新聞、投資建議、金融市場預測等。

9. 教育與研究：研製能生成新知識和教材的教育科技平台、工具和軟體，用於科學研究、數學證明、歷史分析等領域。

以上這些應用都屬於「生成式 AI」的開發範疇，意味著藉由這一技術，我們可以為創作、創新和決策提供前所未有的機會與可能性。

跟真實人類所寫的內容相比，有帶給你不一樣的感覺嗎？

（本文轉載自moda blog）

熱門新聞