ChatGPT的能與不能

就在3月1日，OpenAI公司正式推出了ChatGPT的付費API服務，而且提供的是媲美爆紅線上ChatGPT服務的3.5版NLP模型。這個不到2個月就吸引上億用戶註冊的殺手級應用，正式跨入了企業應用市場。ChatGPT不只搶進搜尋引擎戰場，現在進一步跨入更多企業對話式應用情境，例如搜尋、問答、客服、導覽、語音操控等等。

而且不只如此，提供合乎文法、彷彿真人撰寫般的內容，又有高度正確性的參考內容，是吸引上億用戶註冊的第一印象。這幾個月來，經常可以看到網路上各種ChatGPT如何可能的討論，文章重點整理、會議記錄整理、設計課程大綱、安排旅遊行程、解答學校作業、撰寫行銷文案、製作制式公文、整理文獻回顧都是輕而易舉，而對IT人而言，自動產生程式碼，甚至找出現有程式碼中可能的臭蟲，都是立即可見的好處。

甚至，只要給予更多更好的提示或者引導（prompt），就能修正，甚至引導ChatGPT產生的內容，越來越符合使用者預期的需求，這也催生了一個有趣的新角色「AI引導工程師」（Prompt Engineer）或者更詩意的說法是「AI詠唱者」，只要提問的問題問得好，就越能得到更貼切的答案，就算不是事實，但可能足以符合需求。

但是，在大量嘗試之中，大家也逐漸看到ChatGPT的侷限和問題，它所產生的回答，不見得是正確答案或者是事實，甚至有不少回答是憑空杜撰的造假內容，例如詢問2022年熱門書籍排行榜，這個超過ChatGPT資料搜集時限的問題，它多半還是會吐出一個有模有樣的十大書籍排名，只是每一本書都是憑空杜撰，從來沒有出現過的書名。

看似無所不能的解答，卻藏了不可知的假訊息，如何判斷真假，便落到了使用者的身上，也成了大家的痛點。

不過，值得注意的是，OpenAPI發表了一個新的腳本語言稱為ChatML（Chat Markup Language），可以用於撰寫ChatGPT的輸入資料（也就是提問），甚至不用人問，也可以靠ChatML語法產生一串，帶有各種引導（prompt）的提問。目前只公開了ChatML v0版預覽版。

這意味著，企業在ChatGPT API的對話應用中，將會有一個新的控制機制，可以將用戶的提問，再加上企業想要附加的限制引導（例如只針對自家企業，或特定產品的內容），來引導ChatGPT生成更符合企業情境需要的內容，這也是一種「事後客製化」的ChatGPT應用方式，不是透過調教ChatGPT模型，而是透過ChatML輸入引導指示（限制條件），來達到更聚焦企業目的的回應。目前已有幾家網路公司，開始用這個ChatGPT API打造自家的語音助理，例如Shopify用來提供顧客購物建議等。

對個人來說，8到9成正確的答案，是個可以容忍或者不用太擔心的小問題，但對企業來說，可能是一個大風險，如何控制風險，找到合適應用情境，才是大考驗，不只模型本身的品質，企業還會擔心上傳的資料是否會外流，是否合規等等企業才會面臨，而個人多半不在意的問題。

從OpenAPI對ChatGPT API服務的問答中，可以看到，在付費API推出後（也就是3月1日），OpenAPI就停止搜集使用者上傳的資料（也就是說，他們親口證實了之前上億用戶的問題，真的都在幫忙提供各種調校模型的訓練資料），從此，預設不再搜集用戶上傳的資料，（但用戶可選擇願意被使用）。但是，用戶上傳的問題，仍然會保留在OpenAI的伺服器上最多30天，作為濫用查核比對之用或法尊要求而保存，30天後就會刪除。

因為目前這些資料主要都儲存在美國資料中心，也就無法符合有些國家敏感資料無法出境的法遵要求，例如臺灣金融顧客資料要出境儲存得經過批准。而且，為了查核，OpenAI公司也事前聲明，將授權極少數人，在全程紀錄下，允許人工檢視用戶上傳的內容，這些上傳資料並非完全保密。這些資料基本面的侷限，是企業導入ChatGPT API前得先知道的事。

ChatGPT是一個新的魔杖，但不是無所不能的魔杖，企業應用場景不只在意它的「能」，但更需在意其所「不能」背後的挑戰和風險。

ChatGPT的能與不能

專欄作者

熱門新聞