就在3月1日,OpenAI公司正式推出了ChatGPT的付費API服務,而且提供的是媲美爆紅線上ChatGPT服務的3.5版NLP模型。這個不到2個月就吸引上億用戶註冊的殺手級應用,正式跨入了企業應用市場。ChatGPT不只搶進搜尋引擎戰場,現在進一步跨入更多企業對話式應用情境,例如搜尋、問答、客服、導覽、語音操控等等。
而且不只如此,提供合乎文法、彷彿真人撰寫般的內容,又有高度正確性的參考內容,是吸引上億用戶註冊的第一印象。這幾個月來,經常可以看到網路上各種ChatGPT如何可能的討論,文章重點整理、會議記錄整理、設計課程大綱、安排旅遊行程、解答學校作業、撰寫行銷文案、製作制式公文、整理文獻回顧都是輕而易舉,而對IT人而言,自動產生程式碼,甚至找出現有程式碼中可能的臭蟲,都是立即可見的好處。
甚至,只要給予更多更好的提示或者引導(prompt),就能修正,甚至引導ChatGPT產生的內容,越來越符合使用者預期的需求,這也催生了一個有趣的新角色「AI引導工程師」(Prompt Engineer)或者更詩意的說法是「AI詠唱者」,只要提問的問題問得好,就越能得到更貼切的答案,就算不是事實,但可能足以符合需求。
但是,在大量嘗試之中,大家也逐漸看到ChatGPT的侷限和問題,它所產生的回答,不見得是正確答案或者是事實,甚至有不少回答是憑空杜撰的造假內容,例如詢問2022年熱門書籍排行榜,這個超過ChatGPT資料搜集時限的問題,它多半還是會吐出一個有模有樣的十大書籍排名,只是每一本書都是憑空杜撰,從來沒有出現過的書名。
看似無所不能的解答,卻藏了不可知的假訊息,如何判斷真假,便落到了使用者的身上,也成了大家的痛點。
不過,值得注意的是,OpenAPI發表了一個新的腳本語言稱為ChatML(Chat Markup Language),可以用於撰寫ChatGPT的輸入資料(也就是提問),甚至不用人問,也可以靠ChatML語法產生一串,帶有各種引導(prompt)的提問。目前只公開了ChatML v0版預覽版。
這意味著,企業在ChatGPT API的對話應用中,將會有一個新的控制機制,可以將用戶的提問,再加上企業想要附加的限制引導(例如只針對自家企業,或特定產品的內容),來引導ChatGPT生成更符合企業情境需要的內容,這也是一種「事後客製化」的ChatGPT應用方式,不是透過調教ChatGPT模型,而是透過ChatML輸入引導指示(限制條件),來達到更聚焦企業目的的回應。目前已有幾家網路公司,開始用這個ChatGPT API打造自家的語音助理,例如Shopify用來提供顧客購物建議等。
對個人來說,8到9成正確的答案,是個可以容忍或者不用太擔心的小問題,但對企業來說,可能是一個大風險,如何控制風險,找到合適應用情境,才是大考驗,不只模型本身的品質,企業還會擔心上傳的資料是否會外流,是否合規等等企業才會面臨,而個人多半不在意的問題。
從OpenAPI對ChatGPT API服務的問答中,可以看到,在付費API推出後(也就是3月1日),OpenAPI就停止搜集使用者上傳的資料(也就是說,他們親口證實了之前上億用戶的問題,真的都在幫忙提供各種調校模型的訓練資料),從此,預設不再搜集用戶上傳的資料,(但用戶可選擇願意被使用)。但是,用戶上傳的問題,仍然會保留在OpenAI的伺服器上最多30天,作為濫用查核比對之用或法尊要求而保存,30天後就會刪除。
因為目前這些資料主要都儲存在美國資料中心,也就無法符合有些國家敏感資料無法出境的法遵要求,例如臺灣金融顧客資料要出境儲存得經過批准。而且,為了查核,OpenAI公司也事前聲明,將授權極少數人,在全程紀錄下,允許人工檢視用戶上傳的內容,這些上傳資料並非完全保密。這些資料基本面的侷限,是企業導入ChatGPT API前得先知道的事。
ChatGPT是一個新的魔杖,但不是無所不能的魔杖,企業應用場景不只在意它的「能」,但更需在意其所「不能」背後的挑戰和風險。
專欄作者
熱門新聞
2024-12-22
2024-12-20
2024-12-22