OpenAI開發能追問並拒絕不當要求的對話語言模型ChatGPT

OpenAI發表對話最佳化語言模型ChatGPT，該模型能夠以對話的方式與使用者進行互動，對話的格式讓ChatGPT可以回答後續問題、承認錯誤、質疑不正確的前提以及拒絕不適當的要求。ChatGPT目前為研究預覽階段，供用戶免費試用。

ChatGPT能以對話的方式幫助使用者解決各種問題，像是開發人員可以貼一段存在臭蟲的程式碼，並且要求ChatGPT提供除錯方法，ChatGPT會利用對話與開發者互動詢問更多資訊，以提供具體有效的解法。當然用戶也可以跟ChatGPT討論有關費馬小定理，或是要求ChatGPT編寫一段跟鄰居自我介紹的文字，而ChatGPT會拒絕回答用戶，諸如侵入他人房子的方法等提問。

ChatGPT從GPT-3.5的模型微調而成，研究人員運用與之前訓練語言服務模型InstructGPT相同的方法，以人類回饋增強學習（RLHF）訓練該模型，但在資料收集配置上略作調整。ChatGPT仍存在一些限制，像是ChatGPT有時會寫出看似合理，但是不正確或荒謬的答案，研究人員解釋，主要原因有三個，除了在增強訓練時缺乏事實來源之外，訓練模型因為過度謹慎，可能會拒絕回答可以正確回答的問題，又或是在監督訓練時被誤導。

ChatGPT對輸入的措辭調整非常敏感，當用戶在查詢問題時，可以嘗試調整措辭或以相同提示多試幾次，當模型表示不知道答案，可能用戶只要稍微改寫句子，模型就能夠正確回答。

研究人員還提到，有時候ChatGPT的解釋會過度冗長或是不停重複部分詞語，像是一直重申他是由OpenAI訓練的語言模型，而原因來自訓練資料的偏差，因為人工智慧訓練者喜歡更全面且更長的回答，再加上常見的模型過度最佳化問題，讓ChatGPT出現重複語句的問題。在理想的情況，當用戶提出模稜兩可的查詢時，模型會提出問題試圖澄清查詢，但當前模型通常傾向猜測用戶的意圖。

另外，雖然OpenAI盡量讓ChatGPT能夠拒絕不當請求，但是ChatGPT有時候仍會回應有害指令或是出現偏見行為，研究人員以Moderation API來警告或阻擋特定類型的不安全內容，但是預期會有部分遺漏，他們會收集用戶回饋，並且改進該系統。

網址：https://chat.openai.com/chat

熱門新聞