OpenAI發表對話最佳化語言模型ChatGPT,該模型能夠以對話的方式與使用者進行互動,對話的格式讓ChatGPT可以回答後續問題、承認錯誤、質疑不正確的前提以及拒絕不適當的要求。ChatGPT目前為研究預覽階段,供用戶免費試用。
ChatGPT能以對話的方式幫助使用者解決各種問題,像是開發人員可以貼一段存在臭蟲的程式碼,並且要求ChatGPT提供除錯方法,ChatGPT會利用對話與開發者互動詢問更多資訊,以提供具體有效的解法。當然用戶也可以跟ChatGPT討論有關費馬小定理,或是要求ChatGPT編寫一段跟鄰居自我介紹的文字,而ChatGPT會拒絕回答用戶,諸如侵入他人房子的方法等提問。
ChatGPT從GPT-3.5的模型微調而成,研究人員運用與之前訓練語言服務模型InstructGPT相同的方法,以人類回饋增強學習(RLHF)訓練該模型,但在資料收集配置上略作調整。ChatGPT仍存在一些限制,像是ChatGPT有時會寫出看似合理,但是不正確或荒謬的答案,研究人員解釋,主要原因有三個,除了在增強訓練時缺乏事實來源之外,訓練模型因為過度謹慎,可能會拒絕回答可以正確回答的問題,又或是在監督訓練時被誤導。
ChatGPT對輸入的措辭調整非常敏感,當用戶在查詢問題時,可以嘗試調整措辭或以相同提示多試幾次,當模型表示不知道答案,可能用戶只要稍微改寫句子,模型就能夠正確回答。
研究人員還提到,有時候ChatGPT的解釋會過度冗長或是不停重複部分詞語,像是一直重申他是由OpenAI訓練的語言模型,而原因來自訓練資料的偏差,因為人工智慧訓練者喜歡更全面且更長的回答,再加上常見的模型過度最佳化問題,讓ChatGPT出現重複語句的問題。在理想的情況,當用戶提出模稜兩可的查詢時,模型會提出問題試圖澄清查詢,但當前模型通常傾向猜測用戶的意圖。
另外,雖然OpenAI盡量讓ChatGPT能夠拒絕不當請求,但是ChatGPT有時候仍會回應有害指令或是出現偏見行為,研究人員以Moderation API來警告或阻擋特定類型的不安全內容,但是預期會有部分遺漏,他們會收集用戶回饋,並且改進該系統。
熱門新聞
2024-08-14
2024-12-20
2024-12-22
2024-12-24
2024-12-23