Meta研究開發具有談判、說服和合作能力的人工智慧CICERO,CICERO如同Deep Blue和AlphaGo等人工智慧一樣,是在遊戲中進行試驗,CICERO能夠遊玩策略遊戲《外交》webDiplomacy.net,與其他人類玩家以自然語言溝通,甚至是說服其他玩家結盟,最終取得遊戲勝利,並進入遊戲參與者排名前10%。

《外交》這款遊戲過去被認為是人工智慧難以克服的挑戰,因為需要掌握理解其他玩家的動機和觀點,並制定複雜的計畫以自然語言與其他人類玩家達成協議,在過程中還需要不斷調整策略,最終建立夥伴關係和聯盟。研究人員提到,CICERO具有非常好的溝通能力,導致人類玩家偏好與CICERO合作,而非其他人類參與者。

與國際象棋和圍棋等遊戲不同,《外交》需要處理的不是遊戲規則本身,而是與其他玩家的關係,因此要能在遊戲中獲得勝利,CICERO需要能夠辨識其他玩家的虛張聲勢,或是避免無意做出會被其他玩家視為具攻擊性的行動,否則可能很快就會輸掉遊戲,而且CICERO還需要像真人玩家一樣對話,表現出同理心、建立關係並且談論遊戲,才能找到願意一起合作的玩家。

CICERO的貢獻在於,能夠交叉運用人工智慧兩個不同領域的技術,綜合戰略推理和自然語言處理贏得遊戲,CICERO有能力在《外交》遊戲的後期,推論出需要某個特定玩家的支持,然後制定策略獲得該玩家信任,甚至是從該玩家的角度找出風險與機會,以提高說服該玩家結盟的機率。

在《外交》遊戲中,與其他玩家交談比移動棋子的方法還要重要,CICERO具清楚且有說服力溝通,能制定短中長期的策略,像是在立即要求一名玩家提供支援的同時,說服另一名玩家在遊戲後期結盟,CICERO能夠說明為什麼這些玩家要跟他合作,這個行為如何能夠互利互惠,CICERO還會一邊收集資訊,替未來的行動奠定基礎。但CICERO仍然有一些需要改進的部分,像是可能會產生與行動不一致的對話。

CICERO在《外交》的試驗,展示在合作和競爭遊戲中,以目標為導向的對話系統,解決人工智慧與人類在達成共同目標上,所出現的社交和技術挑戰,《外交》提供了一個環境,讓利益衝突的玩家相互搏鬥,並將複雜的目標轉成自然語言,像是玩家可能會選擇在短期利益上妥協以維持盟友,並希望該盟友在下一回合幫助他們進入更好的位置。

Meta現在開源CICERO程式碼,讓其他研究人員可以繼續相關的研究,CICERO也採用零樣本分類對話模型,監測和刪除有害的對話訊息。

熱門新聞

Advertisement