臉書(Facebook)近日宣布,該公司與卡內基美隆大學(Carnegie Mellon)所合作發展的人工智慧機器人Pluribus,已在無限注的賽局中,打敗了5名德州撲克專家,替AI技術立下新的里程碑。
德州撲克(Hold'em)與橋牌並列為全球最受歡迎的撲克衍生遊戲,每個參與者可被發到兩張一直到比賽結束才需公開的私牌,桌上則有5張公牌,玩家可利用手上的兩張牌與5張公牌找出牌值最大的5張牌,再與對手比較,勝出者可獲得所有的下注籌碼。
在德州撲克中,較勁的不只是牌運,還有牌值的機率與下注時的心理戰,過去已有AI能夠在德州撲克中擊敗單一對手,而Pluribus則是一次擊敗牌桌上的5名專家,當中還有兩名曾獲得「世界撲克大賽」(World Series of Poker)的冠軍,成為AI在德州撲克上的重大里程碑。
臉書表示,撲克(Poker)在數十年來一直是AI領域難以克服的挑戰,因為它涉及了許多隱藏的資訊,例如玩家並不知道對手手中的牌值,或者是必須在下注時虛張聲勢,這些規則都與西洋棋或圍棋等遊戲截然不同。
Pluribus除了利用新的網路搜尋演算法來評估可能的選項之外,也採用新的自我對奕(self-play)演算法來應付隱藏的資訊,相關技術讓Pluribus的訓練更有效率,只使用非常少的處理及記憶體資源,換算成雲端運算資源支出大約只要150美元。
Pluribus的特別之處在於它捨棄了雙人對奕所使用的零和博弈政策,而是建立一個能夠憑藉經驗持續擊敗眾多專家對手的AI;也創造出一個可察覺隱藏資訊並小心維持吹噓平衡的AI機器人。
有鑑於許多AI系統在與人類競賽時,可在一開始拔得頭籌,之後卻因被人類發現漏洞而落敗,研究人員讓這群德州撲克專家先觀察了Pluribus所進行的上千付牌,讓他們有時間找出漏洞並調整策略,不過Pluribus依舊能夠在6名玩家的牌桌上擊敗另外5名人類,使得研究人員亦將Pluribus稱之為「超人AI」(Superhuman AI)。
詳細的研究報告已經發表在《科學》(Science)期刊上。
熱門新聞
2024-11-29
2024-12-19
2024-11-20
2024-11-15
2024-11-15