DeepMind公布整合2種思維模式的Talker-Reasoner AI代理人框架

圖片來源:

Google DeepMind

Google DeepMind上周公布具備2種思維模式的系統框架，可讓AI代理人（agent）能兼具快、慢思考的效益。

現有大型語言模型能以自然語言和使用者互動，具有二種能力，包括對話和規劃／思考。DeepMind團隊設計的一種由雙系統組成的Talker-Reasoner代理人框架，能同時執行對話及多步驟推理任務，一如由以色列諾貝爾經濟學家Daniel Kahneman提倡的「快思慢想」（之後也被翻譯成多國語言版本，包括繁中版）的人類一樣。

DeepMind設計的雙系統代理人框架中，系統1 Talker LLM能執行快速、直覺及合成語言回應，負責感知觀察外界、獲得用戶回應，並且以自然對話和用戶互動。系統2 Reasoner LLM負責解決複雜的問題，這牽涉從外界取得資訊增強其知識，像是呼叫工具、從外部資料庫獲取資訊。相較Talker LLM的快速回應，Reasoner的運行更為緩慢、深刻及具邏輯性，包含多階段推理和規劃、呼叫、執行行為等動作。Talker和Reasoner之間經由共同記憶體互動。Reasoner獲得知識後，除了執行行為，也更新其（記憶體中的）知識信仰，並提供Talker產生新的說話內容。在接獲使用者互動輸入問題時，Talker可以以現有知識為基礎、提供直覺回應，也可以等待Reasoner代理人產出知識，延遲回應使用者。

DeepMind團隊利用Gemini 1.5 Flash設計出包含雙系統AI代理人，在測試中，讓該系統扮演使用者睡眠指導顧問，在聽取使用者說明後，提供改善睡眠的建議。研究團隊發現，系統在「理解」使用者問題階段，其代理人（Talker）直覺化、流暢回應使用者，但當Reasoner未能理解其指導是哪個階段時，會提供較直覺化而無用的建議。例如使用降噪窗帘及隔音板。為解決此問題，研究團隊加入「指導」階段說明，Talker一旦讀取到指導階段時，就會等待Reasoner提供的資訊，而非直覺回應用戶。這時系統2就取得主導，而非只給系統1產出的回應，例如為房間換顏色柔和的壁紙。

研究人員指出，本研究是首個使用雙系統的代理人，欲改善其效用，未來可以讓Talker-Reasoner框架中的Talker自動判斷是否加入System 2的資訊作為回應，或是System 2加入更多Reasoner，以多元化其輸入的記憶資訊。

熱門新聞