圖片來源: 

Google DeepMind

Google DeepMind上周公布具備2種思維模式的系統框架,可讓AI代理人(agent)能兼具快、慢思考的效益。

現有大型語言模型能以自然語言和使用者互動,具有二種能力,包括對話和規劃/思考。DeepMind團隊設計的一種由雙系統組成的Talker-Reasoner代理人框架,能同時執行對話及多步驟推理任務,一如由以色列諾貝爾經濟學家Daniel Kahneman提倡的「快思慢想」(之後也被翻譯成多國語言版本,包括繁中版)的人類一樣。

DeepMind設計的雙系統代理人框架中,系統1 Talker LLM能執行快速、直覺及合成語言回應,負責感知觀察外界、獲得用戶回應,並且以自然對話和用戶互動。系統2 Reasoner LLM負責解決複雜的問題,這牽涉從外界取得資訊增強其知識,像是呼叫工具、從外部資料庫獲取資訊。相較Talker LLM的快速回應,Reasoner的運行更為緩慢、深刻及具邏輯性,包含多階段推理和規劃、呼叫、執行行為等動作。Talker和Reasoner之間經由共同記憶體互動。Reasoner獲得知識後,除了執行行為,也更新其(記憶體中的)知識信仰,並提供Talker產生新的說話內容。在接獲使用者互動輸入問題時,Talker可以以現有知識為基礎、提供直覺回應,也可以等待Reasoner代理人產出知識,延遲回應使用者。

DeepMind團隊利用Gemini 1.5 Flash設計出包含雙系統AI代理人,在測試中,讓該系統扮演使用者睡眠指導顧問,在聽取使用者說明後,提供改善睡眠的建議。研究團隊發現,系統在「理解」使用者問題階段,其代理人(Talker)直覺化、流暢回應使用者,但當Reasoner未能理解其指導是哪個階段時,會提供較直覺化而無用的建議。例如使用降噪窗帘及隔音板。為解決此問題,研究團隊加入「指導」階段說明,Talker一旦讀取到指導階段時,就會等待Reasoner提供的資訊,而非直覺回應用戶。這時系統2就取得主導,而非只給系統1產出的回應,例如為房間換顏色柔和的壁紙。

研究人員指出,本研究是首個使用雙系統的代理人,欲改善其效用,未來可以讓Talker-Reasoner框架中的Talker自動判斷是否加入System 2的資訊作為回應,或是System 2加入更多Reasoner,以多元化其輸入的記憶資訊。

熱門新聞

Advertisement