DeepMind發表了一項名為Mind Evolution的技術,透過結合大型語言模型與演化式搜尋方法,解決傳統方法在自然語言規畫與推理任務,所存在的效率與準確性瓶頸。該研究展示在不需將問題形式化(Formalize)為數學模型的前提下,運用語言模型直接處理複雜問題,並獲得極佳的解決能力。

目前大型語言模型在處理複雜自然語言規畫與推理任務存在限制,特別是在需要滿足多重約束或隱含條件的情境中,例如旅行規畫或行程安排。傳統方法如單次生成(1-Pass)、最佳解搜尋(Best-of-N)或逐步修正(Sequential Revision),雖能提供一定程度的解法,但往往受限於局部搜尋的瓶頸,同時,許多問題很難形式化為明確的數學模型,進一步限制了傳統求解器的應用範圍。

Mind Evolution研究特別針對如旅行規畫、行程安排及隱寫術生成(Steganography)等高難度的自然語言任務進行測試。結果顯示,Mind Evolution技術在TravelPlanner與Natural Plan基準測試的成功率在95%至100%間,遠遠超過傳統的最佳解搜尋與逐步修正策略。而且Mind Evolution在處理這些問題時,不需要透過專門的數學求解器或手動格式化問題描述,展現其應用的靈活性與實用性。

Mind Evolution的核心在於其類基因演算法的演化式搜尋策略,結合隨機探索與深度最佳化,完成候選解的生成、重組與改進。該方法不僅能在短時間內大幅提升解決問題的準確性,還能應對自然語言描述中隱含的約束與需求。DeepMind研究團隊強調,此技術的優勢在於可藉由一個全域的解答評估器對解法進行全面評估,不需要逐步檢查每個中間推理步驟,進而大幅降低了運算成本。

在技術細節上,Mind Evolution採用了類基因演算法的概念,包括候選方案的生成與改進、多次迭代的全域評估,以及模擬島嶼模型以維持候選方案的多樣性。研究結果顯示,結合語言模型的方法能有效改進候選方案,並透過模型間的互動提升整體解法品質。

此外,這篇研究還提出了一個新的基準測試任務StegPoet,用以檢測在自然語言生成中隱藏資訊的能力。該任務要求生成一段故事或詩句,同時將訊息隱藏於其中,經實驗證明,Mind Evolution在此類高度創造性的任務中,也展現出色的效能。

語言模型複雜推理與自然語言規畫的能力仍有巨大的進步空間,而Mind Evolution結合演化式搜尋與語言模型的方式,不僅能克服局部最佳解的挑戰,還能在不依賴問題形式化的前提下,大幅提升解決複雜自然語言任務的效率與成功率,為語言模型推理能力的提升提供新的研究方向。

熱門新聞

Advertisement