
DeepMind持續改進人工智慧的數學能力,數學推理模型AlphaGeometry2在解決國際數學奧林匹亞(IMO)幾何題目上的表現,已正式超越金牌選手的平均水準。研究團隊測試了2000至2024年間所有IMO幾何題,AlphaGeometry2以84%的解題成功率大幅超越前代系統AlphaGeometry1的54%,並且研究團隊挑出難度更高的IMO Shortlist幾何題子集IMO-AG-30,AlphaGeometry2成功解出全部題目,展現人工智慧在數學推理領域的突破性能力。
這項研究來自DeepMind的數學與人工智慧團隊,核心技術結合了語言模型與符號推理系統,透過強化學習與增強搜尋演算法,讓人工智慧能夠更有效率地善用輔助線、拆解問題並建立完整的幾何證明。
新版本擴展了AlphaGeometry的幾何領域語言,使其更能夠處理複雜的幾何問題,包括軌跡定理(Locus Theorem)、線性方程式與非建構性命題(Non-Constructive Problem Statement),能夠形式化處理,也就是可以讀懂IMO幾何題的比例從66%提升至88%。同時,運算引擎的效能也大幅提升,透過C++重新實作符號處理機制,並最佳化規則集,使推理過程更為精確與高效。
在測試結果中,AlphaGeometry2對IMO幾何題的解題能力,已達專業數學競賽選手的水準,甚至在部分問題的解法上展現超越人類的創造力。DeepMind研究團隊表示,這項技術突破不僅是數學解題系統的進展,也使人工智慧在形式化推理、自動證明與教育應用開啟新的可能性。
傳統的數學自動推理技術主要仰賴代數運算與計算機代數系統(CAS),例如Wu's Method或Gröbner Bases,透過將幾何問題轉換為代數聯立方程式來求解,而AlphaGeometry2採用了更貼近人類解題方式的合成幾何推理方法,並透過語言模型驅動推導過程,使其能夠從自然語言描述的題目中建構完整的證明。
目前的研究仍有部分限制,AlphaGeometry2無法處理變數點數(Variable Number of Points)、不等式與非線性方程式的幾何問題,這些類型的題目在IMO中雖然不常見,但仍然是自動幾何推理領域尚未解決的挑戰。此外,部分涉及投影幾何(Projective Geometry)與幾何反轉(Inversion)的問題,仍然超出系統現有能力範圍,研究團隊認為,未來透過更高效的問題拆解策略與強化學習機制,能夠進一步縮小這些差距。
熱門新聞
2025-03-25
2025-03-26
2025-03-27
2025-03-25
2025-03-21
2025-03-24