| AI | 語言模型 | 數學 | 邏輯推理
新數學基準測試FrontierMath凸顯AI模型邏輯推理進步空間極大
FrontierMath是針對評估人工智慧高階數學推理能力,而設計的數學基準測試,目前市面上知名模型的解題成功率低於2%
2024-11-13