| AI | 語言模型 | 數學 | 邏輯推理

新數學基準測試FrontierMath凸顯AI模型邏輯推理進步空間極大

FrontierMath是針對評估人工智慧高階數學推理能力,而設計的數學基準測試,目前市面上知名模型的解題成功率低於2%

2024-11-13