| AGI | ARC-AGI-2 | 推理能力 | 效率評估 | LLM

新一代基準測試ARC-AGI-2登場,挑戰AI的推理效率與通用能力

ARC釋出新一代AGI基準測試ARC-AGI-2,作為衡量人工智慧通用能力與效率的標準,並揭示現行推理模型在少樣本情境下仍難以即時適應新任務

2025-03-25