| LeMA | 開源LLM
研究人員使用錯誤中學習的人類學習法來訓練AI模型
研究人員提出從錯誤中學習(Learning from Mistake)的LeMA訓練法,以提升開源LLM在數學解題等推理任務上的效能
2023-11-06