| LeMA | 開源LLM

研究人員使用錯誤中學習的人類學習法來訓練AI模型

研究人員提出從錯誤中學習(Learning from Mistake)的LeMA訓練法,以提升開源LLM在數學解題等推理任務上的效能

2023-11-06