当前位置：首页 > 人工智能 > 正文

微软“从错误中学习” AI 训练方法推出

2023-11-08 08:59:55　来源：IT之家　

　　11月8日讯：微软亚洲研究院联合北京大学、西安交通大学等高校，提出了一项名为“从错误中学习（Learning from Mistake，LeMA）”的 AI 训练方法，号称可以通过模仿人类学习知识的过程，来改进 AI 推理能力。

　　当下 OpenAI GPT-4 和谷歌 aLM-2 等大语言模型在自然语言处理（NLP）任务，及思维链（chain-of-thought，CoT）推理的数学难题任务中都有不错的表现。

　　但例如 LLaMA-2 及 Baichuan-2 等开源大模型，在处理相关问题时则有待加强。为了提升开源这些大语言模型的思维链推理能力，研究团队提出了 LeMA 方法。这种方法主要是模仿人类的学习过程，通过“从错误中学习”，以改进模型的推理能力。

　　IT之家发现，研究人员的方法是使用一对包含“错误解答”与“修正后正确答案”的数据来微调相关模型。为取得相关数据，研究人员收集了 5 个不同大语言模型（包括 LLaMA 及 GPT 系列）的错误答案和推理过程，再以 GPT-4 作为“订正者”，提供修正后的正确答案。

　　据悉，修正后的正确答案中包含三类信息，分别是原推理过程中错误片段、原推理过程出错的原因、以及如何修正原方法以获得正确答案。

　　研究人员采用 GSM8K 及 MATH，来测试 LeMa 训练法对 5 个开源大模型的效果，结果显示，以改进过的 LLaMA-2-70B 为例，在 GSM8K 的准确率分别为 83.5% 及 81.4%，在 MATH 则分别为 25.0% 及 23.6%。

原标题：微软推出 “从错误中学习” 模型训练法，号称可“模仿人类学习过程，改善 AI 推理能力”

免责声明： IT商业新闻网遵守行业规则，本站所转载的稿件都标注作者和来源。 IT商业新闻网原创文章，请转载时务必注明文章作者和来源“IT商业新闻网”，不尊重本站原创的行为将受到IT商业新闻网的追责，转载稿件或作者投稿可能会经编辑修改或者补充，如有异议可投诉至：post@itxinwen.com

微信公众号：您想你获取IT商业新闻网最新原创内容，请在微信公众号中搜索“IT商业网”或者搜索微信号：itxinwen，或用扫描左侧微信二维码。即可添加关注。

标签：

品牌、内容合作请点这里： 寻求合作 ››

榜单

今日推荐

微软“从错误中学习” AI 训练方法推出

微软“从错误中学习” AI 训练方法推出

相关阅读RELEVANT

榜单

今日推荐

科技互联