关闭广告

ByteDance团队新突破:让AI学会像人类一样反思错误并自我纠正

科技行者2025-09-21 00:00:02158人阅读


这项研究来自复旦大学和字节跳动种子项目团队的合作,主要研究者包括复旦大学的袁思语、西志恒、叶俊杰,以及字节跳动的陈泽辉、杜正银、陈洁曹等。论文于2025年3月发表,感兴趣的读者可以通过项目主页https://github.com/bytedance/Agent-R获取完整论文和相关代码。

当你在做一道复杂的数学题时,如果发现第三步算错了,你会怎么办?大多数人会停下来,反思哪里出错了,然后从错误的地方重新开始。但是,如果你是一个AI助手,面对类似的情况,你可能会一条道走到黑,即使发现路走偏了也不知道如何回头。

这正是当前AI智能体面临的一个核心难题。就像一个只会按照食谱一步步操作却不懂得品尝调味的厨师,现有的AI助手虽然能够执行复杂的任务序列,但一旦在中途犯错,它们往往无法及时发现并纠正,最终导致整个任务失败。

研究团队发现了一个有趣的现象:训练AI助手通常采用的方法是让它们学习专家的完美示例,这就像让学生只看标准答案而不练习改错一样。表面上看起来很有效,但在真实世界中,这些AI助手一旦遇到问题就束手无策,因为它们从来没有学过如何从错误中恢复。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美媒模拟4队交易:詹皇父子去骑士组三巨头 加兰赴湖人联手东契奇

醉卧浮生 浏览 4937 07-28

笔在手中,镜头是新墨水

上观新闻 浏览 64 11-04

柯淳公开向关晓彤表白,鹿晗躺枪

草莓解说体育 浏览 177 09-21

梅努的哥哥现身老特拉福德,衣服上写着“给科比-梅努自由”

懂球帝 浏览 6 12-16

真我售后网点增至 815 家,GT8 Pro 将是同档“最香”旗舰机

IT之家 浏览 105 10-21

雷克萨斯产品大变动 全新IS将于2026年亮相

车质网 浏览 10160 08-04

AI股现“冰火两重天”

国际金融报 浏览 278 08-20

19岁女大学生失联超过90天 家属称“每一天都是煎熬”

极目新闻 浏览 163 09-14

爱诗科技完成6000万美元B轮融资 阿里领投

网易科技报道 浏览 172 09-10

Netflix砍掉手机投屏功能:官方称“提升体验”,用户骂声一片

IT之家 浏览 36 12-02

乌克兰外交部称美国军援已恢复

界面新闻 浏览 6482 07-12

股价翻倍高管减持,累亏50亿的迪哲医药离盈利还有多远?

市值Observation 浏览 208 09-09

杨幂“咽2口吃播”:明星极致自律的健康隐忧

巧妹电影 浏览 28 12-05

WTT欧洲大满贯瑞典站:孙颖莎/王曼昱3-0完胜对手,晋级女双八强

直播吧 浏览 269 08-21

白宫:特朗普愿同金正恩不设前提条件对话

参考消息 浏览 230 10-02

NASA叫嚣美国"一定会在中国之前登月" 前局长当众拆台

枢密院十号 浏览 248 09-15

韩媒:金元足球崩塌&短期归化失败 东亚杯再次让中国足球陷入绝望

直播吧 浏览 5917 07-13

盒马败走会员店,转向下沉市场

21世纪经济报道 浏览 6539 08-06

彩虹-7高空高速隐身无人机成功首飞 实现重大突破

新京报 浏览 13 12-15

普京发出警告:北约欺人太甚 再不收手迟早遭俄核打击

空天力量 浏览 4616 07-24

XREAL启用上海浦东全球总部,明年推出首款Android XR系统AR眼镜

IT之家 浏览 84 10-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11