关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02171人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

54岁王琳自曝家丑:被17岁儿子打到牙出血!

小张帅 浏览 9525 07-21

阿曼外交大臣:原定15日举行的伊美谈判取消

上观新闻 浏览 3489 06-15

杜兰特:超巨不在于名号而在于表现 我想一直打球直到再也打不动

罗说NBA 浏览 108 10-21

“私募一哥”A股清零,大恒科技再临十字路口

每日资本论 浏览 101 10-13

“苏超”MVP范厚泰:感恩亚泰,感恩泰州,感恩“苏超”平台

懂球帝 浏览 51 11-05

山姆上架好丽友,为何让中产集体破防?

IC实验室 浏览 4030 07-18

数学界顶流陶哲轩缺钱了!美国留不住人,中国这次能捡个大宝贝吗

首席商业评论 浏览 184 09-11

少林寺回应NBA球星文班亚马"剃发闭关":人确实在寺里

界面新闻 浏览 9771 06-10

为减少对华稀土依赖 美国又盯上电子垃圾回收

澎湃新闻 浏览 2537 07-15

国际空间站2030年退役,多个商业项目或接棒,NASA将迎来“后空间站时代”

环球网资讯 浏览 181 09-10

布莱克莫尔:曼联应签回德赫亚,当年滕哈赫赶走他是个错误

直播吧 浏览 643 07-18

董璇二婚VS孙怡单身:杨幂那句结果都那样的含金量还在上升

飘雨桐 浏览 306 08-11

华为鸿蒙 HarmonyOS 6.0.0.107 SP7 / SP5 Developer 版本发布

IT之家 浏览 111 10-15

佩通坦:感谢泰国国王将父亲他信刑期从8年减至1年

环球网资讯 浏览 195 09-10

陈道明主演!36集谍战剧来袭,是《沉默的荣耀》后我唯一想追的剧

娱乐圈笔娱君 浏览 92 10-22

共和党议员反水!特朗普支持的加密监管法案遭遇重大挫败,众议院表决失败

华尔街见闻官方 浏览 4557 07-16

医美并购的“朗姿教训”

阿尔法工场 浏览 4209 07-24

大学毕业生干1天保安被开除 在地铁"发泄式演讲"3分钟

北青深一度 浏览 7498 07-12

硬抢1.5亿用户!短视频之后,中国下一个流量战场被引爆

网易科技报道 浏览 262 08-19

《朝雪录》刚播热度破9000,口碑出炉,观众评价出奇的一致

娱乐圈笔娱君 浏览 2207 07-15

这些才是气质女人喜欢的穿搭!以裙子为主、色彩柔和,好高级

静儿时尚达人 浏览 205 09-09
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11