关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02355人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

覆盖20-100万 鸿蒙智行携多款新车亮相成都车展

网易汽车 浏览 431 09-02

宝马M3旅行版正式上市 售价94.39万元

车质网 浏览 228 11-03

千亿梯媒巨头25亿巨额计提背后,监管“导火索”已引燃半年之久

野马财经 浏览 185 02-03

担心引发冲突,法国警方禁止巴黎圣日耳曼球迷前往马赛主场观赛

懂球帝 浏览 408 09-11

首搭3块图灵AI芯片 小鹏G7预售23.58万元

网易汽车 浏览 455 06-13

公开喊话 贾跃亭称FF愿与特斯拉展开合作

车质网 浏览 224 11-27

官方确认"1岁工作22岁退休"事件属实 已启动调查程序

扬子晚报 浏览 2230 07-17

九部门出手!2030年建成1万个“圈子”

国是直通车 浏览 378 09-20

洪森回击他信言论:奉陪到底 是佩通坦先对我进行侮辱

看看新闻Knews 浏览 4084 07-16

新疆喀纳斯有民宿挂牌价涨到4000元/晚 当地回应

上游新闻 浏览 4244 07-30

利好来袭!深夜,暴涨!

券商中国 浏览 378 09-10

怎么办,得了一种看见李维嘉就想笑的病!

时尚COSMO 浏览 324 08-31

歼-35"0001编号"战机亮相 喷涂英文缩写或量产出口

央视新闻客户端 浏览 56 05-09

疑被虫类叮咬 希腊航运巨头28岁女继承人在家中死亡

红星新闻 浏览 429 09-18

陈汉典回应吴宗宪炮轰小S,称他脑和嘴不同步,曝小S近状容光焕发

扒虾侃娱 浏览 7040 07-31

原配自杀、儿子残疾,再娶小12岁娇妻,难怪唐国强73岁还这么拼

不八卦会死星人 浏览 495 08-12

淘宝即将上线大会员体系:打通饿了么、飞猪、盒马

第一财经资讯 浏览 5724 08-06

90后宝妈网购猪食槽收纳孩子玩具走红 商家:订单超6倍

极目新闻 浏览 299 10-26

三星刚公布神秘代工大单 马斯克迫不及待爆料:和我签的!

财联社 浏览 4134 07-29

性压抑时代,搞黄色成了AI的第一生产力

虎嗅APP 浏览 225 01-19

摸吉祥物女演员胸部,前塞尔塔队长马略被判赔偿1000欧

懂球帝 浏览 208 12-05
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11