关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02117人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

AMD 锐龙 Zen5 TR PRO 处理器和 AI PRO R9700 显卡 23 日起发售

IT之家 浏览 1985 07-18

理想i6“涨价”:现金减免从1万元调整为5000元

电动知家 浏览 11 10-28

在OpenAI上班有多卷?离职员工爆料:7周打造Codex,每天熬到凌晨

机器之心Pro 浏览 5202 07-21

30年期美债拍卖稳健,美国国内需求为记录第三高

华尔街见闻官方 浏览 846 07-11

红色16号来袭,开拓者官方晒杨瀚森新赛季定妆照

懂球帝 浏览 3674 07-17

弗兰克:要做到攻守平衡,巴黎是欧洲最佳但热刺希望赢得欧超杯

直播吧 浏览 7619 08-12

刘晓曙:净息差收窄,银行怎么办

首席经济学家论坛 浏览 1298 07-27

季度净利润首超百亿 小米集团公布2025Q1财报

网易汽车 浏览 213 05-28

马斯克遭特斯拉股东集体起诉 本人怒斥发起律师"人渣"

红星新闻 浏览 1373 08-07

方媛顶孕肚和闺蜜逛街菲佣紧跟 郭富城赠无限额卡

娱乐团长 浏览 153 09-08

国乒全体弃赛!雨果&张本美和领衔出战巴西球星赛,总奖金215万

乒谈 浏览 5004 07-30

中国移动成出海“赋能者”,聚星计划覆盖5000+伙伴

雷科技 浏览 29 10-21

20万级还有大空间 尚界H5官图首曝/秋季上市

网易汽车 浏览 1269 07-15

smart的野心:从小众到主流的扩张之路

网易汽车 浏览 180 09-02

外卖大战的第一个“受害者”出现了?

凤凰WEEKLY财经 浏览 4526 07-16

特种机梯队:海军空军新型特种支援力量首次集体亮相

新华社 浏览 148 09-04

口腔黏膜在"求救"?专家教你自检

网易健康 浏览 4648 03-21

华为,搞了个大动作

米筐投资 浏览 134 09-01

"大六座"深蓝S09预售火爆斩获2.1万订单

网易汽车 浏览 189 06-10

14家银行信用卡余额半年“缩水”2000亿,有卡民7张信用卡销掉6张

第一财经资讯 浏览 181 09-02

张惠妹决定无限期停工,只为陪伴88岁母亲

红星新闻 浏览 140 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11