关闭广告

清华大学发现:AI教学方法决定死记硬背或真正理解

科技行者2025-09-21 00:00:02357人阅读


这项由香港大学、加州大学伯克利分校以及谷歌DeepMind等顶尖机构联合进行的研究发表于2025年第42届国际机器学习大会(ICML),研究团队由朱天哲、翟越翔等多位学者共同完成。有兴趣深入了解的读者可以通过项目主页https://tianzhechu.com/SFTvsRL获取完整论文信息。

想象你面前有两个孩子在学数学,一个死记硬背乘法表,考试时只要题目稍有变化就抓瞎;另一个真正理解了乘法原理,遇到新题型也能触类旁通。这就是当前AI训练中的一个根本性问题——我们的AI到底是在"死记硬背"还是在"真正学习"?

长期以来,训练AI就像教育孩子一样,主要有两种方法:一种叫做监督微调(SFT),就像传统的填鸭式教育,给AI看大量标准答案,让它模仿;另一种叫做强化学习(RL),更像启发式教育,让AI在尝试中学习,做对了给奖励,做错了给惩罚。但是这两种方法哪种更能让AI真正"开窍",一直是个未解之谜。

研究团队就像教育专家一样,设计了精巧的实验来探究这个问题。他们创建了一个类似"算24点"的数学游戏,给AI四张卡片,让它用加减乘除算出24这个数字。更巧妙的是,他们还设计了不同

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

时髦又清凉5组造型,夏天通勤穿刚好

Yuki女人故事 浏览 4397 06-14

尤文客战热那亚:伊尔迪兹、孔塞桑、戴维首发,马里奥出战

懂球帝 浏览 373 09-01

赛季末巴黎频造新大师,这次小黑能一黑到底吗?

网球之家 浏览 285 11-03

努力恢复!阿劳霍:今年你们将看到我的巅峰状态

直播吧 浏览 3689 07-15

小鹏G7增程版登陆工信部 助推大电池增程新景象

网易汽车 浏览 371 09-12

卷上天的新能源厂商,销量却被燃油车背刺了

虎嗅APP 浏览 377 10-14

票房破19亿!漫威退下来3位演员,联手拍R级片,给老东家上了一课

皮皮电影 浏览 337 09-19

宗庆后私生子起诉宗馥莉!娃哈哈要变天了?

创业家 浏览 2186 07-15

iPhone 17量产郑州富士康招工 求职者:3个月能赚2万多

每日经济新闻 浏览 514 08-21

跟队记者:尤文未来几小时恢复穆阿尼谈判,尽可能接近巴黎的要价

直播吧 浏览 900 07-17

每体:多支球队有意但卡萨多想留队竞争,巴萨将在几天内和他面谈

直播吧 浏览 407 08-22

伊朗民众:伊朗不会屈服于美国霸权

极目新闻 浏览 199 02-01

E句话|戴军自曝为前任买房后惨遭分手?

仙女事件簿 浏览 39 05-09

时隔25年,上一个时代的“英伟达”终于涨回来了

华尔街见闻官方 浏览 215 12-11

美洲杯:4人禁赛多米尼加男篮险胜尼加拉瓜 3胜0负C组第一进八强

醉卧浮生 浏览 418 08-26

非法移民拘留地"鳄鱼恶魔岛"启用特朗普亲临 白宫发声

每日经济新闻 浏览 9693 07-03

今日热点:许光汉否认和周子瑜恋情;郝熠然与诚实一口终止合作……

伊周潮流 浏览 79 04-18

女子提前半月出发蹭3000公里免费高速遭网暴:开心就好

极目新闻 浏览 465 10-02

美国CIA公开招募中国间谍 国家安全部回应

央视新闻 浏览 4744 06-25

俄外长支持中国为乌提供安全保障 俄学者:西方怕极了

澎湃新闻 浏览 599 08-23

遇见上合 共享津彩|上合峰会新闻中心的奇妙时刻

上观新闻 浏览 435 09-01
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11