关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02203人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

仅一周董璇二婚老公就被扒干净,她又看走眼了?

桑葚爱动画 浏览 3595 07-23

点啥啥火,天风美女首席“吓得”散群!那些强得可怕的分析师们

深蓝财经 浏览 292 08-21

甘肃10余名幼儿铅中毒:因添加剂所致 有娃2年仅长2斤

中国新闻周刊 浏览 8165 07-05

户外博主被举报私采国家二级保护植物 警方已介入调查

封面新闻 浏览 338 08-21

俞敏洪宣布东方甄选旗下账号停播一天

三言科技 浏览 1881 07-25

中方是否计划承认阿富汗临时政府 外交部回应

澎湃新闻 浏览 1219 07-05

大瓜!宗庆后冒出三个私生子女,越扒越心凉!

财经要参 浏览 1406 07-14

牛弹琴:特朗普和普京突然宣布会晤 欧洲人大吃一惊

大象新闻 浏览 1563 08-08

《音乐缘计划2》优秀!各路大咖齐集

你我话娱乐 浏览 115 10-18

"股神"卷走4500万跑路了 发表宣言:给你们一个小教训

经济观察报 浏览 309 08-18

新款Apple TV 4K确认2025年底发布:性能升级,价格或下调

环球网资讯 浏览 6679 08-06

国安半场崩盘!狂丢4球0-4山东泰山,瓦科独造4球,池忠国遭戏耍

中超伪球迷 浏览 217 09-01

沈阳00后故意撞人猛踩油门下死手 身份被扒

鋭娱之乐 浏览 5457 08-14

94岁杨少华高温天气被推去剪彩,下午就去世了,家属评论区沦陷

萌神木木 浏览 8235 07-10

E句话 | 是哪个男明星偷卖甲方样机?

仙女事件簿 浏览 210 09-07

千百惠走了,《走过咖啡屋》停在成都街头

荧幕二三事 浏览 262 08-21

斯坦福大学研究称AI能被“人气”冲昏头脑,会逐渐出现不道德行为

IT之家 浏览 106 10-13

低血糖发作,太太太尴尬了!

网易健康 浏览 183 09-23

马斯克离开政府效率部一个月后 19岁成员也辞职

红星新闻 浏览 9697 06-26

中国男子在美移民拘留所被押5天 于淋浴间自缢身亡

看看新闻Knews 浏览 6890 08-11

半年时间,智己汽车生死突围

优视汽车 浏览 7221 07-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11