关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02405人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

F1车队积分榜:迈凯伦324分优势领跑,法拉利第二、梅赛德斯第三

直播吧 浏览 334 09-01

小鹏汇天两架演练飞行器相撞 回应称间距不足

南方都市报 浏览 323 09-17

燃油车天要塌了!国产固态电池宣布量产,充电6分钟跑1000km

小李车评李建红 浏览 481 06-14

索尼 PS6 游戏主机曝料:24GB 内存,Zen 6 CPU + RDNA 5 GPU

IT之家 浏览 6812 07-25

比亚迪元PLUS高功率版曝光 电机功率增至230千瓦

网易汽车 浏览 312 10-10

报道:哈塞特势头不稳,特朗普一些亲信推举沃什当美联储主席

华尔街见闻官方 浏览 217 12-16

特朗普的"欧洲朋友"们集体访美 马克龙透露谈判内容

红星新闻 浏览 461 08-19

所以《All Her Fault》,其实都是“他的错”?

时尚COSMO 浏览 160 12-03

东体:斯卢茨基看淡争冠形势 足协杯后吴曦脚背内外总共缝了五针

直播吧 浏览 2452 07-28

图片报:多特改造厨房花费1100万欧,类似原因使今夏转会预算有限

直播吧 浏览 1308 08-06

奥特曼的“印钞机”与“吞金兽”:OpenAI年化营收超200亿美元背后的豪赌

澎湃新闻 浏览 232 01-20

iPhone将放弃L异形电池!苹果终于悟了,国产手机笑了

雷科技 浏览 4887 08-07

B/R评湖人21世纪总统山:OK+大加+老鱼!评论区都在为老詹叫屈!

直播吧 浏览 449 08-26

打破观众人数纪录!官方:美网混双共有78000名球迷到场观看

直播吧 浏览 448 08-22

罗德里:我不是梅西,不能一回来就让球队不断赢球

懂球帝 浏览 411 09-01

不等了,下周见!

博闻财经 浏览 364 09-21

业主卖房被"降价"逼疯:有中介直接提客户预算低120万

中国新闻周刊 浏览 4332 07-22

穆雷透露与德约结束合作的真正原因和感想:执教顶尖球员很难

网球之家 浏览 4305 07-18

意媒:米兰只愿意为弗拉霍维奇支付1000万至1200万欧转会费

懂球帝 浏览 5187 07-30

女子买"载重3吨"电三轮改摩旅房车 发现载重仅200公斤

大风新闻 浏览 535 08-26

偶像光环碎了!朱孝天曝F4私下无联系,患病后只想多赚钱给老婆

娱乐白名单 浏览 9481 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11