关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02409人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

限时9.67万起 吉利星越L/星瑞i-HEV智擎混动上市

网易汽车 浏览 44 05-02

高速暴雨引发山体滑坡 封路十多个小时大货车被迫滞留

大风新闻 浏览 1986 07-23

韩庚晒卢靖姗官宣生子!一家四口同框照好幸福

一只番茄鱼 浏览 234 10-24

K联赛外援进球后跑去上厕所!韩媒计时:用时27秒09后他回到场内

直播吧 浏览 1227 07-22

特朗普第4次延长TikTok禁令宽限期至12月16日

第一财经日报 浏览 303 09-18

苹果彻查iPhone 17 Pro褪色:问题机型已被回收

快科技 浏览 301 10-24

博洛尼亚官方:多明格斯恢复合练,贝尔纳代斯基伤缺2-3周

懂球帝 浏览 85 04-22

工信部399批新车曝光!这波王炸车型谁看了不心动?

大象新闻 浏览 374 09-11

黄仁勋现身北京?与雷军合影曝光

网易科技报道 浏览 1806 07-15

女子称骑车被外卖小哥撞伤本想私了:对方说只有3块钱

极目新闻 浏览 3442 07-21

第二家盈利的新势力诞生!零跑上调全年销量目标至65万辆

国际金融报 浏览 493 08-20

杨洋《凡人修仙传》曝新物料,官微宣发都干冒烟了,上线应该不远

最爱酷影视 浏览 2781 07-22

邱泽妈妈没想到 这个女人竟把她儿子狠狠“拿捏”

黄小仙的搞笑视频 浏览 229 12-02

瑞典主帅:科索沃赢得理所当然,他们表现更好,我们没能踢出水平

直播吧 浏览 420 09-09

沈阳机床:重组标的评估范围现疑云 总经理上任两年内控或存隐忧

金证研 浏览 7738 08-07

骨龄提前、性早熟、代谢紊乱……肥胖很伤孩子身心!

网易健康 浏览 3201 03-04

拥有三家工厂的被拐女孩见到亲生父母:下跪求讨公道

扬子晚报 浏览 8991 07-13

春秋航空会为了卖毛毯把空调温度调低吗?

快刀财经 浏览 373 09-02

何晴去世后续:儿子出生户口不能上自己家

古希腊掌管月桂的神 浏览 237 12-15

全国首创 双流机场上线免费行李配送

红星新闻 浏览 431 08-22

苹果产能转移印度远未完成!900万部美版iPhone仍要“中国制造”

快科技 浏览 300 10-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11