关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02406人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

卫衣+半裙=早秋流行混搭套路,时髦极了!

Yuki女人故事 浏览 301 09-20

长和:董事会对巴拿马之裁定及相应行动表示强烈反对

每日经济新闻 浏览 203 02-04

行星探测工程天问二号任务将发射 任务周期长达九年半

扬子晚报 浏览 10301 05-27

久帅:看到国足积极的东西 王钰栋没到挑大梁的时候

网易体育 浏览 8831 07-13

高价墓地,突然卖不动了

智谷趋势 浏览 392 09-21

华为MateBook Pro电脑通过OpenHarmony 6.0 Release认证

IT之家 浏览 231 01-18

来不及减肥了?今夏这么穿巨显瘦,120轻松变90斤!

Yuki女人故事 浏览 6420 06-08

小米汽车,差点就盈利了

定焦One 浏览 458 08-20

深耕专业 以赛促评 2025寰球汽车年度车测评收官

网易汽车 浏览 255 01-03

低空经济起飞!含金量最高的通用航空ETF来了

新经济e线 浏览 6811 07-30

专家:高市早苗收敛了一贯对华强硬的鹰派色彩

北京日报客户端 浏览 266 11-01

核心产品已在轨数十台套,激光通信光传输链路解决方案提供商「聿凡领光」完成数千万元Pre-A轮融资|36氪首发

36氪 浏览 533 08-20

费东斌被免去国家铁路局局长职务

界面新闻 浏览 5195 07-04

向科米索的最后告别:富纳罗、费拉利、普拉德等人将在美国出席

绿茵情报局 浏览 253 01-21

男子为救人按断女子6根肋骨 女方丈夫:认他为异姓兄弟

潇湘晨报 浏览 208 01-29

面相苦的蓝盈莹,真的被低估了

人间颂 浏览 482 08-29

蔡卓妍林俊贤结婚,3枚婚戒超65万,男主搬入女方豪宅同居生活

素素娱乐 浏览 66 04-29

车企不敢!专家:希望推出伤亡率车型榜单,新能源车极端事故不多

小李车评李建红 浏览 246 11-25

董璇张维伊婚宴敬酒照、伴娘团曝光

文娱没有圈 浏览 2884 07-18

记者:米内罗与戴伟浚即将重返申花,谢鹏飞康复情况不错

懂球帝 浏览 462 08-20

秦煌如今过成这样只能算他活该?

一针见娱 浏览 302 10-13
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11