关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02148人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

都体:图多尔考虑多种方案应对孔塞桑伤情,热格罗瓦或成变招

懂球帝 浏览 128 09-10

记者:沃特金斯十分愿意加盟曼联,5000万镑可能说服维拉放人

懂球帝 浏览 7315 07-30

美联储,重磅来袭!降息传出大消息

券商中国 浏览 97 09-22

两"虎"被处理:一人被指"靠石油吃石油"、搞钱色交易

扬子晚报 浏览 8605 07-31

德甲身价涨幅榜:奥利塞暴涨3000万第1,阿德耶米、于帕上榜

懂球帝 浏览 52 10-15

63岁丁克17年的梁朝伟,坦白在日本养老真实原因

温读史 浏览 117 09-19

她是国家一级女演员,多次给坐轮椅丈夫戴绿帽?

葡萄说娱 浏览 5752 07-13

贵州男子连续7个月排出"面条状" 绦虫 最长一条4米

极目新闻 浏览 122 09-15

消息称理想汽车新建算力资源部,原阿里干将龙开文领衔整合研发

IT之家 浏览 1463 07-15

前教练:伊尔迪兹一开始不愿踢足球,因为他那时在练习跆拳道

直播吧 浏览 3099 08-07

问界M8纯电版官宣8月发!死磕理想i8,谁更胜一筹?

电车通 浏览 3205 07-16

成龙满嘴谎话?却被兄弟公开指责吝啬人品差?

小娱乐悠悠 浏览 55 10-16

千万考公大军,要去海外卷了

虎嗅APP 浏览 9165 08-06

特朗普拿错剧本了?刚扬言要禁中国“地沟油”,就遭美媒啪啪打脸

北向财经 浏览 46 10-20

《野生世界》第四集《猩猩》登陆苹果Vision Pro,用户可免费观看

IT之家 浏览 5645 08-10

2025港姐三强颜值惹众怒

科学发掘 浏览 127 09-08

残暴!温网女单决赛首盘,斯瓦泰克仅耗时25分钟&6-0取胜!

直播吧 浏览 1118 07-13

饰演大脚娘迟蓬逛超市被偶遇 穿搭普通显年轻随和

鑫鑫说说 浏览 209 08-25

成本、效率差距太大!苹果短期不会在美国生产iPhone

快科技 浏览 295 08-11

记者:巴顿、谢维军和孙铭谦都做了核磁,孙铭谦至少歇10多天

懂球帝 浏览 63 10-02

记者:一旦确定无法签下伊萨克,利物浦将迅速推进埃基蒂克的转会

直播吧 浏览 2364 07-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11