参考指南

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

A股股民已超...

网友称38年...

对话松延动力...

22记三分浇...

沃尔13年N...

吴京出品的新...

我是谁我在哪？热火官方把米切尔的旅游照玩坏了！

印度航空发表坠机声明坠毁航班号为AI171

媒体：联手东盟、日韩中国正为下一轮对美谈判做准备

仅一周董璇二婚老公就被扒干净，她又看走眼了？

点啥啥火，天风美女首席“吓得”散群！那些强得可怕的分析师们

甘肃10余名幼儿铅中毒:因添加剂所致有娃2年仅长2斤

户外博主被举报私采国家二级保护植物警方已介入调查

俞敏洪宣布东方甄选旗下账号停播一天

中方是否计划承认阿富汗临时政府外交部回应

大瓜！宗庆后冒出三个私生子女，越扒越心凉！

牛弹琴：特朗普和普京突然宣布会晤欧洲人大吃一惊

《音乐缘计划2》优秀！各路大咖齐集

＂股神＂卷走4500万跑路了发表宣言：给你们一个小教训

新款Apple TV 4K确认2025年底发布：性能升级，价格或下调

国安半场崩盘！狂丢4球0-4山东泰山，瓦科独造4球，池忠国遭戏耍

沈阳00后故意撞人猛踩油门下死手身份被扒

94岁杨少华高温天气被推去剪彩，下午就去世了，家属评论区沦陷

E句话 | 是哪个男明星偷卖甲方样机？

千百惠走了，《走过咖啡屋》停在成都街头

斯坦福大学研究称AI能被“人气”冲昏头脑，会逐渐出现不道德行为

低血糖发作，太太太尴尬了！

马斯克离开政府效率部一个月后 19岁成员也辞职

中国男子在美移民拘留所被押5天于淋浴间自缢身亡

半年时间，智己汽车生死突围