参考指南

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

支付宝上线语...

中国与巴西牵...

董璇前夫高云...

北京四中天才...

美称中美会谈...

牛弹琴：印度...

许家印出事前，只有他提前果断脱离恒大，至今毫发无损

攻防一体，张懿赵杰22分钟轰下27分6板5助4断助中国大胜蒙古

二次元“入侵”金饰，“痛金”带火黄金“谷子”

限时9.67万起吉利星越L/星瑞i-HEV智擎混动上市

高速暴雨引发山体滑坡封路十多个小时大货车被迫滞留

韩庚晒卢靖姗官宣生子！一家四口同框照好幸福

K联赛外援进球后跑去上厕所！韩媒计时：用时27秒09后他回到场内

特朗普第4次延长TikTok禁令宽限期至12月16日

苹果彻查iPhone 17 Pro褪色：问题机型已被回收

博洛尼亚官方：多明格斯恢复合练，贝尔纳代斯基伤缺2-3周

工信部399批新车曝光！这波王炸车型谁看了不心动？

黄仁勋现身北京？与雷军合影曝光

女子称骑车被外卖小哥撞伤本想私了：对方说只有3块钱

第二家盈利的新势力诞生！零跑上调全年销量目标至65万辆

杨洋《凡人修仙传》曝新物料，官微宣发都干冒烟了，上线应该不远

邱泽妈妈没想到这个女人竟把她儿子狠狠“拿捏”

瑞典主帅：科索沃赢得理所当然，他们表现更好，我们没能踢出水平

沈阳机床：重组标的评估范围现疑云总经理上任两年内控或存隐忧

骨龄提前、性早熟、代谢紊乱……肥胖很伤孩子身心！

拥有三家工厂的被拐女孩见到亲生父母：下跪求讨公道

春秋航空会为了卖毛毯把空调温度调低吗？

何晴去世后续：儿子出生户口不能上自己家

全国首创双流机场上线免费行李配送

苹果产能转移印度远未完成！900万部美版iPhone仍要“中国制造”