参考指南

近日，浙江大学硕士生张盛佳和所在团队发现：深度推理模型的部分推理过程是不必要的。一方面，目前的深度推理模型在面对一些例如“1+1=？”的简单问题时，也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时，往往能够凭直觉给出答案；另一方面，在一些简单任务上（例如，常识问答和小学生数学题），即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案，使得深度推理大模型在解决问题时，能够自行决定是否进行深度思考，有利于计算资源更加合理的分配，提升大模型的推理效率。

图 | 张盛佳（来源：张盛佳）

据介绍，受限于数据与算力的规模，预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么，该如何进一步提升大模型的能力？近来，以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制，通过增加测试时计算资源的投入，在多种复杂任务上取得了优异的效果。与非深度推理大模型相比，深度推理大模型通过模仿人类进行深度思考，能够更加准确地理解用户的需求，更加深入地分析用户提出的问题。

然而，目前的深度推理

研究人员提出OThink-R1，让大模型自行决定是否需要深度思考

两架执飞韩国...

阿里领投爱诗...

双良节能：从...

2025款深...

沃尔沃全新X...

《定风波》：...

中戏否认闫学晶儿子读新疆班，官方发文打假闫学晶！

欧盟最新放话：若俄不赔偿乌损失其被冻结资产别要了

经常感觉emo？吃这6类食物有助改善心情

美将向部分签证申请者收取最高1.5万美元保证金

内地男子在澳门搭讪女子带回酒店抢劫并拍裸照威胁

儿女都是债，58岁茹萍风光背后也难逃辛酸！

网传 TP-LINK 芯片部门全员解散，知情人士回应

男子组织多名未成年失足女飞多地卖淫让女友发避孕套

见好就收？年末基金“攻守战”，基金经理操作不一

特朗普：俄乌总统应该会面否则可能会有“严重后果”

2.7亿买下“徐翔家族”实控的宁波中百1888万股，拍卖刚结束股价就闪崩

绍兴地铁事故遇难者家属拒透露赔偿额:我们签过＂那个＂

豪华映后+绝美周边，终于盼来这个影展！

单眼皮、矮个子、微胖，停止焦虑！普通女孩的美丽指南请收好

印度坠毁战机为“美洲虎” 两名飞行员均已遇难

为什么说燃油车依旧能打，上汽奥迪给出了答案

特朗普：乌克兰不该＂挑战比自己大十倍的国家＂

富士展示“无镜头相机”：光学器件与AI算法重构图像

孩子少吃糖就不会坏牙？

欧锦赛三重奏：约基奇冲冠，字母哥突围，东契奇独行

茅台投资SpaceX是假，投资它是真

增持回购潮背后的A股信心

比亚迪唐 L 全系车型获 OTA 升级

埃及成立危机委员会应对以伊冲突影响