关闭广告

研究人员提出OThink-R1,让大模型自行决定是否需要深度思考

DeepTech深科技2025-09-02 00:00:02402人阅读

近日,浙江大学硕士生张盛佳和所在团队发现:深度推理模型的部分推理过程是不必要的。一方面,目前的深度推理模型在面对一些例如“1+1=?”的简单问题时,也需要大费周章地进行深度思考。而人类在面对诸如此类的简单问题时,往往能够凭直觉给出答案;另一方面,在一些简单任务上(例如,常识问答和小学生数学题),即使不具有深度推理能力的大模型也能取得较好的效果。本次研究基于所观察到的现象提出了一种解决方案,使得深度推理大模型在解决问题时,能够自行决定是否进行深度思考,有利于计算资源更加合理的分配,提升大模型的推理效率。


图 | 张盛佳(来源:张盛佳)

据介绍,受限于数据与算力的规模,预训练以 Transformer 为基础架构的大模型所带来的收益正在不断式微。那么,该如何进一步提升大模型的能力?近来,以 DeepSeek-R1、OpenAI o1 为代表的深度推理大模型突破了预训练 Scaling Law 的限制,通过增加测试时计算资源的投入,在多种复杂任务上取得了优异的效果。与非深度推理大模型相比,深度推理大模型通过模仿人类进行深度思考,能够更加准确地理解用户的需求,更加深入地分析用户提出的问题。

然而,目前的深度推理

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美将向部分签证申请者收取最高1.5万美元保证金

浏览 100296 10-13

内地男子在澳门搭讪女子 带回酒店抢劫并拍裸照威胁

南方都市报 浏览 397 08-15

儿女都是债,58岁茹萍风光背后也难逃辛酸!

安山客 浏览 1881 07-18

网传 TP-LINK 芯片部门全员解散,知情人士回应

IT之家 浏览 345 09-21

男子组织多名未成年失足女飞多地卖淫 让女友发避孕套

红星新闻 浏览 438 09-20

见好就收?年末基金“攻守战”,基金经理操作不一

券商中国 浏览 225 12-02

特朗普:俄乌总统应该会面 否则可能会有“严重后果”

界面新闻 浏览 327 08-26

2.7亿买下“徐翔家族”实控的宁波中百1888万股,拍卖刚结束股价就闪崩

红星资本局 浏览 283 10-22

绍兴地铁事故遇难者家属拒透露赔偿额:我们签过"那个"

大象新闻 浏览 408 10-01

豪华映后+绝美周边,终于盼来这个影展!

幕味儿 浏览 9156 07-31

单眼皮、矮个子、微胖,停止焦虑!普通女孩的美丽指南请收好

Yuki女人故事 浏览 153 12-20

印度坠毁战机为“美洲虎” 两名飞行员均已遇难

扬子晚报 浏览 2023 07-11

为什么说燃油车依旧能打,上汽奥迪给出了答案

澎湃新闻 浏览 2279 08-06

特朗普:乌克兰不该"挑战比自己大十倍的国家"

环球时报国际 浏览 558 08-21

富士展示“无镜头相机”:光学器件与AI算法重构图像

IT之家 浏览 244 11-11

孩子少吃糖就不会坏牙?

网易健康 浏览 9821 03-21

欧锦赛三重奏:约基奇冲冠,字母哥突围,东契奇独行

体坛周报 浏览 493 08-24

茅台投资SpaceX是假,投资它是真

一点财经 浏览 189 02-04

增持回购潮背后的A股信心

北京商报 浏览 211 11-25

比亚迪唐 L 全系车型获 OTA 升级

IT之家 浏览 5847 08-06

埃及成立危机委员会应对以伊冲突影响

国际在线 浏览 9092 06-18
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11