关闭广告

o1之后下一个范式?隐式CoT大突破,让推理不再「碎碎念」

机器之心Pro2026-02-02 12:00:01202人阅读



魏熙林为本篇文章第一作者。魏熙林是复旦大学博士生,师从林达华教授,研究兴趣主要集中在 multi-modal LLMs 和 efficient AI。目前在上海人工智能实验室实习,指导 mentor 是臧宇航、王佳琦。

今天推荐一个 Implicit Chain-of-Thought(隐式推理) 的最新进展 ——SIM-CoT(Supervised Implicit Chain-of-Thought)。它直击隐式 CoT 一直「扶不起来」的核心痛点:隐式 token 一旦 scale 上去,训练就容易塌缩到同质化的 latent 状态,推理语义直接丢失。

SIM-CoT 的关键招式是一个 plug-and-play 的 step-level 监督模块:训练时用辅助解码器把每个 latent token「拉回」到可对齐的推理步骤上,既稳住优化、避免 collapse,又让隐式推理第一次真正可解释 —— 你甚至能把每个 latent token 解码成人类可读的中间推理步骤。

更爽的是:推理阶段零额外开销(辅助解码器训练完就丢),但效果却很猛:在 GPT-2 上相

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

佩通坦社媒发文:满怀感谢 将全身心投入反对党工作

上观新闻 浏览 431 09-07

推广中奖名单-更新至2025年12月15日推广

黎贝卡的异想世界 浏览 222 12-27

哈根达斯或“卖身” 梦龙独立运营 冰淇淋市场格局生变?

中国商报 浏览 6125 08-06

鸡尾酒会里如何听清朋友说话?清华大学揭秘语音分离的终极奥秘

科技行者 浏览 416 08-28

错过靳东,嫁给父亲看中的女婿,如今她怎么样了

楠楠自语 浏览 233 10-28

中国罕见亮战略底牌 大国重器同时亮相让美认清一现实

空天力量 浏览 3631 08-04

印度与俄罗斯宣布:加强稀土合作

参考消息 浏览 1852 08-09

滴滴、曹操出行等集体官宣:下调!

环球网资讯 浏览 448 08-23

被许家印坑得最惨的大佬,资产清零了

大猫财经Pro 浏览 198 11-06

给整懵了!胡尔克笑着和裁判交流,主裁突然给了他一张黄牌

直播吧 浏览 1802 07-25

温州鞋王急抛百亿疫苗帝国

网易财经 浏览 1984 07-18

3场0球!1.7亿欧熊皇断崖式下滑:扔水瓶回击阿隆索 金球奖害了他

风过乡 浏览 328 09-21

俄方要求乌克兰作出重大领土让步

鲁中晨报 浏览 8960 08-11

走过五年黑暗隧道后,江小白靠一瓶酒杀回来

财经无忌 浏览 229 01-21

口腔内的“神秘斑纹”是什么?

网易健康 浏览 4448 04-18

共和党议员反水!特朗普支持的加密监管法案遭遇重大挫败,众议院表决失败

华尔街见闻官方 浏览 4780 07-16

遭指控侵犯专利 "非洲之王"传音控股又被华为告了

每日经济新闻 浏览 8608 08-07

董璇丈夫又作又黏人!众人齐叹张维伊“老奶狗”

手工制作阿歼 浏览 5944 07-29

一路走好!歌手千百惠因病离世,享年62岁,黄安发讣告证实

扒虾侃娱 浏览 454 08-21

龚琳娜首谈离婚原因:纠缠太牢,是喜离

小嵩 浏览 8540 07-23

降价超5000万 《三十而已》取景地二拍无人出价流拍

澎湃新闻 浏览 492 09-08
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11