关闭广告

DeepSeek连发两篇论文背后,原来藏着一场学术接力

机器之心Pro2026-01-16 12:00:01210人阅读



编辑|张倩、陈陈

2026 年 1 月过半,我们依然没有等来 DeepSeek V4,但它的模样已经愈发清晰。

最近,DeepSeek 连发了两篇论文,一篇解决信息如何稳定流动,另一篇聚焦知识如何高效检索。

第一篇论文(mHC)出来的时候,打开论文的人都表示很懵,直呼看不懂,让 AI 助手用各种方式讲给自己听。我们也翻了翻网友的讨论,发现理解起来比较透彻的办法其实还是要回到研究脉络,看看这些年研究者们是怎么接力的。要理解第二篇论文(Conditional Memory)也是如此。

于是,我们就去翻各路研究者的分析。这个时候,我们发现了一个有意思的现象:DeepSeek 和字节 Seed 团队的很多工作其实是存在「接力」的 ——mHC 在字节 Seed 团队 HC(Hyper-Connections)的基础上进行了重大改进;Conditional Memory 则引用了字节 Seed 的 OverEncoding、UltraMem 等多项工作。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

4名中老年人自驾误入青海无人区失联 网友发帖救一命

极目新闻 浏览 4632 07-30

我国成功发射巴基斯坦遥感卫星01星

我们的太空 浏览 6233 07-31

美国发射洲际弹道导弹 俄方回应

央视新闻客户端 浏览 311 11-06

万马股份:上半年净利润增长21.8% 具身机器人线缆项目量产落地

览富财经网 浏览 489 08-20

甲骨文涨40% 埃里森财富单日增千亿美元

每日经济新闻 浏览 33568 09-11

63岁北大才子重拾美国管线,丹诺医药能否上市“止渴”?

阿尔法工场 浏览 4744 08-07

极石汽车1月交付新车1028台 拓宽海外业务

网易汽车 浏览 201 02-02

哈马斯证实其军事领导人辛瓦尔已死亡

极目新闻 浏览 346 08-31

时隔10年重回2万亿,大A在释放什么信号?

花朵财经 浏览 7912 08-07

外媒:菲律宾从乌克兰引进无人艇 以在南海对抗中国

枢密院十号 浏览 332 09-17

以军已停止在加沙地带军事行动

财联社 浏览 258 10-10

"孪生兄弟"歼-35、歼-35A亮相九三阅兵

南方都市报 浏览 391 09-04

31岁男子在地下车库不幸遇害 家属:嫌疑人是他发小

极目新闻 浏览 535 08-21

蚂蚁集团开发的超级机器人大脑:让机器人像人一样学会做任何事

科技行者 浏览 210 01-29

新冠感染再抬头,会持续多久?

网易健康 浏览 2856 05-17

梅德维德夫晋级中网男单八强

体坛周报 浏览 269 09-29

"入室抢婴案"主犯获死缓后当庭破口大骂 要提出上诉

上游新闻 浏览 481 09-20

“烟管裤”今年冬天爆火,怎么搭都时髦!

LinkFashion 浏览 214 12-19

近期A股的增量资金来自哪里?

菜鸟理财 浏览 470 08-12

索尼计划出售通信芯片部门:价值3亿美元,半导体重点放在图像传感器领域

超能网 浏览 5531 07-30

这一次,窦骁和何超莲都救不了对方

娱乐圈笔娱君 浏览 262 10-23
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11