关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:0144人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

72岁林凤娇近照认不出?

扶苏聊历史 浏览 190 09-09

一见倾心!东风全新SUV定妆图曝光,颜值气场并存

网易汽车 浏览 272 05-25

古利特:皇马3个前锋无球时做的太少,贝林厄姆成为受害者

懂球帝 浏览 14 12-11

小米推“空调十年免费包修”,格力朱磊:空调不用修才是实力,先把11万辆车修好

红星资本局 浏览 172 09-21

跟队:安迪-迪乌夫加盟国米后年薪将会达到200万欧元

懂球帝 浏览 267 08-22

还是不高!新赛季NBA的国际球员买断费上限为87.5万美元

直播吧 浏览 5534 08-13

美女克拉拉官宣离婚,6年豪门婚姻告终

代军哥哥谈娱乐 浏览 113 10-18

乌设计师透露:泽连斯基见特朗普可能不会穿西服

澎湃新闻 浏览 289 08-19

幻方量化员工“亿元返佣”背后:券商与量化私募的隐秘关联被揭开一角

界面新闻 浏览 8568 08-09

2200亿央企将换届,总裁已空缺半年,人均薪酬约26万元

华美财经 浏览 234 08-24

安琪酵母投15亿元补产能缺口

北京商报 浏览 32 11-25

特朗普政府正在讨论收购英特尔约10%股份

界面新闻 浏览 277 08-20

清华大学推出RLinf-VLA:让机器人在虚拟世界中自学成才的新框架

科技行者 浏览 47 11-11

铂爵旅拍爆雷,李佳琦卷入「烂尾」风波

豹变 浏览 8755 07-25

12月首发 俄罗斯“星链”上天 将帮助俄军精准控制无人机

红星新闻 浏览 178 09-19

我发现朋友圈吸引人的女生,都有这个特点!

Yuki女人故事 浏览 150 08-31

长沙一盲道被护栏分割成"迷宫" 街道:为人车分流安装

潇湘晨报 浏览 4273 08-09

俄罗斯深夜不宣而战轰炸波兰使馆 波兰被打懵了

青青子衿 浏览 203 10-02

为何姜文的作品,同样的配方结局却天差地别?

温酒听风 浏览 282 08-11

葡萄牙前国脚保莱塔:若热-科斯塔永远活在葡萄牙人的记忆里

懂球帝 浏览 9445 08-07

特朗普再发最后通牒:限俄罗斯在12天内达成和平协议

财联社 浏览 8703 07-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11