关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:0148人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

越南经历"最彻底一次变革" 地方政府已裁员2万人

中国新闻周刊 浏览 7066 07-11

关掉会员店、捆绑阿里会员 盒马需要换个活法

北京商报 浏览 9135 08-07

印度刚宣布对巴基斯坦"战果" 议会就吵翻了

参考消息 浏览 6349 08-11

美国出动核攻击潜艇 几天后将抵达委内瑞拉海岸

鲁中晨报 浏览 188 09-10

乌战争功臣沦为巨贪 一人5天前刚为前线士兵送无人机

中国新闻周刊 浏览 6975 08-08

35岁儿子的智力停在2岁 56岁单亲妈妈自驾带他游中国

潇湘晨报 浏览 37057 09-19

Grok正式登陆特斯拉 "脱缰模式"让车主上头

网易科技报道 浏览 6122 07-13

华熙生物辟谣称李振诽谤,3年内第4次遭内部人“举报”

野马财经 浏览 2651 07-27

包文婧产后做医美自曝没自信,不建议跟风

智凌纵横 浏览 247 08-19

气候中心预测:高温将成为今年美网最大难题!梅总:会有球员死掉

网球之家 浏览 4065 08-13

雷诺Symbioz姊妹车 三菱Grandis官图发布

车质网 浏览 931 07-04

特朗普与泽连斯基聊了40分钟 德国:愿采购美武器援乌

上观新闻 浏览 5820 07-05

300亿光伏巨头捷佳伟创,遭高管股东集体减持

侃见财经 浏览 196 09-09

中国石油公告:拟将5.41亿A股股份无偿划转给中国移动

红星新闻 浏览 190 09-03

琼瑶:要有尊严地与世界告别

网易健康 浏览 5911 12-05

美媒:艰难的101天后 日本学到了与美同盟的残酷一课

上游新闻 浏览 7429 07-14

去月球巡视探测?给“城市病”开处方?把这些问题交给AI和年轻人,行吗……

上观新闻 浏览 7282 07-27

马斯克承认其他车企不想获得特斯拉FSD授权:他们简直疯了

IT之家 浏览 43 11-25

鱼跃医疗:高管专职背后总经理却在关联方任职 孙公司或与原实控人“藕断丝连”

金证研 浏览 5018 07-18

注册制改革助力IPO业务稳定增长

证券市场周刊 浏览 184 09-10

队报:多纳鲁马对巴黎的续约条件不满意,俱乐部已做好离队的应对

直播吧 浏览 4786 07-25
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11