关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01251人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

有偶像包袱别演戏!《沉默的荣耀》于和伟干饭,打脸多少假吃演员

娱乐圈笔娱君 浏览 297 10-12

姚明将在今年开始正式领取NBA退休金,每月可领约1.3万人民币

懂球帝 浏览 329 10-13

山东99-75战胜宁波 球员评价:3人优秀,5人及格,2人低迷

篮球资讯达人 浏览 220 01-28

以军称地面攻势要打数月 以防长:加沙正在燃烧

新华社 浏览 343 09-18

莫雷托:尤文已收到英超俱乐部对萨沃纳的口头报价

懂球帝 浏览 1667 08-07

短剧泛滥成灾,燃起观众热潮与烦恼

喜欢历史的阿繁 浏览 222 01-06

一代国民神车谢幕 比亚迪宋PLUS低调退市

车质网 浏览 246 01-08

王楚钦夺冠颁奖!张本无表情,王楚钦开心接奖杯,整发型帅气自拍

篮球资讯达人 浏览 6006 07-14

澎湃新闻总裁、总编辑刘永钢:变革是一场没有终点的征程

澎湃新闻 浏览 7219 07-25

理想汽车:上周销量0.55万辆

三言科技 浏览 1691 08-06

李娜×新狮铂拓界:源于价值理念的同频共振

网易汽车 浏览 235 11-27

新长安现任全体董事、高管增持:每人不低于30万元

红星资本局 浏览 4403 08-12

汇聚超千项前沿成果,第八届长三角科技成果交易博览会开幕

蓝鲸新闻 浏览 277 10-16

泽连斯基:乌克兰已准备好结束俄乌冲突

环球网资讯 浏览 315 10-22

泽连斯基:乌克兰需要“明确的安全保障”

新华社 浏览 1013 08-12

泽连斯基:乌克兰计划2027年加入欧盟

财联社 浏览 193 01-28

那些含金量十足的大师赛,都有德约的身影!

网球之家 浏览 234 01-07

柳州市委书记:违建轻轨透支人民信任 教训极其深刻

扬子晚报 浏览 522 08-21

高云翔晒与女儿合拍视频,父女合作好温馨

心静物娱 浏览 419 08-24

跑男兄弟六年后再聚,昔日友情重现

断翼的鸟儿 浏览 385 09-09

中国稀土集团、蚂蚁集团辟谣

中新经纬 浏览 506 08-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11