关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01250人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

深耕跨境金融服务 宁波银行打造护航企业出海“标杆”

阿尔法工场 浏览 4785 07-16

影后再不努力,名气就被13岁帅儿子赶超了

Yuki女人故事 浏览 345 09-27

北约谈格陵兰岛问题渲染"中国威胁" 外交部回应

新华社 浏览 238 01-23

半导体大厂竞逐3D IC

爱集微 浏览 890 07-13

韩版Galaxy S26独享,三星Exynos 2600芯片被曝难以走向全球

IT之家 浏览 221 12-05

媒体:王毅三年来首次访问印度 头衔值得注意

新民周刊 浏览 490 08-19

赖清德只字不提台湾光复 还在公然纪念"古宁头战役"

海峡导报社 浏览 307 10-27

曾拒演电影遭骂,怼王家卫"我不喜欢",王传君凭啥被刮目相看?

娱乐白名单 浏览 1487 07-31

媒体:特朗普拟对中国起重机加征关税 美国港口慌了

澎湃新闻 浏览 6815 07-11

抖音电商,再动真格

虎嗅APP 浏览 343 09-22

男团奋勇剑指卫冕!王楚钦抢五过关 林诗栋完胜 梁靖崑完全觉醒

颜小白的篮球梦 浏览 38 05-09

摩萨德总部“陷入火海” 德黑兰多地遭到摧毁

环球网资讯 浏览 1621 06-18

NBA战报:灰熊141-125热火,阿德巴约23分

懂球帝 浏览 312 10-18

芝麻开门,中概股逆流潮来了

每日资本论 浏览 513 08-11

内娱又一个女明星,「疯」了

独立鱼 浏览 5473 08-06

镁伽科技IPO:三年亏23亿,现金流告急,理想主义难敌现实?

博望财经 浏览 4239 07-17

买家和特朗普抢时间 原本运往中国的铜也在转向美国

澎湃新闻 浏览 6112 07-11

公安机关将会同有关部门进一步加强“智能驾驶”规范管理

经济观察报 浏览 726 07-24

媒体人:玉昆接近签约前浙江队主帅乔迪,还相中一名巴西前腰

懂球帝 浏览 220 11-25

连平:民营经济高质量发展将带来哪些机遇?如何加快推动?

首席经济学家论坛 浏览 7819 08-07

意媒:罗马正在评估引进斯特林的可行性,可能提出租借方案

懂球帝 浏览 223 01-29
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11