关闭广告

清华大学提出NHA:让AI语言模型既快又准的"双重记忆"新架构

科技行者2025-11-11 00:00:01248人阅读


这项由清华大学杜举森、胡佳熹、张涛教授,上海人工智能实验室孙维高研究员,以及香港中文大学程余教授共同完成的研究发表于2025年10月的arXiv预印本平台,论文编号为arXiv:2510.07019v1。有兴趣深入了解的读者可以通过该编号查询完整论文。

当你使用ChatGPT或其他AI语言模型时,有没有想过它是如何记住你前面说过的话的?就像人类既有短期记忆又有长期记忆一样,AI模型也需要处理眼前的信息和遥远的上下文。但现有的AI模型在这方面存在一个两难问题:要么像传统的Transformer模型一样记住所有细节但速度极慢,要么像线性模型一样速度很快但容易忘记重要信息。

研究团队提出了一种名为"原生混合注意力"(Native Hybrid Attention,简称NHA)的全新架构,巧妙地解决了这个难题。这就好比给AI配备了一套"双重记忆系统":一个像照相机一样精确记录最近发生的事情,另一个像日记本一样压缩保存长期的重要信息。更巧妙的是,这套系统能够根据当前需要自动决定更多地依赖哪种记忆,而不需要人工设定固定的规则。

传统的混合模型通常是将两种不同的注意力机制分别计算,

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

A股上市行第二位80后行长来了!44岁王亮任职资格获批,出任苏农银行行长

时代周报 浏览 113 04-10

特朗普:已与普京就结束俄乌冲突方式基本达成共识

财联社 浏览 375 08-16

腾讯集团高级副总裁郭凯天:坚持智能向善,构筑人与AI的信任机制

上游新闻 浏览 280 11-09

多个卖点对比特斯拉Model 3,11.38万元就有激光雷达,零跑B01上市

时代周报 浏览 6142 07-25

陈天桥AI公司MiroMind连续登顶全球未来预测基准,称要打造全球最好的预测大模型

网易科技报道 浏览 351 09-21

高市早苗当选日本首相 曾叫嚣“台湾有事日本必入”

极目新闻 浏览 314 10-22

王中磊夫妇转战短视频,影视一哥到底怎么了?

BT财经 浏览 168 12-02

官方:尤文签下曼城19岁前锋奥博阿夫沃多,球员将加入新一代

懂球帝 浏览 210 02-03

“血月”将至!9月8日凌晨,年度重磅月全食来袭丨天问

封面新闻 浏览 421 09-01

官方:米兰签下热那亚后卫德温特;据悉转会费2000万欧

懂球帝 浏览 9031 08-14

罗体:凯泽斯劳滕主场安装假鸟模型,避免鸽子太多造成鸽粪污染

直播吧 浏览 6947 07-27

美国航空一客机发动机起火返航 无人受伤

上观新闻 浏览 806 06-26

李刚仁:很高兴代表巴黎出战100场比赛,希望继续保持状态

懂球帝 浏览 231 11-10

当年霍震霆给儿子霍启刚挑儿媳妇,眼光多毒啊

小光侃娱乐 浏览 222 11-17

特朗普挥关税大棒强索格陵兰岛 冯德莱恩正式回应

新华社 浏览 196 01-19

官方:2010年状元约翰-沃尔退役,结束14年NBA生涯

懂球帝 浏览 481 08-20

上海实验室推出AI智能体"安全卫士":让机器人学会自我监督

科技行者 浏览 222 01-29

国家医保局:职工医保个人账户跨省共济今年全国覆盖

商业观察杂志社 浏览 174 03-03

美媒:杨瀚森展现出身体和技术的结合 让人想到约基奇申京大小加

直播吧 浏览 4356 07-18

有专家称中国与伊朗达成协议以保护中国航运 中方回应

外交部网站 浏览 626 08-12

初秋的维希格,难怪赫本喜欢

Yuki女人故事 浏览 448 08-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11