关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:018948人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

26款丰田皇冠陆放上市:新增黑金色,28.48万起

IT之家 浏览 308 10-19

铠侠推出目前最大容量固态硬盘:企业级 LC9 新增 245.76TB 版本

IT之家 浏览 6941 07-22

特朗普专机飞越纽约上空时 险些与一架民航客机相撞

中国新闻周刊 浏览 318 09-23

北美夺冠,中国票房从7.8亿跌到6400万,这块金字招牌算砸了?

靠谱电影君 浏览 244 11-12

腾讯在上海成立启善投资公司 含投资管理业务

证券时报 浏览 408 08-19

宗馥莉和“同父异母”三弟妹对簿公堂

21世纪经济报道 浏览 5934 07-14

上年纪的女人穿衣,掌握这3个搭配“小套路”,越老越有气质

静儿时尚达人 浏览 404 09-06

冯德莱恩与特朗普通话 讨论欧美关税谈判等议题

新京报 浏览 5895 07-26

记者:博洛尼亚100万欧租借费+700万买断报价米兰中场波贝加

懂球帝 浏览 1266 07-18

为什么说燃油车依旧能打,上汽奥迪给出了答案

澎湃新闻 浏览 2280 08-06

数百名韩国工人在美被捕 韩国工会要求特朗普就此道歉

扬子晚报 浏览 372 09-16

专家:演习5个区域形成"三面围岛"之势 传递明确信号

环球时报 浏览 203 12-29

跨越地理鸿沟,拼多多将“现代生活”包邮到珠峰脚下

野马财经 浏览 2975 07-26

推广|| 新买的衣服人人夸!果然还得是他家

黎贝卡的异想世界 浏览 324 10-12

邓紫棋脱粉风波升级!被扒抢闺蜜男友上位,借华晨宇林宥嘉挡枪

萌神木木 浏览 310 09-09

人类能从空气里造糖了!我国科学家首次实现二氧化碳人工合成蔗糖

量子位 浏览 4143 07-12

记者:纽卡斯尔对佳夫感兴趣并已展开接触,但目前尚未正式报价

直播吧 浏览 8419 08-07

美国将对所有赴美学生签证申请人进行网络审查

浏览 1648 08-20

西媒:欧足联批准赫罗纳与曼城重启合作,两队间的交易禁令被解除

直播吧 浏览 6933 07-26

她被推上C位,这次谁也没料到

Yuki女人故事 浏览 231 12-12

苹果 iPhone 17 产线接近满产,郑州富士康近 20 万人两班倒赶工

IT之家 浏览 411 09-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11