关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:018758人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

一杯酸奶,估值1422亿

投中网 浏览 66 11-03

牛弹琴:以色列突然袭击叙利亚首都 又一场大战开打了

现代快报 浏览 2181 07-17

亏损超3.8亿,《东极岛》回本无望,不重视中国观众是最大败笔

靠谱电影君 浏览 4949 08-10

跟约基奇第一次聊天聊啥了?瓦兰:聊的赛马,他给了我点建议

懂球帝 浏览 197 09-09

"萝莉岛"背后真相:大量未成年少女被诱拐供权贵享乐

新民周刊 浏览 254 09-08

美国空军因反对意见 降低对军靴高度要求:从8英寸降到6英寸

环球网资讯 浏览 210 09-11

票房破13亿,只是个开始

皮皮电影 浏览 144 09-29

颠覆认知!用这8把“尺子”重新丈量中国餐饮未来!

餐饮老板内参 浏览 166 09-22

这一次,54岁情绪崩溃的王琳,给所有独居母亲提了一个醒

温柔娱公子 浏览 9210 07-25

摩根士丹利王滢:多重利好加持中国资产,市场上攻动能有望延续

澎湃新闻 浏览 252 08-19

辛芷蕾飞升!夺得威尼斯影后打脸了五个人,美国籍的刘亦菲好尴尬

萌神木木 浏览 187 09-07

李璇:浙江队还有对阵中超前四4场比赛,他们有实力决定冠军归属

直播吧 浏览 4842 08-10

破除“内卷”困局:让创新活力取代同质化竞争

中国商报 浏览 8504 08-07

美扬言禁止中国人购买农田 媒体:披露的数字让人发笑

环球时报 浏览 9853 07-10

从“道地药材”到“数字服务”,九州通“链”出中药增长新动能

正经社 浏览 79 10-28

裙子+这双鞋”才是今夏洋气穿搭,巨好看!

Yuki女人故事 浏览 5402 08-13

中方敦促国际社会全面客观看待阿富汗局势

浏览 3321 07-14

演唱会"出轨门"CEO有两子 若离婚分手费或超3千万美元

红星新闻 浏览 7960 07-22

拍图打假、电话验真……AI助力识别“神药”

红星新闻 浏览 254 08-19

波音被要求尽快改进737Max发动机

环球网资讯 浏览 1531 06-20

林心如曝与霍建华婚姻裂隙:孕期独守空房

一盅情怀 浏览 117 10-20
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11