关闭广告

ACL 2025:DeepSeek与北大团队获最佳论文

网易科技报道2025-07-31 12:00:018685人阅读

2025年7月27日至8月1日,第63届 (计算语言学年会)在奥地利维也纳举行。今年大会总投稿量突破8000篇,创历史新高,最终主会接收率为20.3%,Findings 接收率为16.7%。根据大会官方数据,中国作者首次在第一作者占比中过半,达到51.3%,远超第二名美国(14.0%)。

本届 ACL 共评选出4篇最佳论文。 与北耀东团队各摘得一项,另两项授予 CISPA&TCS Research&微软团队,以及斯坦福大学与 Cornell Tech 合作团队。

其中《Native Sparse Attention: Hardware-Aligned and Natively Trainable Sparse Attention》由DeepSeek 团队与北京大学、华盛顿大学合作,梁文锋亲自挂名,论文提出稀疏注意力机制 NSA(Native Sparse Attention),显著提升长上下文训练与推理效率。该模型通过引入多路径注意力与硬件对齐优化,在保持精度的同时实现推理加速,验证了其在 A100 GPU 上的实际性能优

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

谷歌 Tensor G5 被曝是全球首款台积电 3nm N3P 工艺芯片

IT之家 浏览 204 08-23

海皮亚:利物浦还需签下一名中后卫;弗林蓬与阿诺德各有特点

懂球帝 浏览 6835 07-29

帕金斯:76人应该重建了;我要为当初批评快船放走乔治而道歉

懂球帝 浏览 1601 08-09

鲁比奥首次亚洲行被指尴尬:特朗普的关税政策成障碍

澎湃新闻 浏览 8770 07-13

叫板远亲黄仁勋 苏姿丰放话"性能超英伟达"

网易科技报道 浏览 1460 08-14

特斯拉超级充电餐厅员工小费由公司承担,顾客无需支付

IT之家 浏览 6717 07-29

中国豪宅教父,涉嫌违法被留置

说财猫 浏览 164 08-23

电池容量竞赛升级?零跑、小米布局80度大电池增程车型

汽车点评AC 浏览 79 09-29

“两节”机票预订进入高峰期 小众目的地受青睐

极目新闻 浏览 100 09-21

28国发声明谴责以色列对加沙军事行动 遭美以拒绝

环球网资讯 浏览 5788 07-23

李国庆将再婚女方为其北大校友张丹红 请柬内容披露

大风新闻 浏览 8501 06-19

亚马逊网页版Alexa AI上线时间推迟至7月31日后

环球网资讯 浏览 704 07-16

被问想通过电影《731》向日本传递何种信息 中方回应

外交部网站 浏览 131 09-19

泰国快递员淡定穿越炮火送货上门:身后爆炸浓烟升起

新京报 浏览 8791 07-27

硅谷高管消息群一夜未停 H-1B新规让美企慌了白宫找补

红星新闻 浏览 172 09-22

西安一城改项目"夭折"街办欠债超2亿 已被强执1512万

澎湃新闻 浏览 138 09-16

特朗普所谓"重大声明"揭晓:对俄加关税 对乌"送"导弹

央视新闻客户端 浏览 2676 07-16

男子到机场发现"飞机提前5小时起飞" 平台回应

潇湘晨报 浏览 9036 07-13

"嘎子哥"穿警服直播带货被举报 警方通报:拘留7日

现代快报 浏览 177 09-18

“心理+AI”赋能智慧养老 上海创新“数字反哺”助老模式

东方网 浏览 8886 07-13

朱总瘦了

投中网 浏览 140 09-11
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11