关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014039人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

张柏芝又飞澳洲陪Lucas读书,独自拿八九件行李

八斗小先生 浏览 197 02-02

周定洋自宣离队!媒体人热议:已经在深圳,非得不做英雄太可惜

奥拜尔 浏览 241 01-13

于和伟逆袭的路上,藏着这样的一个女子

农村娱乐光哥 浏览 302 10-16

卡塔尔航空公司宣布陆续恢复中东多地航班

界面新闻 浏览 5133 07-01

雄鹿竟输奇才!近9战8负状态堪忧 字母独木难支多队盼他申请交易

颜小白的篮球梦 浏览 165 12-02

TCL科技110亿元收购LG Display中国业务

三言科技 浏览 317 10-14

谢娜演唱会庆功宴现场 张杰宠妻 半个娱乐圈齐聚

手工制作阿歼 浏览 39 05-09

国安连入3球4-3十人浙江 王子铭替补制胜王钰栋传射

懂球帝 浏览 574 08-11

韦尔谈被斯波批评:我将其视为一种激励 他希望我发挥出最佳水平

直播吧 浏览 3082 07-15

2025首份半年报出自内蒙古,中盐化工净利下跌88%,公司回应:坚定布局天然碱谋变局

时代周报 浏览 4632 07-16

中方回应是否会向伊朗提供军事支持

澎湃新闻 浏览 153 03-03

外交部:中方对沙特等4国试行免签政策

澎湃新闻 浏览 3344 05-29

杨力维和杨舒予,是姐妹,也是战友

界外编辑部 浏览 4079 07-17

黄景瑜前妻突然喊话许凯,内涵黄景瑜完美隐身

小椰的奶奶 浏览 377 09-10

看完《逐玉》我承认我还是喜欢长剧

时尚COSMO 浏览 149 03-15

博主炫耀"第N次"带打火机登机 机场:将尽快核实

新京报 浏览 388 09-09

TA夸怀特、哲凯赖什和苏比门迪:各展所长,共同铸就关键胜利

懂球帝 浏览 248 01-16

拉波尔塔:23年巴萨为梅西准备一份5年合同,但他选择迈阿密

懂球帝 浏览 167 03-11

广东惜败巴西!杨溢王浩然大爆发,王少杰顶内线,徐昕杜锋争执!

篮球资讯达人 浏览 4734 07-29

自营等业务挑大梁 42家上市券商上半年赚千亿

北京商报 浏览 404 09-01

高温天易伤“心”!这份护心指南请收好

人民网 浏览 10209 06-27
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11