关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014040人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

凌志峰任公安部副部长

界面新闻 浏览 935 07-22

一组数字告诉你:三餐怎么吃营养又健康

人民网 浏览 8951 06-03

E句话| 新F4上海开唱,朱孝天疑似内涵阿信?

仙女事件簿 浏览 166 12-21

鸿蒙智行问界 M9 汽车「银境紫」官图发布,9 月 23 日发布

IT之家 浏览 349 09-21

退出春晚、被综艺开除,贾玲的下场竟然如此?

阅识 浏览 253 11-03

6月规模以上工业企业利润同比下降4.3%

国家统计局网站 浏览 8375 07-27

分手传闻才3个月,关晓彤又有喜讯,原来鹿晗早就“高攀不起”她

老吴教育课堂 浏览 3034 07-16

预测票房16亿,想看人数断层第一,《731》提前预定暑期档爆款!

电和影 浏览 2934 07-17

一户人家被全楼"孤立":加装电梯没出资 卖房时尴尬了

扬子晚报 浏览 225 01-15

招行原副行长年近70岁被查、曾年薪332万,退休后兼齐鲁银行独董

湘财Plus 浏览 393 09-11

全球连线|权威访谈:携手迈进更加美好的“数智未来”——访世界互联网大会副理事长高锐

新华社 浏览 231 11-09

梁婷为辛芷蕾发声:没什么可质疑的

韩小娱 浏览 261 11-08

长安深蓝 S05 汽车将推 620km 超长续航版本

IT之家 浏览 2477 07-25

男子欲偷渡上车才知去缅甸 8人合力抢夺方向盘逼停车

极目新闻 浏览 5874 07-27

美国在巴西抢下一座矿:若中国断供 就造不了F35

澎湃新闻 浏览 109 04-22

董璇秒付1888元刺痛张维伊自尊心 掀开二婚遮羞布

南方的宝宝 浏览 8539 08-07

"张云龙"被指认:已诱骗至少4人到柬埔寨同一电诈园区

红星新闻 浏览 35106 09-19

40+中年女人,衣橱里不能少阔腿裤和过膝裙,藏肉效果特别好

静儿时尚达人 浏览 1341 06-27

​多款美元理财产品“提前止盈”,咋回事?

中国商报 浏览 10161 07-25

马卡:多家英超俱乐部有意阿布德,巴萨仍有其部分所有权

懂球帝 浏览 230 01-15

刘芳菲坐不住了 发帖疑回应与释永信传闻"仅是采访"

火山诗话 浏览 4023 07-31
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11