关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:013838人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

“跑路”新加坡!从现象级应用到清空微博,Manus发生了什么?

雷科技 浏览 5173 07-12

媒体:国际贸易格局变了 美国影响力正在逐渐减弱

极目新闻 浏览 4305 07-14

宁德时代与易控智驾签署战略协议

证券时报 浏览 92 10-25

迪丽热巴第二套造型美,孙俪漂亮,倪妮刘雯同框

清游说娱 浏览 252 08-20

小伙河滩游玩坠2米深疑似砂坑 获救后几近失明智力下降

极目新闻 浏览 7867 07-29

时隔124天 尹锡悦因"可能毁灭证据"再次被拘留

新京报 浏览 951 07-11

"车顶维权"后被判向特斯拉道歉赔偿 女车主回应败诉

扬子晚报 浏览 7308 07-12

"特普会"细节公布 泽连斯基:不接受没乌方参与的决定

环球网资讯 浏览 378 08-13

花粉浓度已经到达next level了!

网易健康 浏览 2230 04-21

岚图追光L/别克至境世家领衔 12月上市新车汇总

太平洋汽车 浏览 19 12-03

因场地积水严重,欧协联里耶卡vs布拉格斯巴达比赛被迫延期

懂球帝 浏览 96 10-24

美联储降息如期而至,国际金价却大幅下跌,市场风向要变?

华夏时报 浏览 158 09-20

范曾与女儿、继子断绝关系 其与妻子新公司本月刚成立

红星新闻 浏览 46 12-12

直播|| 降温天的居家幸福感,是它们给的

黎贝卡的异想世界 浏览 87 10-24

王晶戳穿了蔡少芬的尴尬处境?

清游说娱 浏览 262 08-19

理想 L8 的配置卖 L6 的价格,昊铂 HL 增程版 26.98 万元起售,纯电续航 350km

爱范儿 浏览 267 08-21

京东把榜一大哥整不会了

老斯基财经 浏览 108 10-26

新增通行效率优先/三速泊车模式 腾势N9 OTA全新升级

网易汽车 浏览 839 07-03

菲律宾刚找到新"靠山" 抬头一看解放军战舰就在眼前

空天力量 浏览 1335 08-09

截至7月底我国充电基础设施数量达1669.6万个,是“十三五”末的10倍

财闻 浏览 278 08-26

阿森纳官方:因安排休假,道曼未入选对阵毕尔巴鄂竞技的大名单

直播吧 浏览 4463 08-10
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11