关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:013777人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

俄罗斯红场阅兵现场:普京喊出“乌拉” 全场齐声回应

参考消息 浏览 2972 05-10

《扫毒风暴》中6位美人,于文文被谁秒杀?“大嫂”李蔓瑄赢麻了

娱乐圈笔娱君 浏览 2356 07-24

外媒:莫迪将访华 印美两国的同盟关系可能会重新调整

澎湃新闻 浏览 3217 08-08

古力娜扎礼服裙不慎滑落,下一秒处理方式绝了

老鹈爱说事 浏览 486 07-30

牛弹琴:泰柬能实现停火 秘密就藏在一张特殊的照片里

大象新闻 浏览 7252 07-29

情侣租户强占房子1年多 房东打开房门:正常人都受不了

极目新闻 浏览 2297 07-31

以防长:辛瓦尔已死 这些人是下个目标

央视新闻客户端 浏览 6731 06-01

7月制造业PMI为49.3% 比上月下降0.4个百分点

国家统计局 浏览 7623 07-31

从FinFET到Flip FET:三维晶体管中国方案登场

爱集微 浏览 1013 07-30

什么信号?知名A股,30亿炒股!

中国基金报 浏览 1657 08-10

"强制社保"背后:东北养老金收不抵支 广东贡献最大

澎湃新闻 浏览 7205 08-13

英伟达怒花350亿,把英特尔打回了40年前。

差评XPIN 浏览 116 09-20

首款 800V 智能超混华系 SUV,岚图旗舰新车“泰山”预告公布

IT之家 浏览 218 08-23

用户称购票平台未更新航班信息致误机 平台回应

澎湃新闻 浏览 920 06-13

过气男神集体景区再就业?49岁郑国霖和马景涛“抢饭碗”,太卷

温柔娱公子 浏览 603 08-09

在南京高淳,年轻人为什么能“横”着走?

无相商业趋势 浏览 233 08-14

台当局欲出资百亿美元参与美天然气项目 国台办回应

极目新闻 浏览 5476 06-26

米体:莱奥在联赛间歇期返回葡萄牙,为双胞胎孩子庆祝1周岁生日

直播吧 浏览 149 09-09

超级世界波+1!姆巴佩远射破门,门将跪地“投降”,5场轰5球

奥拜尔 浏览 123 09-21

对话智元机器人王闯:直播收获大订单,出海已在路上

文汇报 浏览 5261 07-28

父母将589092元善款全额退还 患白血病儿子已上大学

环球网资讯 浏览 149 09-17
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11