关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:014083人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

佩杜拉:那不勒斯确实对米雷蒂感兴趣,但交易或涉及韦尔加拉

懂球帝 浏览 5052 07-25

杀入50万级市场,极氪拼命向上

网易汽车 浏览 383 10-01

90%的名酒在跌价,2026年酒企怎么活?

首席商业评论 浏览 276 01-15

泽连斯基:美国或将购买经"战场检验"的乌克兰无人机

环球网资讯 浏览 3750 07-18

台湾教授苑举正痛心疾首:赖清德称"终战"是愚不可及

大象新闻 浏览 342 10-25

世界羽联:将引入强制计时器规则,球员两分之间仅剩25秒准备时间

懂球帝 浏览 553 08-11

15万也能开出头等舱质感,试驾锐胜M8

只懂车 浏览 259 12-21

AI圈再颠覆!中国AI翻译耳机通话翻译,实测震撼

新智元 浏览 373 10-15

女子毕业24年后起诉母校多收4000元学费 要求退一赔十

大风新闻 浏览 336 12-12

梦幻联动克洛普晒与前NBA球星诺维茨基和纳什打笼式网球照片

直播吧 浏览 5704 07-30

中美密谈后美财长神情凝重留下一句话 美国网民感叹

博览历史 浏览 533 09-16

破解先进封装与数字测试双重挑战 爱德万测试亮相西门子EDA Forum

爱集微 浏览 468 08-20

现场直击|神舟21号升空前6小时,带你沉浸式追火箭!

上观新闻 浏览 223 11-01

韩国女星55亿韩元豪宅被盗 千万财物失而复得

红星新闻 浏览 477 09-05

官方:米兰签下热那亚后卫德温特;据悉转会费2000万欧

懂球帝 浏览 9060 08-14

派出所所长身体不适换班后去世未被认定工伤 法院判了

红星新闻 浏览 409 09-25

中国籍女网红在柬埔寨街头流浪面容憔悴 母亲最新发声

扬子晚报 浏览 281 01-05

原厂带升顶/有纯电有增程 福特智趣烈马将上市

网易汽车 浏览 259 12-19

"支付宝账号解除授权"冲上热搜 有人被"偷"了不少钱

大风新闻 浏览 454 09-17

默茨将率庞大商务团访华 被指"从未如此精心准备出访"

环球网资讯 浏览 238 02-24

秋天怎么穿出时尚感?适当露肤、不死板老气,高级又有回头率

静儿时尚达人 浏览 273 11-16
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11