关闭广告

华为发布AI推理新技术 将于今年9月正式开源

财联社2025-08-13 12:00:013834人阅读

《科创板日报》8月12日讯(记者 黄心怡)华为今日发布AI推理创新技术UCM(推理记忆数据管理器)。作为一款以KV Cache为中心的推理加速套件,其融合了多类型缓存加速算法工具,分级管理推理过程中产生的KV Cache记忆数据,扩大推理上下文窗口,以实现高吞吐、低时延的推理体验,降低每Token推理成本。

据悉,华为计划于2025年9月正式开源UCM,届时将在魔擎社区首发,后续逐步贡献给业界主流推理引擎社区,并共享给业内所有Share Everything(共享架构)存储厂商和生态伙伴。

IDC预测,到2027年中国智能算力中,推理算力占比将从2023年的41%左右上升到72.6%左右。中国信息通信研究院人工智能研究所平台与工程化部主任曹峰表示,大模型推理需求爆发。一方面大模型服务调用量、推理计算量将翻倍,另一方面大模型推理算力供给将超过训练,基础设施重心将逐步向推理偏移。

不过,当前AI推理应用落地过程中存在推不动、推得慢、推得贵等问题。华为数据存储产品线总裁周跃峰举例:中国互联网大模型的首Token时延普遍慢于海外互联网头部的首Token时延,海外头部大模型的推理吞吐率也要远高于中国。因此,如何改进推理系统的效率和体验是重要课题。这也是华为此次推出UCM推理记忆数据管理器的原因。

据介绍,UCM推理记忆数据管理器已经在中国银联的客户服务、营销策划、办公会议等业务场景中,开展AI推理加速应用试点。

华为数据存储产品线副总裁、闪存领域总裁谢黎明表示,从银行业来看,不管是生产环境的投研分析,还是舆情分

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

你的基础款,差一双Y3K银色球鞋

时尚COSMO 浏览 6618 08-14

小马、文远回港上市 但自动驾驶还没赢家

虎嗅APP 浏览 45 11-08

11岁小玥儿正脸曝光!居家吃雪糕悠闲自在,五官神态简直大S翻版

萌神木木 浏览 4039 08-11

父子除夕夜放烟花引火灾致1死1伤 父亲被判7年赔270万

红星新闻 浏览 312 08-27

《唐朝诡事录3》第一波真实口碑出炉!

娱乐圈笔娱君 浏览 48 11-09

现货黄金突破3400美元关口 投资者聚焦贸易谈判

财联社 浏览 4227 07-22

科技巨头疯狂投资AI基建,芯片厂商吞了云服务企业的利润?

澎湃新闻 浏览 104 10-14

中央定调!城镇化新阶段,真的来了

西部城市 浏览 2313 07-16

进博面对面|爱茉莉太平洋许达仁:深耕中国,本土创新是制胜关键

中国商报 浏览 54 11-09

岁月不败美人,42岁的安妮·海瑟薇比20岁的她更好看

LinkFashion 浏览 8254 07-30

明抢!中国企业147亿半导体资产被荷兰政府冻结,CEO被停职;小米第三款车YU9多张实车谍照曝光;美团外卖骑手能屏蔽顾客了丨雷峰早报

雷峰网 浏览 109 10-13

35岁王国明获MVP 补时3秒2连扑+点球战封神 外援队友:他配进国足

我爱英超 浏览 255 08-20

杨议妻子回应杨少华去世争议:网友的眼睛是雪亮的

深圳晚报 浏览 5337 07-11

一个杭州百货店员,靠着5万本金赚了100亿

大猫研究所Pro 浏览 229 09-02

傍上 “新中式”,现制酸奶能迎来 “二次爆发” 吗?

餐饮老板内参 浏览 112 10-13

独一无二,世界巨星蒂尔达·斯文顿卓越之作!

幕味儿 浏览 92 10-26

1200亿元深耕中原!中国人寿助力河南区域经济高质量发展

证券市场周刊 浏览 70 11-04

16400亿订单作废!中国手撕钢打破30年垄断,日本德国都想来偷

密探财经 浏览 8579 08-13

阿森纳重磅官宣!7602万欧签下27岁瑞典神锋+穿14号 最弱短板补齐

我爱英超 浏览 8962 07-27

航行警告:南海海域有火箭残骸坠落 禁止驶入

央视军事 浏览 10 12-08

德国外长:加沙地带局势“令人难以忍受”

国际在线 浏览 1452 05-28
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11