关闭广告

即将开源!华为发布AI推理黑科技,已在中国银联落地

钛媒体APP2025-08-13 12:00:01230人阅读


图片系AI生成

8月12日,华为发布AI推理创新技术——UCM推理记忆数据管理器,旨在推动AI推理体验升级,提升推理性价比,加速AI商业正循环。同时,华为携手中国银联率先在金融典型场景开展UCM技术试点应用,并联合发布智慧金融AI推理加速方案应用成果。

UCM推理记忆数据管理器,包括对接不同引擎与算力的推理引擎插件(Connector)、支持多级KV Cache管理及加速算法的功能库(Accelerator)、高性能KV Cache存取适配器(Adapter)三大组件,通过推理框架、算力、存储三层协同,实现AI推理“更优体验、更低成本”。

AI推理:既不够快,也不够便宜

从行业视角观察,大模型的重心正在从训练转向推理。相关行业数据显示,当前推理算力需求已超过训练(58.5%)。GPT-5开放首周20 亿次/分钟,70%的请求为复杂任务推理(如代码生成、多步规划);而国内火山引擎的日均token调用量已达16.4万亿,其中70%以上来自线上推理而非训练。

与此同时,大模型行业总会频繁出现一个现象,一旦出现了一种火热

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

美方扬言全面封杀中国购买农地 或收回中国投资者资产

上游新闻 浏览 4556 07-09

传统车企的反击,别克至境L7入局新能源

爱驾天下 浏览 3344 07-29

苗得雨任外交部副部长

界面新闻 浏览 2257 06-25

伊朗核设施遭美军袭击前后对比

环球网资讯 浏览 1753 06-23

江苏吴中敲响退市警钟,爱美客会否夺回“童颜针”生意?

达摩财经 浏览 2303 07-17

第十届四川省大学生机器人大赛在成都启幕

封面新闻 浏览 20 10-26

杭州成立专班介入宗庆后遗产纠纷

第一财经资讯 浏览 1068 07-18

翁帆:杨先生离开时一定很欣慰 他交出了份满意的答卷

光明日报 浏览 28 10-19

千亿AI投入引爆港股,阿里巴巴盘中暴拉17%!港股迎“戴维斯双击”?

财闻 浏览 171 09-01

苏醒为“胡辣汤言论”致歉,公开发言当避免“拉踩”|新京报快评

新京报 浏览 84 10-01

飞成都航班降落前俩旅客"大打出手" 目击者:太离谱了

大风新闻 浏览 4484 07-23

不分红了!格力电器中报失速,二季度业绩下滑明显!空调为何卖不动了?

中国基金报 浏览 183 08-29

记者:亚足联正讨论恢复举办亚洲超级杯,并新增青年亚冠赛事

直播吧 浏览 229 08-11

媒体:美国政府又关门 两党“小鸡博弈”暴露制度缺陷

红星新闻 浏览 115 10-02

微博、快手被查处!

证券时报e公司 浏览 85 09-21

国米发文祝贺潘德夫42岁生日,在队夺得6座冠军&出战69场打进8球

直播吧 浏览 1596 07-28

素人女孩走红,于正求联系方式,妈妈最新发声

19楼 浏览 1372 07-15

林诗栋3-4不敌张本智和,遗憾无缘WTT美国大满贯男单决赛

懂球帝 浏览 6687 07-13

男子救人后发现场视频遭被救女子举报"侵权" 网友吵翻

新民晚报 浏览 19 10-22

德国严查意德企业收购案"中国因素":可能危害公共秩序

环球网资讯 浏览 4622 07-15

天舟九号货运飞船组合体完成转运:携带约6吨重补给物资

IT之家 浏览 8570 07-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11