关闭广告

行业首个:8B 参数面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型开源

IT之家2025-08-28 00:00:02451人阅读

IT之家 8 月 27 日消息,面壁智能 8 月 26 日宣布开源 8B 参数的面壁小钢炮 MiniCPM-V 4.5 多模态旗舰模型,成为行业首个具备“高刷”视频理解能力的多模态模型。

MiniCPM-V 4.5 号称高刷视频理解、长视频理解、OCR、文档解析能力同级 SOTA,且性能超过 Qwen2.5-VL 72B,号称“最强端侧多模态模型”。


面壁智能介绍称,此前主流的多模态模型在处理视频理解任务中,因为平衡算力、功耗等因素,通常采取 1 fps 抽帧,即每秒只能截取 1 帧画面进行识别和理解。虽然一定程度上保证了模型推理效率,但也因此缺失了绝大部分视觉信息,降低了多模态大模型对动态世界「精细化」的理解。

MiniCPM-V 4.5 是行业首个具备高刷视频理解能力的多模态模型,通过将模型结构从 2D-Resampler 拓展为 3D-Resampler,进行三维视频片段的高密度压缩,在同等视觉 Token 量开销下的情况下,最大可接收 6 倍视频帧数量,达到 96 倍视觉压缩率,是同类模型的

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

优质智能体验/1.5T增程 别克至境L7正式亮相

网易汽车 浏览 361 09-17

这场测试,打了谁的脸

博闻财经 浏览 4315 07-27

前安永合伙人,因酒吧斗殴被解雇,早前涉嫌勾引已婚女合伙人被警告

财通社 浏览 243 11-03

王暖暖花6年才离掉婚 男方母亲曾带女子探监和他相亲

新京报 浏览 305 10-13

释永信接受调查 佛慈制药突现异动意外涨停

潇湘晨报 浏览 4043 07-29

解锁刘浩存的「红运」密码 | 高清镜头后的底气

时尚COSMO 浏览 58 04-28

「解压三件套」,捞了中国人几百亿?

快刀财经 浏览 425 09-02

华能两公司被指"串谋"涨电价 遭红牌警告

红星新闻 浏览 521 08-13

数百名韩国工人在美被捕 韩国工会要求特朗普就此道歉

扬子晚报 浏览 372 09-16

牛弹琴:中国外交干了件大事 王毅的一句话内涵很丰富

现代快报 浏览 214 12-29

马斯克信徒、前百度员工,折腾14年终于整出一个IPO!

财通社 浏览 473 08-21

2025世界顶尖科学家协会奖“智能科学或数学奖”揭晓

上观新闻 浏览 320 09-10

速腾聚创推出Active Camera平台,要为机器人造“眼睛” | WRC2025

钛媒体APP 浏览 6785 08-11

餐饮“白月光们”再开张,排队的人却没了?

餐饮老板内参 浏览 923 07-14

曾经的环球小姐冠军,却一手好牌打得稀烂

历来纵横 浏览 327 10-15

俄称过去一周控制5个定居点 摧毁乌军超2000架无人机

每日经济新闻 浏览 5958 07-27

OpenAI开放权重模型现已登陆亚马逊云科技平台

网易科技报道 浏览 1176 08-07

半年之内连爆3次,他终于红成了顶流

独立鱼 浏览 2667 07-26

马筱梅带小玥儿小菻菻回台,小玥儿大长腿抢镜,汪小菲未露面

扒虾侃娱 浏览 9779 08-11

博主:浙江队30号对阵天津津门虎的比赛将提前至20号进行

直播吧 浏览 3997 08-12

“人血馒头吃不停”?张兰一反常态怀念大S

老吴教育课堂 浏览 3687 07-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11