关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:018833人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

刘惜君评论区沦陷!湾区晚会抢C位打乱众人走位

萌神木木 浏览 82 10-02

日系车企进入“蛰伏期”

禾颜阅车 浏览 131 09-03

图片报:斯图加特准备签下科尔-坎贝尔,多特要价700万欧

懂球帝 浏览 2136 07-26

千亿资金大迁徙,头部基金公司规模增长和业绩坚挺的秘密

阿尔法工场 浏览 1689 07-24

反无人机强大"铁三角"出鞘 外媒直呼:中国更胜一筹

上观新闻 浏览 145 09-07

中年女人,无需追赶潮流,把优雅与时髦融进每一套日常搭配中

静儿时尚达人 浏览 3210 07-03

俄方确认:逾3500名外国雇佣兵参与乌军作战

每日经济新闻 浏览 9186 07-27

邮报:曼联将在主场附近开设大型临时酒吧,为当地企业提供机会

直播吧 浏览 8502 08-13

努尔基奇:国际赛场和NBA完全不同 但字母哥仍然具有统治力

直播吧 浏览 191 09-02

工人如厕被误当猎物枪击身亡 专家谈涉罪责一关键情节

辽沈晚报 浏览 1482 08-10

天猫被曝入局共享充电赛道,测试两轮车/汽车充电业务“喵充电”

IT之家 浏览 212 08-22

你喝的奶茶上黑名单了吗?教你在家就能做的神仙饮品

Yuki女人故事 浏览 46 10-12

微软在中国大陆上线 Microsoft Rewards 终极大礼即时奖励活动

IT之家 浏览 212 08-24

外媒:土耳其外长称 土耳其对以色列飞机关闭领空

环球网资讯 浏览 114 08-30

近5米车长+mCDC悬挂+沙发躺椅荣威M7 DMH将于9月17日上市

第一电动网 浏览 105 09-12

美方拟禁止中国航司飞越俄罗斯领空 中国航司联名回复

澎湃新闻 浏览 52 10-14

自研AI进展缓慢,苹果被曝已就收购Mistral、Perplexity进行讨论

IT之家 浏览 188 08-27

记者:切尔西与莱比锡就西蒙斯达成协议,转会费约6000万镑

懂球帝 浏览 2593 08-07

绿茶餐厅撤下"无预制菜"招牌 打包袋上还有"现点现烧"

红星新闻 浏览 123 09-19

“90后”基金公司女员工,用他人账户炒股4年未申报,被罚3万元

红星资本局 浏览 7023 07-14

字节Seed发布PXDesign:蛋白设计效率提升十倍,进入实用新阶段

量子位 浏览 68 10-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11