关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:019114人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

大湾区晚会太混乱!跑调抢拍忘词破音全占了,合唱几乎都翻车

萌神木木 浏览 292 09-29

51亿买公司捆绑69亿负债,佛塑科技“蛇吞象”并购是赚是亏?

野马财经 浏览 236 01-08

460亿“扫地茅”,又要IPO了

投资家 浏览 2416 08-14

被机场拦截的充电宝会否回流到市场上 民航局回应

界面新闻 浏览 7014 07-03

2018年季后赛詹姆斯有多厉害? 8场砍下40+最高51分

仰卧撑FTUer 浏览 9852 07-13

为减少对华稀土依赖 美国又盯上电子垃圾回收

澎湃新闻 浏览 2797 07-15

"全国最矮的山"仅0.6米高引质疑 当地:属文物保护单位

都市快报橙柿互动 浏览 1097 08-20

东风日产N6最新申报图曝光:选装轮圈与红色卡钳

网易汽车 浏览 319 10-12

一场82-43,让17万小国创历史!首次打亚洲杯便出线,中国队利好

侃球熊弟 浏览 472 08-11

阿森纳新赛季第三客场球衣谍照:白色底色搭配栗色和金色

直播吧 浏览 4367 07-16

俄官员:不排除"普特会"前乌克兰挑衅的可能

界面新闻 浏览 1960 08-11

卡马乔:穆里尼奥过去是、现在也是一位顶级教练

懂球帝 浏览 449 08-22

李鸿其王紫璇官宣结婚

扒虾侃娱 浏览 249 11-04

东北6家城商行改革进度披露,1家有新进展、5家尚在化险期

湘财Plus 浏览 7962 07-29

综合续航1730km 吉利银河M7远航家权益价10.98万起

网易汽车 浏览 59 04-29

沈玉琳妻子报平安!呼吁别对病情做揣测,好友曝其服用大量保健品

萌神木木 浏览 3429 07-31

吃盐太多真的会变丑?

网易健康 浏览 3283 02-26

包工头把交警儿子做进工资表冒领工地工资:我欠儿子钱

大风新闻 浏览 323 10-13

"作文大爷"写母亲爆火:也曾是"高材生" 在生病时抄诗

新京报 浏览 568 09-01

聚焦AI、金融与全球合作,2025外滩大会在沪开幕

大象新闻 浏览 397 09-11

好玩!AI“穿越”新玩法火了:根据12岁照片生成23岁的你

量子位 浏览 5470 07-14
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11