关闭广告

清华×生数研发国产视频具身基座模型Vidar,实现少样本泛化突破

网易科技报道2025-07-26 00:00:018487人阅读

7月25日,清华大学与生数科技联合发布模型。据介绍,作为视频大模型Vidu在智能领域延伸的重大突破,Vidar是全球首个基于通用视频大模型实现视频理解能力向物理决策系统性迁移的多视角具身模型。该模型创新性地构建了支持双臂协同任务的多视角视频预测框架,在保持SOTA性能的同时,展现出显著的少学习优势。

Vidar可在仅20分钟少样本训练下,泛化至全新机器人本体,完成多视角双臂操作任务,所需数据量约为行业领先的RDT的八十分之一,π0.5的一千两百分之一。相比以往依赖百万级动作数据的机器人控制模型,Vidar显著降低了数据门槛与训练成本。


该模型基于生数科技此前推出的视频大模型Vidu,在此基础上融入75万条双臂机器人具身数据,构建统一观测空间后进行预训练,并结合自动化动作采集与逆动力学解码器,实现从视频预测到动作控制的全链路闭环。

清华与生数科技团队还提出“任务无关动作数据”训练范式,通过ATARA方法自动采集机器人动作轨迹,仅需10小时,即可完成机器人动作空间泛化。配合高精度动作执行模型AnyPos,Vidar在实际任务中实现近100%成功率,精度远超当前行业基线33%

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

43岁万茜再破“天花板”,让整个演艺圈“沉默”

素衣读史 浏览 8691 07-22

记者谈国足:现在和强队遭遇,连幻想赢的底气都没了

直播吧 浏览 6597 07-13

哈马斯公布"致命伏击"录像 以色列领导人发声

环球网资讯 浏览 4270 06-27

首款国产高端 GPU“砺算 G100”OpenCL 跑分超越英伟达 RTX 4060

IT之家 浏览 974 07-25

人工智能创新发展的擂台期待更多青年“揭榜挂帅”

上观新闻 浏览 311 07-27

以色列称打死伊朗最高军事指挥官

每日经济新闻 浏览 725 06-18

鸿蒙智行首款旅行车享界S9T来了,余承东:高颜值、大空间、高性能

网易科技频道 浏览 8249 07-14

努涅斯单刀破门,随后连做两个若塔经典庆祝动作,悼念队友

直播吧 浏览 1990 07-14

全球最大二氧化碳储能项目在新疆封顶

IT之家 浏览 3712 07-14

上海海港夏窗调整情况:新注册梅伦多等3人,艾菲尔丁等4人离队

直播吧 浏览 1138 07-22

印度称摧毁巴基斯坦第二大城市拉合尔防空系统

财联社 浏览 9679 05-09

破价返场|| 大家每天来问的冰白面膜、豆腐霜pro,终于补货了

黎贝卡的异想世界 浏览 8973 06-06

谁是最难防的球员?埃文-富尼耶:詹姆斯-哈登

懂球帝 浏览 4727 07-14

吉列尔梅告别亚泰:会将这里的一切铭记于心,助球队未来一切顺利

直播吧 浏览 191 07-17

看AI“七十二变”,把24小时过成科幻大片

上观新闻 浏览 1178 07-26

1.77亿患者,等待一款痛风药

虎嗅APP 浏览 169 07-15

女排3-1加拿大采访!庄宇珊开心谈晋级+重提团队,赵勇不满起伏!

篮球资讯达人 浏览 4814 07-12

邓肯-罗宾逊:活塞让我想起大学球队 会看着康宁汉姆继续成长

直播吧 浏览 3021 07-27

沃尔沃发EX60预告图 全新平台打造/明年年初上市

网易汽车 浏览 3527 06-26

杨洋五个月无戏可拍,粉丝急盼回归娱乐圈!

银河卧谈会 浏览 2764 07-08

谷歌闪电"截胡"OpenAI,挖走这家公司CEO

网易科技报道 浏览 8563 07-12
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11