关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:017880人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小球迷贾克斯手写信鼓励受伤的穆西亚拉,后者暖心回应

懂球帝 浏览 1031 07-14

嘉楠科技公布数据:月度比特币产量环比增10%

网易科技报道 浏览 103 09-09

体图:虽曾与拜仁达成协议,沃尔特马德仍能融入斯图加特团队

懂球帝 浏览 850 08-13

南充一村庄挖出疑似"乌木" 有人欲运走被村民拦下

红星新闻 浏览 206 09-02

小米《财富》世界500强排名297 提升100位创上榜以来最大增幅

封面新闻 浏览 8270 07-30

6米29!人类高度极限再被改写,杜普兰蒂斯第13次破世界纪录

全景体育V 浏览 5224 08-13

iPhone 17 Pro真机疑现身街头!外观竟有大变化?

雷科技 浏览 9821 07-30

报告出炉:亳州机场可用于实际运行

北青网-北京青年报 浏览 5620 06-22

全网爆火的“鲨鱼裤”太丑了!巨显腿粗!

Yuki女人故事 浏览 36 10-10

82岁的拜登确诊前列腺癌

网易健康 浏览 3630 05-20

纷争4年后,张若昀再次让世界刮目相看

东方不败然多多 浏览 10079 08-10

当奥迪Q5L和沃尔沃XC60同一价格 你会选谁?

大侠上车 浏览 102 09-14

百度蒸汽机视频大模型7折价入局

北京商报 浏览 194 08-22

汪苏泷张碧晨的《年轮》之争,好多疑点

仙女事件簿 浏览 3191 07-27

媒体报道男子拒付52万婚宴食材款被诉 当事人:遭网暴

澎湃新闻 浏览 8361 08-11

数学界顶流陶哲轩缺钱了!美国留不住人,中国这次能捡个大宝贝吗

首席商业评论 浏览 126 09-11

中国超半数城市人口下滑,什么信号?

智谷趋势 浏览 4540 07-12

小鹏G7将于6月11日亮相 首款具有L3级算力的AI汽车

太平洋汽车 浏览 245 06-10

门票30万!高端纯电大三排SUV迎来大决战|汽车观察

封面新闻 浏览 230 08-22

增程动力 可选8座 吉利银河V900申报信息公布

网易汽车 浏览 110 09-12

以总理公开谴责马克龙:承认巴勒斯坦国是奖励恐怖主义

红星新闻 浏览 4523 07-26
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11