关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018140人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

小米召回超11.6万辆SU7标准版电动汽车 雷军发文

中新经纬 浏览 333 09-20

谁能想到?《朱鹮》朱洁静曾差点告别舞台,放化疗25次仍硬撑

娱乐白名单 浏览 8328 07-29

西班牙"硬刚"以色列:呼吁全球对以禁赛 取消武器合同

澎湃新闻 浏览 393 09-17

A股大事件!芯片巨头,明日复牌!

券商中国 浏览 380 09-01

父母先后失联兄弟流浪4岁弟弟又失踪 36年后母子团圆

红星新闻 浏览 280 10-14

乌克兰总统与北约秘书长会晤讨论对乌支持问题

浏览 9125 07-25

《老友记》钱德勒死因大反转 真相揭晓不是溺亡

新民周刊 浏览 3849 07-28

斯坦福突破:机器人实现视频动作到真实操作迁移

科技行者 浏览 216 01-05

9月这些新SUV值得关注,从便宜到贵,覆盖多种动力!

快上车Go 浏览 363 09-06

迪丽热巴“扛剧女王”人设崩塌?

孟一宜 浏览 214 11-27

*ST赛隆突发公告:董事会成员集体辞职!公司已无实控人

红星资本局 浏览 512 08-12

00后博士休学,首创“算力滴滴”

虎嗅APP 浏览 423 08-22

蔚来公司12月交付新车48,135台 同比增长54.6%

网易汽车 浏览 204 01-02

逃离5A景区的中年人,正在涌向“差评最多”的小店

她刊 浏览 38 05-08

今天起,一场关乎14亿人的命运转折来了!

米筐投资 浏览 292 10-24

再胜委内瑞拉发布会!郭士强不满上半场+提防守,但得分仍低!

篮球资讯达人 浏览 3833 07-26

硅谷的AI初创公司正在拥抱“996”

澎湃新闻 浏览 10401 07-25

美记者:若特朗普决定 泽连斯基或被流放

环球网资讯 浏览 4207 07-21

杨兰兰身份疑被扒 知情人:名字能猜出身份 叠字有讲究

火山诗话 浏览 4458 08-10

“后妈裙”今年夏天火炸了,这样穿时髦精致又气质

LinkFashion 浏览 8693 06-21

成龙没想到,这次林凤娇干出这种事?

比利 浏览 435 09-02
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11