关闭广告

北大-灵初发布具身VLA全面综述!一文看清VLA技术路线与未来趋势

机器之心Pro2025-07-25 12:00:018169人阅读



机器之心发布

机器之心编辑部

如今,GPT-4o、Gemini 2.5 Pro 等多模态基础模型在对话、代码生成和数学推理等任务中已经达到甚至超越了人类水平。研究者开始探索如何将这种智能从数字世界延伸至物理空间,以实现具身智能。这其中最受关注的前沿方向之一,便是视觉 - 语言 - 动作模型(Vision-Language-Action Models,简称 VLA)。此类模型借助基础模型的通用能力与大规模学习范式,可以处理通用的视觉(Vision)与语言(Language)输入,并生成实时动作(Action),极大地赋能了机器人系统。

近两年来,VLA 相关研究爆发式增长,技术路线日新月异 —— 但这也造成了认知碎片化与理解上的困难。现有分类方法如 “大脑 - 小脑”、“快慢系统”、“分层 - 端到端” 等,直觉清晰但本质仍不明确。领域急需系统化的分析框架,以梳理研究现状,指明未来方向。

上一页 下一页
版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

支气管热成形术术前准备

网易健康 浏览 10183 02-26

拐点来临!苏宁易购“大店战略”三年成效显现

时代周报 浏览 437 09-01

误将应急舱门当厕所门打开 乘客被判赔偿国航7.7万元

封面新闻 浏览 385 09-08

“烟管裤”今年冬天爆火,怎么搭都时髦!

LinkFashion 浏览 261 12-19

在时尚中国之夜,共赴荣耀东方时刻

时尚COSMO 浏览 2348 06-14

网红小狗靠捡瓶子攒了10万元 疑被"毒狗团伙"盯上

扬子晚报 浏览 125 05-09

加冕荷兰射手王+助攻王!德佩:又一破纪录时刻,而且远未结束

懂球帝 浏览 357 10-14

同样是离婚带娃,董璇和黄奕的女儿差距太明显

说历史的老牢 浏览 8225 08-08

美股创新高,全靠AI续命?

国际金融报 浏览 3579 07-27

鲁比奥谈"特普会":特朗普总统"想看着普京的眼睛"

红星新闻 浏览 8548 08-14

那是演唱会吗?那是我挂的专家号

时尚COSMO 浏览 4961 08-13

工行、建行:暂停办理投资金部分业务

央视财经 浏览 320 11-04

五角大楼公布史上最大规模军费预算

澎湃新闻 浏览 124 04-22

前球员:湖人时期的奥尼尔无法统治当今NBA;约基奇会是90年代的独角兽

懂球帝 浏览 274 12-11

至高享价值48800元限时购车礼 猛士M817 Hero售30.19万

网易汽车 浏览 255 11-25

*ST天茂将终止上市,年亏损额超6亿元 

界面新闻 浏览 367 09-26

一年暴赚233%的新“公募一哥”,新基才刚刚回本

深蓝财经 浏览 293 01-15

樊少皇也沦落到拍网大,票房惨不忍睹,时代想抛弃谁招呼都不会打

最爱酷影视 浏览 456 09-02

孙济民|从财产到合同:论数据爬虫法律规制的范式转型

上观新闻 浏览 2748 07-30

男子离婚冷静期毒杀儿女 事前带娃吃饭称"最后的狂欢"

极目新闻 浏览 542 08-20

A股突发!一个前所未有的赚大钱机会,终于来了!

星图金融研究院 浏览 10474 07-22
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
沪ICP备20017958号-11