文:富充
编辑:苏建勋
人头攒动的2025WRC(世界机器人大会)上,不乏各种酷炫的Demo展示,可在一众敲锣打鼓的机器人表演中,具身智能公司星海图展位上,机器人却在安静地执行铺床任务。
一些围观者流露出疑惑的表情。他们难以理解,为何这个对人类来说极其简单的工作,需要大费周章地展示。
“铺床是个集各种难度于一身的长程任务。考验了机器人柔性物体操作、模型的全身控制等能力,以及在各种杂乱床面上完成整理的泛化性。”星海图首席科学家、清华交叉信息学院助理教授赵行在展会现场对《智能涌现》说。
这时,工作人员将被子随机弄乱,一位观众下达了铺床的指令,机器人随即开始工作。
看似简单的工作,机器人却调用了全身23个自由度,往往要分三步实现:它先通过底盘移动至最佳作业位;随后升降、俯仰躯干,调整合适的工作角度;最后用机械臂抓住被子,外拉、展平。
三个步骤间也相互影响:机器人如果一开始没走到位,就会抓不住被子;即使走到位,如果被子在床很中间的位置,躯干就得特别往前倾去“够”到;抓取时,由于被子较重,不能仅靠臂拉动时,机器人还要通过全身位移去拉平。
这场演示的背后,是星海图新发布的 VLA(Vision-Language-Action,视觉-语言-动作)端到端基础模型G0。
谈到训练这个模型的原因,赵行向我们介绍,之前星海图
 
                                     
                                     
                                     
                                     
                                     
                                     
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
             
            