点击右上角
微信好友
朋友圈

点击浏览器下方“
”分享微信好友Safari浏览器请点击“
”按钮

【成果变形记】
光明日报记者 晋浩天
酒店里,机器人为你送外卖,随叫随到;马路上,机器人和马拉松运动员一起跑步,有模有样;舞台上,机器人跟随音乐一起跳舞,动作流畅……如今,机器人越来越多地走进大众生活。但当前大部分机器人做动作都要靠程序员提前编好程序,如何能让人形机器人真正实现“人在干啥,它就做啥”的功能?
近日,西湖大学王东林教授团队发布了搭载全球首个通用动作预训练大模型(GAE)身外化身系统的人形机器人泰坦o1——它能随时、随地、随性模仿人类的各种动作,打破地域和距离的限制。
这套通用动作预训练大模型可理解为团队给机器人安装了一个“通用小脑”——大脑管思维,小脑管动作。
人形机器人泰坦o1,是西湖大学人工智能和机器人领域的第一个优质成果转化落地项目。
那么,这个机器人,究竟有啥不一样?
会动,但做不到“随心而动”
人形机器人的外观和人类相仿,能走路、拿东西……但你总觉得现有的人形机器人还是不像人类——动作生硬、依赖“套路”,一遇到没练过的场景就出错。
王东林是西湖大学机器智能实验室负责人,一直在和人形机器人“过招”。“现在的机器人做动作,基本靠程序员提前编好程序,就像咱们背课文一样,一字不差才能做好。”比如,“弯腰拿杯子”是一套程序,“抬手拿笔”是另一套。要是让它做个没编过的动作,比如“边走路边擦桌子”,它就会卡壳。这是传统机器人最大的技术瓶颈:没有通用的动作模型,无法举一反三。王东林介绍。
更麻烦的是,绝大多数机器人的手脚“各管各的”——下半身走路和上半身操作的系统是分开的。人类走路时伸手接东西,不假思索;但机器人做起来,顾此失彼。
反应慢也是硬伤。机器人靠大模型先理解指令再生成动作,要花好几秒钟“琢磨”,跟不上真实节奏。地面有点斜坡、湿滑,它更容易踉跄。
说白了,现在的机器人“会动”,但做不到“随心而动”。
像照镜子一样,毫秒不差
人形机器人泰坦o1项目的办公地,距离西湖大学云谷校区不远。一出电梯,记者看到一台银黑相间、带橙色装饰的机器人在占地近半层楼的试验场地里“锻炼”——这就是泰坦o1。
不远处,站着一位穿紧身黑色动捕服的工作人员。只见他舒展双臂,快速转身,再蹲下身。旁边的泰坦o1,就像照镜子一样,毫秒之间就复刻了所有动作:手臂角度、身体倾斜、膝盖弯曲,甚至手指的细微颤动,都一模一样。
工作人员故意踉跄了一下,身体往左边倾斜。泰坦o1瞬间跟上,左腿跨出一步稳住身体,右臂反向摆动,稳稳找回平衡,跟人类调整平衡的样子如出一辙。
紧接着,工作人员做起广播体操,扩胸、体转、弯腰。泰坦o1全程同步,动作标准,连节拍都原样复刻。“所有这些动作,并非事前编排好的程序,都是工作人员的随性而为。任何人穿上动捕服随意动作,机器人都能跟上,成为他的‘影子’。”王东林说。
泰坦o1的另一项强大功能是:它不仅能当“影子”,还能当千里之外的“替身”。让你无论走到天涯海角,只要有网络,穿上动捕服,就能指挥机器人远程办事。你甚至可以一个人同时遥控几十台机器人,让它们做一样的动作。
“最棒的是,这台机器人拿来就能用。你不需要懂技术、学编程,甚至不用提前训练。穿上动捕服或打开电脑后台,你想让它做什么,它就做什么。”王东林说。
“通用小脑”怎样炼成
为什么泰坦o1能做到这些?因为它有一颗其他人形机器人没有的“通用小脑”:通用动作预训练大模型。
在人体中,小脑负责协调运动、维持平衡。GAE就是人形机器人的“通用小脑”,能让机器人在收到信号后瞬间做出最合适的动作。这套原创算法由西湖大学团队完全自主研发,比国际上其他团队的同类技术领先至少6个月。
“ChatGPT让AI能理解并生成语言,Seedance能生成视频画面,而GAE让机器人模仿和执行各种人类动作,是机器人领域第一个实现动作泛化的大模型。”王东林介绍。
有了这颗“小脑”,机器人能手脚协同配合,不再“各管各的”;也不用提前编好所有程序,遇到没做过的动作都能轻松应对。而且,这颗“小脑”还很通用,具备“跨本体”能力——不同结构、不同尺寸的机器人,都能加载这套大模型。
记者了解到,王东林团队此前已在四足机器人、人形机器人领域深耕多年,积累了丰富的运动控制技术。同时,他们还拥有全球领先、国内最大的高质量全身运动数据集——包含人类各种日常动作、复杂动作的详细数据。正是这些数据,为泰坦o1的“通用小脑”提供了充足的“学习素材”,让它能精准模仿人类动作,实现毫秒级同步。
团队介绍,研发泰坦o1的初衷,是让机器人代替人类去做那些危险的工作——比如消防救援、矿区作业、高空维修,既能提高效率,也能保护人类安全。
《光明日报》(2026年04月24日 08版)
