唱跳全能的「擎天柱」,背后其实是真人遥控?
跌麻了!特斯拉“We, Robot”发布会完第二天,投资者们集体用脚投票,最终股价大跌8.78%,创下两个月来的最大跌幅...
跌麻了!特斯拉“We, Robot”发布会完第二天,投资者们集体用脚投票,最终股价大跌8.78%,创下两个月来的最大跌幅。
有分析师表示,这次发布会虽有惊喜,但马斯克并没有给出细节,再结合此前多次承诺都无法实现,投资者的失望情绪可以理解。
当然,大多数人的关注点都放在无人驾驶车上面,其实这次推出的新款Optimus在灵活性上的进步其实值得拿出来讲一讲。
从多家媒体现场拍摄的视频可以看出来,这次的Optimus不仅可以调酒跳舞,甚至可以聊天互动,甚至可以现场指挥大家给当天生日的观众唱生日歌,无论是语气还是逻辑都非常像
事实上,昨天展示的Optimus就是由真人远程遥控而不是自主AI,这是一种类似VR眼镜的设备,人类训练员可以进行远程实时操控。
VR遥控机器人,已成主流
这种利用VR技术训练的路径其实已经在多家机器人平台上被应用,比较成熟的包括Optimus以及英伟达Project GR00T,国内一些具身智能企业也开始选择使用真人动捕提高机器人的灵活性。
如果单就人形机器人这一形态来说,该路径已经成为仿人机器人AI训练的主流方法。
作为VR训练机器人的带头人,特斯拉在今年5月的一段公开的视频里揭露了训练的大致流程。
从视频里可以看到,Optimus的训练数据都是来自穿戴VR头显的人类训练员,这套完整的系统集成了 VR 头显、传感器、手套、动捕服和相关软件。
通过VR头显,Optimus可以1: 1地复刻映射人类操作员的动作,而软件可以以实现第一人称视频的实时传输和精确控制输出,并保持极低的延迟。
在最近,特斯拉进一步加大了数据采集操作员(Data Collection Operator)的招募力度,这些操作员通过佩戴 VR 头显和使用高精度传感器及动作捕捉服,为机器人提供高质量的训练数据。
据招聘公告内容,这些操作员需要长时间佩戴 VR 头显,每天步行超过 7 小时,携带重达 30 磅(约 13.61千克)的设备,根据要求执行站立、行走等特定动作。虽然累,但特斯拉的待遇给得是真的多,薪酬大约每小时 25.25-48 美元,另外还有股票奖励以及福利。
当然,如此诱人的报酬,硬性要求非常高,首先就是身高、体力以及操作经验的三重考验,其次长时间操作VR设备并不是一件简单的事情。最后,从这次发布会的视频可以看出来,机器人背后的操作人员需要极快的反应能力,这一点能力也很难替代。当然从效果来看,由真人训练的Optimus确实效果明显。
不仅是特斯拉,英伟达也将Vision Pro 纳入其人形机器人平台的训练体系中,研究员将仿真训练框架整合到英伟达 Omniverse 平台和 Isaac 机器人开发平台,同时开发人员能够使苹果 Vision Pro 来远程操控人形机器人来执行任务。
不只是人形机器人,四足机器人也可以使用此方法。腾讯 Robotics X此前发布了基于真狗的动捕思路,可以看到四足机器人明显的运动能力提升。
AI难堪大任?做好硬件更重要
你以为的Optimus代表了最先进的AI,实际上的Optimus其实是真人遥控,而不是AI自驱的行为(autonomous)
而这也不是什么秘密,现场的科技媒体和机器人行业从业者都认可这一行为,也难怪投资者不感兴趣。
除此以外,对比仿真、模仿等训练方式,VR训练在数据采集成本上非常高,并且不见得可以完全离开人类操作员。
因此,目前各家具身智能项目真正比较的其实是硬件。
以此次发布的新版Optimus为例,目前特斯拉已经做到了22个自由度,操作上可以像真人一样弹钢琴,这个程度目前可以说是领先全球绝大多数非实验室企业。而特斯拉的目标是将执行器从手部完全移至前臂,最终实现像人类那样的工作方式。
当然,提高自由度的同时,研发的成本也随之提高。
据大摩人形机器人报告对上一代Optimus 的拆解,一双机器手接近1万美元,整体BOM更是高达50-60k美元,距离马斯克计划的 1 万美元还有很长的路,而这次的22自由度的新款机器人成本只会更高,那么所谓2-3万美元的成本又是在画饼?
当然作为控制成本狂魔,马斯克在降成本的实力有目共睹。
可以猜测一下,未来Optimus还是以硬件优势+人工控制为主,自主AI大概率不要指望了。
值得一提的,特斯拉的训练算力很大一部分都放在FSD以及自家AI公司Grok,能留给Optimus的,还剩多少呢?
最后,记得关注微信公众号:镁客网(im2maker),更多干货在等你!
硬科技产业媒体
关注技术驱动创新