马斯克的Optimus机器人稳了吗
马斯克想象中的Optimus,既能稳定走路,又能用灵巧手执行各种复杂非标的任务,进入工厂流水线或者家庭厨房。但要达到这个目标,中间横着几座大山,平衡运动控制达标、泛化任务能力自主完成、可靠性要接近车规级。
但现实中情况是24年1月Optimus放出叠衣服的视频,同年10月,Optimus在“ME Robot”的发布会上走到人群中,与人群互动其实是遥控。还比如 Tesla Diner开业,我们看到了被远程操控的 Optimus 在那里负责“爆米花机”,这些都被行业“诟病”为遥控操作的成果。
哪怕是拿来对比国内机器人公司,在运动控制能力方面,国内第二梯队的越疆和星动纪元都有可能略胜一筹。目前,Optimus无论是下肢的行走能力,还是上肢的抓取能力都没有表现出明显的优势。
那是不是说特斯拉机器人就不行了?当然不是,特斯拉的优势是全面自研、软硬件协同。比如说在执行器层面,Optimus做到把 28 个关节全部做成“一体化电驱模组”,并且电机、减速器、编码器、驱动板、热管理都全面自研,属于典型的“垂直整合”打法。这与一些初创机器人公司外购电机/减速器、只做控制集成的做法形成明显差异。
电池方面,特斯拉用的是自己的4680圆柱电芯,加上自研的BMS。初创机器人公司往往是买第三方的动力锂电池。尤其在芯片方面,其他机器人公司大多直接买英伟达或英特尔的芯片,而特斯拉则自主研发了FSD AI5 SOC芯片,专门适配纯视觉的端到端模型。
比较有意思的是国内的机器人公司往往对标的就是Optimus机器人,有媒体曾采访过智元机器人内部人士询问对特斯拉机器人的看法,该人士表示如果是特斯拉机器人整体能够打7分(满分10分),那么现阶段智元可能只有3—4分,差距还是非常明显的。要知道这还是在马斯克机器人第三代更新之前的判断。
第三代Optimus最大的更新其实是泛化能力在指数级增长。特斯拉正从“动捕服(motion capture suits)和 VR 头显/远程操控”的数据采集方式,转向更多“人类视频(human videos)”,并直接用人类视频来训练机器人的模型。
相比之下,一个通用的视觉系统一旦被训练成功,原则上可以部署在地球上的任何地方,因为它不依赖于任何预先存在的环境地图。从成本上看,多传感器套件的成本可能高达数万美元,而摄像头的成本仅为数百美元。这种巨大的成本差异使得纯视觉方案在商业化和规模化部署方面具有天然的优势,能够将先进的驾驶辅助功能推广到每一辆消费级汽车上。
不过这是理想下的状态,如果真的会这么顺利,以马斯克的性格,今年势必就要量产万台,明年50万台起步,但马斯克显然没有这样做。因为还有很多基础级的问题等待解决。
根据最新的研究,仅2D视频并不足以满足具身模型的训练需求,要想具身模型有更好的泛化性和更高的任务成功率,还需要机器人末端3D坐标及轨迹、6DOF位姿,被操作物体轨迹,第一视角视频等等多模态数据。这类数据目前仍然要依靠昂贵的人工遥操作方式采集,无法被2D视频替代。
此外,当前灵巧手难以应对复杂多变的物理场景(如不同形态、环境下的抓取任务),包括特斯拉目前的灵巧手也是如此。本质问题在于数据量与覆盖度的双重缺失。此外,高质量数据比大规模数据更关键,这直接决定了模型效率与泛化能力,在这个方面特斯拉并不比友商跑的太多。
泡沫还是百年大机遇?
特斯拉的批评者认为,特斯拉是一家曾创造奇迹、显著加速世界向电动交通转型的公司。然后,它的CEO疯了,销量开始下滑,盈利开始下降,为维持荒谬的股价,CEO决定搭乘AI泡沫,仅此而已。
美国媒体Electrek的评论员Fred Lambert称,该计划“不过是一堆模糊的AI承诺的大杂烩”,甚至讽刺其人形机器人“连爆米花都端不好”。相较于马斯克此前清晰、可执行的大师计划,第四篇章更像旨在让股东沉迷于AI股票“无限增长”的幻想,而缺乏实际支撑。
不过这并不是第一次马斯克“跑火车”了,之前2016年大师计划完成度也不是很高。
2016年的大师计划:
1. 创造与储能电池无缝整合的惊人太阳能屋顶。
2. 扩展电动汽车产品线,覆盖所有主要细分市场。
3. 通过大规模车队学习,开发出比人类手动驾驶安全10倍的自动驾驶能力。
4. 让你的车在你不使用的时候为你赚钱。
第一项太阳能屋顶和电池虽然已经开始盈利,但距离展示效果还是非常遥远的。第二项,特斯拉确实将电动汽车产品线扩展到了大多数最适于大众市场的消费细分领域,但比如廉价市场的Model 2一直没有推出。第三第四项可以说是同一件事,那就是自动驾驶,但结果是显然马斯克的robotaxi仍然在试验,完全自动驾驶并没有实现。以至于这一目标延续到了今年的大师计划。
《马斯克传》里面写到过,马斯克一旦进入“狂飙”模式,都意味着他要在某一段时间之内重点搞某个业务,这个业务在之前可以是推动汽车量产、猛禽发动机的重新设计生产,而现在有可能是Optimus(这是所有家人们的愿望),毕竟特斯拉80%的价值来自于Optimus。
我们应该相信马斯克的故事吗?马斯克经常说:“如果你的梦想没有吓到你,说明你做得不对。”在马斯克之前虽然已经有了可重复使用火箭,但成本还是很昂贵,直到马斯克的猎鹰9号火箭才大幅降低太空发射成本,其单次发射成本可以说是降到了全球最低。特斯拉汽车濒临几次崩溃,是马斯克亲自睡在工厂帐篷,从流水线开始重新设计,不仅是汽车革命更是生产方式和效率的重大变革,于是才有从年销百辆到年销近两百万辆。
马斯克几乎从来不按常理出牌,正如最近特斯拉董事给马斯克开出1万亿美元的薪酬方案,要求马斯克10年内把公司市值从1万亿干到8.5万亿,交付2000万辆汽车,把robotaxi无人出租车业务做到100万辆,交付100万台Optimus。
这意味着特斯拉需要年均复合增长率达到26%,市值达到两个英伟达加半个微软,可以说是前无古人。马斯克对此是表示欢迎的,虽然这份薪酬方案仍需要11月份董事会投票决定。
当然光是各种“画饼”显然不会让董事会和股东们信服的,所以马斯克在最近花了10亿美元大手笔购入257万股特斯拉股票。市场对此反应迅速且积极。文件披露后,特斯拉股价在周一盘前交易中一度飙升超过8%,触及428美元水平,推动公司市值猛增约1000亿美元。
关键时刻还得是马斯克啊,特斯拉董事长Robyn Denholm在接受媒体采访时,称马斯克为“一代人一遇的领导者”,并强调留住他是“优化特斯拉未来的最佳方式”。
虽然AI泡沫化已经喊了好几年,我们没看到泡沫破裂,相反头部玩家还在加码AI投入,部分业绩已经开始兑现。最致命的泡沫从来不是杠杆太高,而是无法落地的业绩,只是击鼓传花的游戏。
无论是AI还是机器人,现在是谈论终局为时尚早,当下要做的是更多的人和资本涌入,打好基础设施,在各行各业做好应用铺垫,敢于去做那个万亿市场的梦想。