一、Fremont 工厂最后一辆车下线之后
2026 年 5 月 9 日晚上 9 点,太平洋时间。特斯拉 Fremont 工厂的最后一辆 Model S 和最后一辆 Model X 驶下产线。两条产线合计生产了超过 61 万辆车,Model S 跑了 14 年,Model X 跑了 11 年。最后下线的是 Signature Edition 限量版——250 辆 Model S Plaid 和 100 辆 Model X Plaid,只留给长期客户。
同一栋楼里,新的装配线即将安装。产线要换产品了,这次不是汽车,是人形机器人。
Musk 在 Q1 2026 财报电话会上说,计划用 4 个月完成旧产线拆除、新产线安装、全线投产。他用了"insanely fast"这个词,认为这个速度"地球上没有公司做到过"。
但同一个电话会上,他也说了另一段话:
「Optimus 有 10,000 个全新零部件,全部来自全新的供应链,没有一个经历过大规模量产。产线速度取决于第 10,000 个零件里最倒霉、最慢、最笨的那个。这种事情根本没法预测。」
他没有给出 2026 年的产量目标。
一年前,他说 2025 年要造大约 10,000 台 Optimus。到 2026 年 1 月,他承认零台 Optimus 在特斯拉工厂里做"有用的工作"。现在的目标只是"开始生产",没有数量承诺。初始技能也仅限于"工厂里的简单任务"。
Gen 3 的发布从 Q1 推迟到了年中。推迟的理由是竞争对手会"逐帧分析"发布的视频然后抄袭。
这个说法本身就能看出问题:硬件层面的技术壁垒,可能没有资本市场想的那么高。看一遍 demo 视频就能抄个大概,那真正的竞争就不在硬件外观了。
Fremont 工厂年产能在 10 万辆级别,Model S/X 的销量已经萎缩到每年约 3 万辆。停掉这两条线是为了给 Optimus 腾空间,但 Optimus 什么时候能产生同等收入,没人能回答。特斯拉目前靠 Megapack 储能业务在撑着利润,Cybercab 和 Optimus 还在追 headline。
5 月 9 日那天,最后一辆 Model S 下线时,工人们站在车旁合影。这栋楼见证过特斯拉从濒临破产到全球市值最高车企的全过程。现在它要被拆掉重来。4 个月后,这里将不再有汽车驶出产线,取而代之的,是双足行走的人形机器人——如果一切顺利的话。
二、三家公司的三条路,三种赌法
直接看数据。
Figure AI,估值 390 亿美元,2025 年 Series C 融资超过 10 亿美元,领投方包括 Nvidia、Intel、Qualcomm、Salesforce。
它的 BotQ 工厂在不到 120 天里把 Figure 03 的生产速度从每天 1 台提升到每小时 1 台——24 倍增长。截至 2026 年 4 月底,累计下线超过 350 台第三代人形机器人。
产线细节:150 多个联网工作站运行自研的制造执行软件;对数百家供应商来料进行准入检验;生产过程中有 50 多个在制品检验点;末端一次通过率 80% 以上且还在每周改善;电池产线一次通过率 99.3%,出货超过 500 个电池包;生产了超过 9,000 个执行器、覆盖 10 多个不同型号。
每台机器人出厂前要做 80 多项功能验证测试,包括深蹲、肩推、慢跑——用数千次循环来模拟真实使用,提前筛出早期失效的零件。
Figure 在 BMW 的产线上有实际部署。它和另外两家最大的区别在于,不是实验室里做 demo,是在客户的真实工厂里跑。而且它有自己的 Field Service Management 系统、Fleet Management 系统、OTA 升级基础设施——这套服务运维体系,一般只有车企才会搭建。
1X Technologies,挪威创立、OpenAI 投资,融资 1 亿美元。它在加州 Hayward 开了一家 58,000 平方英尺的工厂,号称美国第一家垂直整合的人形机器人量产工厂。第一年年产能目标 10,000 台,2027 年底目标 100,000 台。目前雇佣 200 多人,还在扩招。
NEO 的定价是 2 万美元买断(Early Access,2026 年优先交付),或者每月 499 美元订阅。2025 年 10 月预售开放后 5 天,第一年的产能就卖完了。
1X 的策略和 Figure 完全不同——不跟工厂抢客户,直接把机器人送进美国家庭。它的机器人设计刻意做得更轻、更软,没有夹伤人的风险点,这是为家庭环境做的安全取舍。计算平台用的是 Nvidia Jetson Thor,训练用 Nvidia Isaac 仿真框架。
它还有一条企业线:和私募巨头 EQT 合作,在 2026-2030 年间向 EQT portfolio 公司部署最多 10,000 台 NEO,覆盖设施运营、制造、物流和医疗。用企业端的高毛利来补贴消费端的规模化,电动车也是这么走过来的。
特斯拉,走的是垂直整合路线。从电机到传感器到芯片到算法全部自研,目标把 Optimus 的价格压到 2 万美元以下,远期年产能目标 1,000 万台。第二座工厂在 Giga Texas 建设中,预计 2027 年夏季投产,生产 Gen 4。
三家公司的产能目标放在一起看:
产能不等于出货,出货不等于能用。Figure 在工厂里实际跑,1X 还没交付到用户手里,特斯拉还在建产线。
Figure 03 的装配线上,每一台出厂前要做深蹲、肩推、慢跑。80 多个测试项暴露早期硬件缺陷。人形机器人终于进入了工业品质检阶段。
三、竞争从本体参数转向了 Physical AI
Figure 在 2026 年 1 月 27 日发布了 Helix 02,这是它最新的全身控制模型。
三层架构,各自运行在不同的时间尺度上:
System 0,执行层。1kHz 的频率(每秒 1,000 次),1000 万参数,负责平衡、接触和全身协调。用超过 1,000 小时的人类关节级运动数据训练——这些人类动作数据被 retarget 到机器人的关节空间。训练全部在仿真环境中完成,20 万个并行环境,大量域随机化。它替代了 109,504 行手写 C++ 代码。
System 1,控制层。200Hz 的频率,连接所有传感器到所有执行器——头部摄像头、手掌摄像头、指尖触觉传感器、全身本体感知。指尖触觉传感器能感知小到 3 克的力,大约是一个回形针的重量。这是一个 transformer 架构,接收 System 2 的语义潜变量,输出全身关节目标,由 System 0 在 kHz 级别追踪。
System 2,认知层。理解场景和语言,给 System 1 下达目标指令。Helix 02 大幅扩展了 S2 能指定的行为范围——从原来的"拿起番茄酱",到现在的"走到洗碗机前打开它""把碗搬到台面上""回到上层架子拿杯子"。S2 不需要规划脚步,也不需要指定如何协调手臂和腿——它给出一系列语义潜变量,S1 解读为运动指令,S0 执行。
Helix 02 做了一个 4 分钟的端到端自主任务:走到洗碗机前、开门、取碗碟、穿过房间、放进橱柜、启动洗碗机——61 个连续动作,全程无人干预,没有重置。Figure 说这是目前人形机器人完成的最长、最复杂的自主任务。
1X 走的是另一条路。2026 年 1 月发布的 World Model,用互联网规模的视频数据做预训练,然后微调机器人数据。用户给一个文本或语音指令,机器人用视频模型"想象"未来动作画面,再通过内置的逆向动力学模型把想象变成精确的动作。
开马桶盖、推推拉门、熨衬衫、给人梳头——这些任务它之前没见过,没有训练数据,靠的是从互联网视频里学到的物理直觉。两家公司的数据采集方式完全不同:Figure 需要人类采集运动数据来训练,1X 用互联网视频就能教会机器人新任务。这条路走得通的话,1X 的数据采集成本会比 Figure 低得多。
特斯拉的护城河在另一个地方——FSD 数据。百万辆车在路上跑,积累的视觉感知数据可以直接迁移到 Optimus。其他玩家都没有这个优势。但前提是 Optimus 的硬件得先能跑起来。
厨房里,Figure 03 花 4 分钟完成 61 个连续动作:走到洗碗机前、取碗、穿过房间、放进橱柜、启动洗碗机——全程无人干预。单个神经网络从像素到全身关节的端到端控制。它犯错的代价不是代码崩溃,是打碎一只碗。
四、中国供应链的真实位置——成本碾压,但"灵魂"在哪?
麦肯锡在人形机器人供应链报告里有个数据:
用中国供应链造一台 Optimus Gen 2,物料成本约 4.6 万美元。用非中国供应链,约 13.1 万美元。差了近 3 倍。
摩根士丹利预测,到 2034 年,靠中国供应链的持续优化,BOM 成本能压到 1.6 万美元。
差距从哪儿来。
执行器(关节),占硬件 BOM 的 40%-60%。2026 年国产通用关节模组量产价已经降到 1500-3000 元/个,同性能进口品牌要 3000-6000 元。全尺寸机器人标配 32-40 个自由度,单台伺服执行系统成本 4.8 万-11 万元。
谐波减速器——绿的谐波已经打入特斯拉 Optimus 和宇树灵巧手的供应链,打破了日本哈默纳科的长期垄断。
行星滚柱丝杠——在 Optimus Gen 2 的 BOM 里占比 19%,单台用量 10-14 根。这是国产化率还比较低的环节,加工难度大,扩产周期长。北特科技、恒立液压在推进。
六维力传感器——曾高达数万元一个,是降本重点。柯力传感、坤维科技在做国产替代。
中邮证券拆解过宇树 G1,这是 2025 年全球出货量第一的产品(5,500+ 台)。基础版整机 BOM 约 4.16 万元,售价 8.5 万元,毛利率 40.7%。EDU 版售价 16.9-30.9 万元,毛利率 63.5%-66.7%。
关节系统占 BOM 的 60% 以上:9 个大关节约 1.35 万元(外径 80mm,单件 1500 元,二级行星减速,减速比 20.58),14 个小关节约 1.4 万元(外径 60mm,单件 1000 元,重 525 克)。电机选用低惯量高速内转子永磁同步电机,最高转速 3000-5000 转/分钟,这是 G1 能完成后空翻的动力来源。
G1 的取舍也很明显:被动散热为主,连续工作只有 1-2 小时;单臂最大负载 2 公斤。工业级高强度作业还扛不住。
中国供应链的软肋在两个地方。
稀土永磁体——高扭矩密度执行器离不开钕铁硼磁体,中国掌控全球约 69% 的稀土开采和 90% 的磁体加工产能。2025 年 4 月起实施的出口管制已经在行业内引发波动。Musk 公开说过磁体供应紧张影响了 Optimus 的量产节奏。
中国供应链的成本优势建立在稀土加工产能上,但出口管制会推高海外客户的采购风险。短期看是筹码,长期看会加速海外替代产能的建设。
算力芯片——宇树 G1 基础版用瑞芯微 3588(6 TOPS NPU),EDU 版加装英伟达 Orin NX(100 TOPS)。如果先进算力芯片的供应受限,高端机型的 AI 能力会直接受影响。
硬件便宜了,大脑却可能被卡。
深圳华强北的电子市场里,一台人形机器人的关节模组报价已经跌到 1500 元。但同一栋楼的楼上,AI 工程师正在用 Nvidia Jetson Thor 跑 VLA 模型——这块芯片,美国禁了。
五、投资地图:哪些环节是卖铲子的人?
把产业链拆开看。
确定性最高的增量部件:
空心杯电机——用在灵巧手的手指上,体积极小(直径约 13mm),响应极快。灵巧手成为人形机器人标配后,需求量从零开始爆发。鸣志电器、鼎智科技在做。业内预测到 2029 年全球需要 200 万只灵巧手,单只成本有望降到 1.5 万元,对应约 300 亿元的市场规模。2030 年力传感器市场规模预计超过 300 亿元。
谐波减速器——用量大,头部企业规模效应明显。绿的谐波是龙头,已经拿到特斯拉和宇树的订单。
弹性最大的国产替代环节:
行星滚柱丝杠——单台价值量高,技术难度大,国产化率低。一旦突破,业绩弹性最大。北特科技、恒立液压。
六维力传感器——灵巧手和平衡控制的刚需,单价高,进口替代空间大。柯力传感。
供应链确定性:
Figure 的 BotQ 工厂已经达到每小时一台的节拍——每年就是 8,760 台。这个产能对应零部件需求是确定性的。Figure 供应链上的 A 股公司包括长盈精密(龙头)、领益智造、绿的谐波、兆威机电。
特斯拉的供应链——万向钱潮、拓普集团、三花智控——但特斯拉的量产时间表一直在跳票,确定性不如 Figure。
1X 的供应链——垂直整合度高,核心部件自研(电机、电池、结构件、传动系统、传感器),外部供应商的机会相对少。
长期壁垒在软件和数据:
硬件最终会同质化。关节模组、减速器、传感器都变成标准品的时候,真正的护城河是"大脑"——具身大模型和物理世界交互数据。
Figure 的逻辑:每多生产一台机器人,就多一个数据采集引擎。350 台机器人就是 350 个数据源。这些数据反哺 Helix 模型,模型更强,客户更多,产量更大,数据更多。Nvidia 投 Figure 不只是看好机器人,更是在给自己的 GPU 生态找一个新增长点——机器人训练需要大量 GPU。
1X 的逻辑更激进:用互联网视频数据训练 World Model,机器人自己教自己。如果这条路走通,它的数据获取成本会比所有人都低一个数量级。OpenAI 投 1X,等于给 GPT 系列模型找一个物理世界的出口。
特斯拉的逻辑:我有 FSD 的百万辆车数据,加上垂直整合的硬件控制力,最终成本和性能都能做到最好。但前提是硬件得先跑通。
一条谐波减速器产线从规划到满产需要 18 个月。今天下单的减速器,要到 2027 年底才能交付。整机厂说"明年量产 1 万台"的时候,供应链可能连专用产线都还没建好。
六、终局推演
三种路径,三种赌法。
特斯拉的路径是垂直整合加数据飞轮。FSD 百万辆车的数据积累是其他所有玩家都不具备的优势。自研电机、传感器、芯片、算法,一旦跑通,成本和性能都能做到极致。但时间表信誉已经透支——2025 年目标 10,000 台,实际零台;Gen 3 从 Q1 推到年中;Fremont 产线 4 个月转换,但 Cybertruck 从量产到上量用了超过一年。特斯拉最终可能胜出,但大概率会迟到 3-5 年。
Figure 的路径是工业场景加制造能力。BotQ 工厂已经跑通每小时一台,BMW 产线上有实际部署,Helix 02 的 4 分钟自主任务是目前行业最复杂的 demo。估值 390 亿美元意味着它需要更快的商业化变现来支撑——350 台机器人的收入远远不够。Figure 的终局可能是成为工业场景的标杆,但如果不能在短期内扩大部署规模,390 亿美元的估值会变成一个沉重的包袱。
1X 的路径最激进——直接把机器人送进美国家庭。$20,000 买断或 $499/月订阅,首年 10,000 台预售已售罄。家庭场景跑通,1X 就是下一个 Roomba 级别的产品——一个消费级硬件入口,背后是持续订阅收入和源源不断的真实场景数据。家庭场景跑不通,10,000 台产能就是沉没成本。家里跟工厂不一样,环境不可预测,用户不会容忍一个经常出错的机器人。
中国公司在供应链和量产上有优势,但在前沿 AI 架构、系统集成和安全认证上,欧美在构建差异化壁垒。麦肯锡的判断是全球供应链走向"双轨并行"——中国率先压降硬件成本,欧美在 AI 能力和系统整合上拉开差距。
两条不同的爬坡路线——一条从硬件便宜开始往上走,一条从 AI 聪明开始往下走。最终会在中间某个地方相遇。
相遇的那一天,决定胜负的标准可能很简单:谁的机器人能在用户家里或者工厂里,不间断地干活,不出错。
在那之前,所有估值、所有产能目标、所有 demo 视频,都只是过程中的注脚。
2029 年的某个早晨,机器人在厨房里帮你倒咖啡。它没有经过任何专门训练——昨晚它通过世界模型看了 1000 段人类倒咖啡的视频,然后在今早第一次尝试中就做到了。而它的主人昨晚只是说了句:"明天帮我倒杯咖啡。"
本文数据来源:Figure AI 官方博客、1X Technologies 新闻稿、Electrek、TheNextWeb、麦肯锡人形机器人供应链报告、摩根士丹利研究报告、中邮证券宇树 G1 拆解报告、36 氪、新浪财经等。不构成投资建议。
夜雨聆风