

摘要
SUMMARY

Figure AI 的 Figure 03,交付量正式突破 350 台。350 台,这个数量放在汽车产业可能不值一提,但在人形机器人这个"量产元年"刚刚开启的赛道里,它代表的信号极其强烈。更值得玩味的是创始人 Brett Adcock 在 Sunnyvale 总部对 500 名工程师说的一句话:
"我们的目标,是让园区里行走的机器人数量,超过人类。"
今天,我们就从这三个数字——350 台、120 天、90% 成本降幅——出发,拆解 Figure AI 到底做对了什么,以及它对全球人形机器人格局意味着什么。
一、从 Figure 01 到 03:三代进化的真实代价
要理解 350 台的意义,必须先看懂 Figure 的产品演进逻辑。
Figure 01(2022 年):能走起来就够了
2022 年亮相的 Figure 01,前臂是拿脚部电机强行改的,单台造价高达数十万美元。
Brett Adcock 后来坦承:那代产品的研发策略就是"为追求速度,能凑合就凑合"。它的存在意义,只是证明一件事:人形机器人能走起来。
Figure 02(2024 年):集成化跨越
二代完成了几个关键跨越:电池塞进了躯干,算力翻了三倍,甚至进入了宝马工厂,参与 X3 的组装。
但问题也很明显:复杂的 CNC 工艺和内部结构,让 Figure 02 的成本根本降不下来。全球部署约 50 台,更像是高端技术展示,而非商业化开端。
Figure 03(2026 年):从奢侈品到工业标准品
第三代才是真正的转折。
成本较二代降低约 90%——这个数字意味着人形机器人终于开始摆脱"烧钱玩具"的标签。同时,第七代灵巧手集成了高级触觉传感器,机身配备软包防护。
350 台交付,就是这个背景下产生的。
二、Helix VLA:全栈神经化的豪赌
Figure 03 最令人不安的地方,不在硬件,而在软件。
他们彻底放弃了传统手写 C++ 控制代码。
传统人形机器人的控制逻辑,是工程师一行一行写规则:"遇到这个场景,执行那个动作。"Figure 的做法是:让神经网络从零开始学。
这套系统叫 Helix VLA(Vision-Language-Action,视觉-语言-动作模型),训练数据量近百万小时。它通过机载 GPU 实时推断像素空间,直接理解环境并输出扭矩指令。
换句话说,机器人看到的不是"一堆坐标",而是"这是楼梯,这是坡道,这是地上的箱子"——然后像人类一样,自然地调整重心、迈步、抓取。
而 Helix 的升级版 让机器人头部的 RGB 相机参与进来,把图像实时提升为三维空间表示。
看见和感受的区别是什么? 是机器人终于能像人一样,在看到楼梯之前就调整步态,而不是踩上去才发现"哦,这有个台阶"。
更重要的是,这一切都在机载 GPU 上完成,无需联网。这意味着:你的家用机器人不会因为断网而瘫在原地,也不会把你的家庭画面传到云端。
三、NeverFall:人形机器人的"门槛级能力"
2026 年 3 月,Figure 发布了一段令人震撼的测试视频。
研究人员人为切断机器人单个膝盖关节的电源——按常理,这应该导致机器人直接摔倒。但 Figure 03 通过智能调整重心,实现了"跛行自救",自主返回维修区。
这个项目叫 Vulcan,目标是实现"永不跌倒"的鲁棒性。
为什么这很重要?因为人形机器人要进入工厂和家庭,第一个被问到的问题永远是:"它会不会伤到自己或周围的人?"
NeverFall 能力,就是回答这个问题的技术底座。传统机器人做不到这一点——它们的控制逻辑是预设的,遇到未训练过的故障模式,只能摔倒或停机。
而 Figure 的路线是:用强化学习在模拟器中练出自适应能力,让机器人能应对"没见过的意外"。
四、BotQ 工厂:量产—数据—进化的工业飞轮
人形机器人公司最大的"死穴"是什么?产能爬坡。
你技术再强,造不出来,等于零。Figure 非常清楚这一点,所以他们建了一座叫 BotQ 的制造工厂——不是简单的组装线,而是为实现"量产—数据—进化"工业飞轮而专门设计的基地。
飞轮是怎么转起来的?
第一步:量产。 Figure 用不到 120 天,把产能从"每天 1 台"提升到"每小时 1 台",周产量暂时锚定在 55 台左右。整机线末直通率超过 80%,电池 Pack 良率高达 99.3%。
第二步:数据。 每一台交付出去的机器人,都在真实场景里产生数据——宝马工厂的零部件组装、物流仓库的包裹分拣、家庭环境的轻柔操作。这些数据,回流到 Helix 模型的训练集。
第三步:进化。 模型越强,机器人的通用能力越强;通用能力越强,能卖的场景就越多;卖得越多,数据就越多。
飞轮一旦转起来,后来者几乎追不上。
五、商业模式创新:月租 400 美元,比人工便宜
说到商业化,Figure 在商业模式上的创新,值得单独拿出来讲。
传统工业机器人是怎么卖的?几十上百万美元一台,企业一次性买断,然后用十年。
Figure 想做的是:月租 400 到 600 美元。
对,你没听错。一台人形机器人,月租不到一部 iPhone Pro Max 的价格。
这个模式的逻辑非常清晰:企业不需要承担高额资本支出,只需支付运营成本。而 400-600 美元的月租,已经低于美国大部分仓储和工厂岗位的时薪成本。
如果一台机器人能 24/7 工作,且不拿加班费、不要求社保——这个账,任何企业主都会算。
技术如何支撑这个模式?
Figure 设计了配套的 2kW 脚部无线感应充电系统,以及 30 秒热插拔替换机制。
意思是:机器人没电了,自动走回充电位;真出了故障,另一台机器人顶上——用户享受到的是"24/7 不眠不休的劳动力",而不是一台需要维护的机器。
这个模式如果跑通,对人形机器人产业的冲击,不亚于当年 Netflix 从 DVD 租赁转向流媒体订阅。
六、终极问题:AGI 会在机器人身上先实现吗?
最后,说一个让我印象最深的判断。
Brett Adcock 认为:真正的 AGI,可能会在机器人身上先实现——而不是在大语言模型身上。
为什么?因为机器人有"物理交互反馈"——它触碰世界,观察结果,从后果中学习。这是人类智能的核心拼图,也是纯数字模型永远无法完全获得的东西。
大语言模型学的是文本和视频,是"关于世界的知识"。而机器人学的是"世界本身"——物理规律、因果关系、行动后果。
如果 Adcock 这个判断是对的,那么 Figure 押注全栈神经网络控制、押注物理世界数据,就不是一次技术路线的选择,而是对 AGI 实现路径的一次根本性下注。

好了,今天就聊到这里,欢迎点赞关注,获取更多人形机器人产业深度解析。
点赞关注
百泽AI机器人

夜雨聆风