从数字AI到物理AI:当人工智能学会推门-夜雨聆风

从数字AI到物理AI:当人工智能学会推门

在过去的十八个月里，全球最聪明的头脑们沉浸在一场前所未有的文字游戏里。大语言模型学会了写诗、编程、通过律师资格考试，甚至展现出某种令人不安的共情能力。

投资者们为此付出了数千亿美元的赌注，硅谷的电力消耗曲线几乎垂直上升。

然而，就在这片喧嚣达到顶峰时，一个更安静、却可能更具颠覆性的转变正在发生。它的标志不是一篇论文或一次发布，而是一扇被推开的门。

去年底，一家中国初创公司展示了一段视频：一个安装了AI系统的机器人手臂，第一次尝试推开一扇弹簧门。这不是预设程序——它从未见过这扇门。

它必须理解“铰链”的物理概念，估算门的重量和弹簧的阻力，实时调整手臂的力度和角度。在失败了三次之后，第四次，它成功了。

这个看似微不足道的动作，标志着一个时代的开始。人工智能正在从数字世界伸出双手，准备触碰现实。人们把它叫作“物理AI”。

思考与行动的鸿沟

要理解这场转变的意义，不妨想象一个场景。让今天最强大的大语言模型——假设是GPT-5或更高级的系统——为你泡一杯咖啡。

它会迅速生成一份完美的步骤说明：取豆、研磨、烧水、冲泡、过滤。措辞优雅，细节完整，甚至可能附带一句“请慢用”。

然而，这份说明书对房间里的一台机器人毫无意义。

它不知道“取豆”意味着识别咖啡豆包装的材质，估算摩擦力以避免豆子散落一地；“研磨”需要理解研磨机的物理结构，判断旋钮的转动方向与力度；“烧水”涉及对液体晃动的实时感知与控制。

现实世界充满了数字模型无法捕捉的微妙之处：材质的触感、流体的行为、不可预测的摩擦力。

过去十年的人工智能革命，本质上是关于信息的革命——理解、生成和操纵符号。

它取得了辉煌的胜利。但数字AI始终停留在一个封闭的世界里：输入文本，输出文本。现实世界的混乱、不确定性和物理法则被完美地排除在外。

物理AI要跨越的，正是这条从思考到行动的鸿沟。它的核心不再是“知道了什么”，而是“做到了什么”。它要求系统在毫秒之间完成感知、推理、决策和执行的完整闭环。

一个自动驾驶汽车传感器采集的画面，不再是供人类观看的图像，而是机器理解世界、并决定下一秒方向盘转动多大角度的依据。

一个机器人手臂上的触觉传感器数据，不是要被记录下来的日志，而是实时调整夹爪力度以免捏碎一颗番茄的指令。

这是人工智能一次根本性的能力跃迁。

闭环的威力

物理AI的真正威力，在于数据闭环和商业闭环之间形成的正反馈飞轮。这与纯粹的软件产品截然不同。

当一个数字AI写错一首诗，用户耸耸肩，可能再试一次。损失是零。但当一个物理AI未能识别前方的行人，代价可能是生命。

这种严苛的要求，反过来成了一个难以复制的优势：物理AI的每一次行动都会产生独一无二、高价值的数据，这些数据又会被用来训练更强大的模型。

更好的模型意味着更安全的产品，更安全的产品带来更大的销量，更大的销量又产生更多的数据。

这种循环在自动驾驶领域已经清晰可见。特斯拉凭借数百万辆在路上行驶的汽车，收集了竞争对手难以匹敌的真实驾驶数据。Momenta CEO曹旭东最近在北京车展上的言论印证了这一点。

他指出，智能驾驶领域的规模效应“比芯片行业更显著”——软件的边际成本为零，而每多一个客户，系统不仅成本在下降，性能也在提升。

“对主机厂来说，先发优势极为强大，”曹旭东说，“国际OEM的采购周期可能长达五到七年。一旦进入，几乎无法撼动。”

这正是为什么他预测，全球智驾供应商最终只会剩下三到四家。这不是技术决定的，是物理决定的——规模决定了谁能留在牌桌上。

属于谁的门票

但智驾本身只是序章。

曹旭东的定义相当坦率：自动驾驶是“物理AI的序章”。它的重要性在于，它是目前唯一一个已经实现数据闭环和商业闭环双重运行的物理AI领域。这意味着现金流。而现金流，用他的话说，是“门票”。

“物理AI是有门票的，”他说，“而这个门票就是你的现金流业务，无论如何一定要有一个现金流业务来支撑物理AI的研发。”

门票的价格是惊人的：百亿甚至千亿美元级别的投入。这不是一句修辞。训练一个能够在物理世界中安全运行的基础模型，需要海量的真实世界数据、巨量的仿真模拟算力，以及最关键的——在真实环境中反复试错的成本。

这与在大规模文本语料库上训练语言模型完全不在一个量级。

因此，Momenta的战略逻辑是清晰且冷酷的：用已经或即将盈利的智能驾驶业务，去支撑机器人技术的研发。赚今天的钱，交明天的门票。

这不是一家公司的选择，而是行业生存法则的体现。那些没有现金流的物理AI公司，无论技术多么惊艳，都将在通往终点的道路上被淘汰。

新世界的轮廓

当物理AI成熟之时，世界会变成什么样？

首先是汽车。它不再是交通工具，而是移动的物理AI终端。2025至2035年间，全球预计将出厂1.45亿台物理AI设备，其中自动驾驶汽车是最大的单一品类。

汽车的竞争维度将从马力、内饰转向算力、传感器和数据的闭环能力。传统汽车巨头面对的不再是造车新势力，而是需要驾驭物理AI的全新商业逻辑。

接着是工厂。今天的工业机器人大多是“瞎子”和“固定动作的重复者”——它们被围栏隔开，执行预设轨迹。物

理AI将让它们睁开眼睛，处理动态变化的任务：识别散落的零件，操作柔性材料，与人类安全地协作。MarketsandMarkets预测，到2032年，全球物理AI市场将达到1524亿美元，年复合增长率超过47%。

然后是家庭。人形机器人的终极承诺——一个能够叠衣服、打扫卫生、烹饪饭菜的通用家用机器人——将在物理AI的基础上成为可能。这可能是增长最快的细分领域，年复合增长率高达73%。

还有一个更深远的变化：实现“人智溢出”。正如蒸汽机溢出体力，物理AI将开始溢出部分人类智能。技术将不再只是思考的工具，而成为行动的伙伴。人类的智能第一次有了体外的行动延伸。

中国的时刻

在这场转变中，中国的角色不可忽视。原因不仅在于技术和资本，更在于场景。

中国拥有全球最完整的制造业链条和最丰富的工业应用场景。当美国公司可能在为算法突破而欢呼时，中国企业正在工厂车间里让物理AI解决一个具体的分拣难题。

这种“场景驱动”的迭代模式，在物理AI的竞争中可能成为一种被低估的优势。Momenta的路径选择——扎根于