乐于分享
好东西不私藏

从数字AI到物理AI:当人工智能学会推门

从数字AI到物理AI:当人工智能学会推门

在过去的十八个月里,全球最聪明的头脑们沉浸在一场前所未有的文字游戏里。大语言模型学会了写诗、编程、通过律师资格考试,甚至展现出某种令人不安的共情能力。

投资者们为此付出了数千亿美元的赌注,硅谷的电力消耗曲线几乎垂直上升。

然而,就在这片喧嚣达到顶峰时,一个更安静、却可能更具颠覆性的转变正在发生。它的标志不是一篇论文或一次发布,而是一扇被推开的门。

去年底,一家中国初创公司展示了一段视频:一个安装了AI系统的机器人手臂,第一次尝试推开一扇弹簧门。这不是预设程序——它从未见过这扇门。

它必须理解“铰链”的物理概念,估算门的重量和弹簧的阻力,实时调整手臂的力度和角度。在失败了三次之后,第四次,它成功了。

这个看似微不足道的动作,标志着一个时代的开始。人工智能正在从数字世界伸出双手,准备触碰现实。人们把它叫作“物理AI”。

思考与行动的鸿沟

要理解这场转变的意义,不妨想象一个场景。让今天最强大的大语言模型——假设是GPT-5或更高级的系统——为你泡一杯咖啡。

它会迅速生成一份完美的步骤说明:取豆、研磨、烧水、冲泡、过滤。措辞优雅,细节完整,甚至可能附带一句“请慢用”。

然而,这份说明书对房间里的一台机器人毫无意义。

它不知道“取豆”意味着识别咖啡豆包装的材质,估算摩擦力以避免豆子散落一地;“研磨”需要理解研磨机的物理结构,判断旋钮的转动方向与力度;“烧水”涉及对液体晃动的实时感知与控制。

现实世界充满了数字模型无法捕捉的微妙之处:材质的触感、流体的行为、不可预测的摩擦力。

过去十年的人工智能革命,本质上是关于信息的革命——理解、生成和操纵符号。

它取得了辉煌的胜利。但数字AI始终停留在一个封闭的世界里:输入文本,输出文本。现实世界的混乱、不确定性和物理法则被完美地排除在外。

物理AI要跨越的,正是这条从思考到行动的鸿沟。它的核心不再是“知道了什么”,而是“做到了什么”。它要求系统在毫秒之间完成感知、推理、决策和执行的完整闭环。

一个自动驾驶汽车传感器采集的画面,不再是供人类观看的图像,而是机器理解世界、并决定下一秒方向盘转动多大角度的依据。

一个机器人手臂上的触觉传感器数据,不是要被记录下来的日志,而是实时调整夹爪力度以免捏碎一颗番茄的指令。

这是人工智能一次根本性的能力跃迁。

闭环的威力

物理AI的真正威力,在于数据闭环和商业闭环之间形成的正反馈飞轮。这与纯粹的软件产品截然不同。

当一个数字AI写错一首诗,用户耸耸肩,可能再试一次。损失是零。但当一个物理AI未能识别前方的行人,代价可能是生命。

这种严苛的要求,反过来成了一个难以复制的优势:物理AI的每一次行动都会产生独一无二、高价值的数据,这些数据又会被用来训练更强大的模型。

更好的模型意味着更安全的产品,更安全的产品带来更大的销量,更大的销量又产生更多的数据。

这种循环在自动驾驶领域已经清晰可见。特斯拉凭借数百万辆在路上行驶的汽车,收集了竞争对手难以匹敌的真实驾驶数据。Momenta CEO曹旭东最近在北京车展上的言论印证了这一点。

他指出,智能驾驶领域的规模效应“比芯片行业更显著”——软件的边际成本为零,而每多一个客户,系统不仅成本在下降,性能也在提升。

“对主机厂来说,先发优势极为强大,”曹旭东说,“国际OEM的采购周期可能长达五到七年。一旦进入,几乎无法撼动。”

这正是为什么他预测,全球智驾供应商最终只会剩下三到四家。这不是技术决定的,是物理决定的——规模决定了谁能留在牌桌上。

属于谁的门票

但智驾本身只是序章。

曹旭东的定义相当坦率:自动驾驶是“物理AI的序章”。它的重要性在于,它是目前唯一一个已经实现数据闭环和商业闭环双重运行的物理AI领域。这意味着现金流。而现金流,用他的话说,是“门票”。

“物理AI是有门票的,”他说,“而这个门票就是你的现金流业务,无论如何一定要有一个现金流业务来支撑物理AI的研发。”

门票的价格是惊人的:百亿甚至千亿美元级别的投入。这不是一句修辞。训练一个能够在物理世界中安全运行的基础模型,需要海量的真实世界数据、巨量的仿真模拟算力,以及最关键的——在真实环境中反复试错的成本。

这与在大规模文本语料库上训练语言模型完全不在一个量级。

因此,Momenta的战略逻辑是清晰且冷酷的:用已经或即将盈利的智能驾驶业务,去支撑机器人技术的研发。赚今天的钱,交明天的门票。

这不是一家公司的选择,而是行业生存法则的体现。那些没有现金流的物理AI公司,无论技术多么惊艳,都将在通往终点的道路上被淘汰。

新世界的轮廓

当物理AI成熟之时,世界会变成什么样?

首先是汽车。它不再是交通工具,而是移动的物理AI终端。2025至2035年间,全球预计将出厂1.45亿台物理AI设备,其中自动驾驶汽车是最大的单一品类。

汽车的竞争维度将从马力、内饰转向算力、传感器和数据的闭环能力。传统汽车巨头面对的不再是造车新势力,而是需要驾驭物理AI的全新商业逻辑。

接着是工厂。今天的工业机器人大多是“瞎子”和“固定动作的重复者”——它们被围栏隔开,执行预设轨迹。物

理AI将让它们睁开眼睛,处理动态变化的任务:识别散落的零件,操作柔性材料,与人类安全地协作。MarketsandMarkets预测,到2032年,全球物理AI市场将达到1524亿美元,年复合增长率超过47%。

然后是家庭。人形机器人的终极承诺——一个能够叠衣服、打扫卫生、烹饪饭菜的通用家用机器人——将在物理AI的基础上成为可能。这可能是增长最快的细分领域,年复合增长率高达73%。

还有一个更深远的变化:实现“人智溢出”。正如蒸汽机溢出体力,物理AI将开始溢出部分人类智能。技术将不再只是思考的工具,而成为行动的伙伴。人类的智能第一次有了体外的行动延伸。

中国的时刻

在这场转变中,中国的角色不可忽视。原因不仅在于技术和资本,更在于场景。

中国拥有全球最完整的制造业链条和最丰富的工业应用场景。当美国公司可能在为算法突破而欢呼时,中国企业正在工厂车间里让物理AI解决一个具体的分拣难题。

这种“场景驱动”的迭代模式,在物理AI的竞争中可能成为一种被低估的优势。Momenta的路径选择——扎根于