👆点击关注,让每个人都看见AI红利

本文由TOKEN圈原创,引用请注明出处
就在最近,物理AI这个词突然传得到处都是。英伟达发布Cosmos 3,并宣布成立全球开发者联盟;比亚迪、特斯拉、小鹏等造车势力亮出物理AI技术图谱,人形机器人IRON预计2026年底量产;美团悄然加大研发投入,要用AI改造线下服务网络。杨立昆离开Meta,创立AMI Labs,种子轮融资超10亿美元。软银以53.75亿美元签约收购ABB机器人业务(尚待监管批准),英伟达一年内参与超过65笔AI投资,用资本和算力把物理AI产业链锁死在自有生态里。
一时间各方豪杰齐聚一堂搅动风云,他们都说物理AI是未来。
但很少有人真正解释清楚:物理AI究竟是什么?是杨立昆追求了十年的“世界模型”终于开花结果,还是资本需要一个新的泡沫来延续AI的估值神话?
三拨人,三个心思
物理AI不是空壳套话。技术层面,当下确实在发生三件真实的事,但注意,这三条路要去的是不同的地方。
一,杨立昆想造“懂事的”。
他早在2022年就提出联合嵌入预测架构,核心思想是让AI在抽象表征空间中预测因果,而不是在像素空间中死记硬背。一个三岁的孩子看到积木塔倒塌,立刻知道“是因为底部那块歪了”。当前最强的AI模型,只会描述“积木散落一地”,不会推导因果关系。
JEPA的价值就在这里——它让AI学习压缩后的因果结构,而不是拟合像素细节。今年3月,团队发布LeWorldModel,仅1500万参数,规划速度提升48倍。这不是PPT,是真东西。
二,英伟达想造“听话的”。
混合Transformer架构,160亿到640亿参数,打通视觉推理、世界生成、动作预测三大能力。它本质上是“超级仿真器”加“动作规划器”的融合体,用巨量算力和数据训练出一个足够逼真的世界模型。
英伟达的目标很明确:把物理AI的训练和评估周期从数月缩短至数天。与此同时,其成立的全球开发者联盟,本质是用生态锁定产业链上的每一个关键节点,从模型到工具链到硬件,全部圈进自己的地盘。
三,造车势力想造“干活的”。
本质都是把汽车的技术和制造能力“平移”到机器人身上——用自家工厂做训练场,先服务自己,再服务别人。区别在于,比亚迪靠的是“制造业的底子”,庞大的供应链和规模化能力,把成本压低,用性价比铺量。
小鹏靠“算法的底子”:用端到端大模型让机器人像人一样直接感知、思考、行动,技术突破的锐度更高。特斯拉则是“大一统”的先驱,从芯片到模型到机器人,全栈自研,试图用一个智能系统统治所有物理载体。
三条路,三种哲学:JEPA追求“理解”,Cosmos追求“仿真”,VLA追求“能用”。它们都是物理AI,但它们要去的不是同一个地方。
世界顶级资本团体的大合奏
但物理AI的热度为什么是这个时间点突然指数级膨胀?
首先是AI本身的价值叙事到瓶颈了。大模型之后,自动驾驶的故事讲得差不多了,生成式视频的热度在消退。资本需要一个更大、更远、更无法短期证伪的题材。物理AI恰好符合:它连接着自动驾驶、机器人、智能制造、智慧城市,每一个子赛道都是可以吹成万亿级市场。
其次是硬件周期的倒逼。英伟达Blackwell/Ultra芯片产能已经释放,2025-2026年AI算力供给远超需求。芯片厂商必须找到新的“算力消耗场景”来维持出货量。物理AI恰好是最吃算力的赛道——世界模型的仿真训练需要海量GPU小时。这不是技术需求驱动的,是产能消化需求驱动的。
最后,头部玩家在完成“朋友圈”锁定。英伟达用投资换订单,软银用收购造身体,它们不是阴谋串通,而是市场机制让这些巨鳄在同一个时间点看到了同一个机会,然后各自行动。
结果就是:这场赌局,资本家赌物理AI能接住下一波增长,工程师赌自己能造出真家伙。中西资本在没有任何中央指令的情况下,实现了方向上的高度一致。一切竟又隐隐指向2028,命运的奇点在赤马红羊共振,我们正在见证历史!
论剑华山:天下英雄竞争鸣
这场中西资本合奏的台前幕后吓死人,几乎所有有头有脸的角色都已就位。
主机厂派从造车自然延伸到造人。理想汽车将物理AI作为核心战略,产品理念从“移动的家”升级到“硅基家人”;小米的“铁大”机器人已入驻自有工厂,并开源了47亿参数的VLA模型;吉利通过沃飞长空布局“飞行汽车”,直接挑战三维物理世界;蔚来创始人李斌个人投资了具身智能初创公司,为更广泛的物理世界应用探路。
科技巨头派不造具体的“身体”,而是聚焦“大脑”。华为依托昇腾、盘古和鸿蒙,做算力底座与全栈融合;谷歌发布了具备物理一致性的世界模型Gemini Omni,试图让AI真正理解三维世界;微软推出专为机器人设计的轻量级VLA模型Rho-alpha,主打低部署成本;Meta的Reality Labs投入与VR/AR生态,本质上就是在构建可交互的3D物理世界。
行业新贵派以通用人形机器人为直接目标。Figure AI估值390亿美元,获微软、英伟达、OpenAI加持;宇树科技堪称“价格屠夫”,核心硬件超95%自研,价格仅为同行三分之一;智元机器人由华为“天才少年”创立,专注灵巧操作;优必选是港股“人形机器人第一股”,已在比亚迪、蔚来等工厂实训;波士顿动力从液压转型,正与英伟达合作换上“最强大脑”;1X Technologies由OpenAI支持,专注于家庭场景。
最后一公里派在特定物理环境中解决问题。亚马逊机器人车队已超100万台,构建了全球最庞大的工业物理AI试验场;字节跳动、阿里巴巴、美团三家罕见联手,共同押注家用场景机器人。
而英伟达和OpenAI,则是这场论剑中特殊的“军火商”——前者通过Cosmos、Omniverse和GPU,为所有门派打造武器与内功心法,其物理AI相关业务年收入已突破60亿美元;后者则通过投资Figure、1X等最具潜力的团队,扮演技术脑力输出者。
物理AI的“江湖”已现雏形,各派系、各门类均已登场。但比招式更重要的,是谁能最终整合感知、决策、执行、数据、算力、场景这六大要素。
哲学却不愿苟合
然而,当所有人都开始说“物理AI”时,这个词本身的含义已经被稀释到几乎失去边界。杨立昆的物理AI,追求的是“理解”,而不是“记忆”。他反复批评生成式视频模型——无论Sora还是Cosmos——都是在“记住像素”,而不是“理解物理”。一个模型可以生成一段完美的足球比赛视频,但它不知道足球为什么会被踢出去。它能拟合表象,但不能推导因果。
英伟达的物理AI,是把足够多的数据、足够强的算力、足够逼真的生成效果堆在一起,让机器人在仿真中训练足够多的次数,从而覆盖现实世界的大多数场景。它追求的是工程可用性,不是理论理解。
造车势力的物理AI,是和世界模型结合,解决自动驾驶中的具体问题。它的世界模型更接近“轨迹预测器”,也不是通用物理理解。
这三条路线,在技术层面上各有价值。但当资本把它们全部塞进“物理AI”这个筐里,问题就出现了。
资本需要的是确定性,而不是复杂性。投资人的世界里,最好是一个故事讲给所有人听。杨立昆的哲学深度、英伟达的工程能力、小鹏的落地速度,在资本叙事中被压缩成同一个标签:“物理AI大爆发”。任何技术路线的分歧、哲学基础的差异、商业化进度的不同,都会被这个标签模糊掉。
于是出现了一个荒诞的局面:杨立昆追求“让AI理解因果”,但他的名字被挂在无数“数据缝合”式物理AI的产品介绍里。英伟达做的是超级仿真器,但被包装成“世界模型的终极形态”。小鹏做的是自动驾驶感知预测,但被称为“物理世界基座模型”。
没人撒谎,但每个人都只讲了对自己有利的那部分真相。这不是欺骗,这是叙事压缩——复杂的技术路线差异,在资本市场的信息带宽里,只能被压缩成一个可交易的标签。
物理AI的资本叙事会崩吗?短期内不会。
因为它有真切的技术支撑,有产品在卖银子,有资金在投入。这不是2000年互联网泡沫的简单复现——那时很多公司连商业模式都没有。现在英伟达、小鹏、美团的物理AI,都是有现金流支撑的业务。
但它会经历分化。未来两年,我们或许会看到:
伪物理AI概念会被淘汰。那些只是把“环境预测”改名叫“世界模型”的公司,会在投资人开始追问“你的因果推理能力怎么验证”时露出破绽。
真物理AI会走出各自的分支。资本会从“撒网式投资”转向“收敛式押注”。当第一批物理AI公司的财报显示“烧钱烧不出盈利”时,只有那些真正解决了具体场景问题的公司,才能继续拿到钱。
物理AI是不是真实的未来?没人知道,但它的价格已经被资本推到未来好几步之外。泡沫里既有水分,也有种子。水分会蒸发,种子会发芽。
这场论剑如果有终局的话,不取决于谁先喊出这个词,而取决于谁先证明:AI不仅能模拟物理世界,还能在物理世界里赚到钱。在那之前,所有的叙事都是期权——有价值,但会过期。
往期回顾:
解剖Token经济学:制造业AI的“去中心化”vs服务业AI的“资本垄断”
黄仁勋和Marvell CEO的对话,点开了铜铝的结构性牛市窗口
点击关注获得最新动态👇
夜雨聆风