刘夏:四大阵营逐鹿物理AI,一场改写现实的产业战争刚刚开场

作者 | 刘夏

云核变量控股董事长、皓宁云核资本创始合伙人，毕业于贝叶斯商学院，曾就职于伦敦德意志银行、瑞银集团。具备丰富的一、二级市场经验，深耕私募股权、IPO、金融衍生品交易等多维度资本运作，成功推动数家企业完成境内外上市，长期受邀担任央视财经频道嘉宾、主流财经媒体专栏作者。

如果说大语言模型撬开了AI认知世界的天花板，物理AI便是将AI从数字比特拽进物理现实的核心杠杆。当下的物理AI赛道早已脱离实验室概念阶段，演变为一场横跨多产业阵营的全域卡位战，其分量堪比二十年前的互联网基建、十年前的移动互联网入口，谁掌握了物理世界的数字化推演能力，谁就握住了下一个技术时代的话语权。

当前布局物理AI的企业清晰分化为四大阵营，各有底牌也各有路径。

第一阵营是互联网与科技巨头，手握数据、算力与生态，试图从不同维度定义物理AI的标准。6月下旬，阿里十余天内连发Qwen-Robot系列、HappyOyster 1.0与Qwen-AgentWorld三张牌，同时切入具身智能大脑、虚拟内容生成与语言世界训练，同步争夺物理、虚拟、语言三重世界的定义权。就在两个月前，腾讯正式发布并开源HY-World系列，走3D内容工业化路线，支持多模态输入输出3D资产，依托游戏与社交场景落地关卡制作、虚拟拍摄与数字孪生。

字节跳动凭借抖音与TikTok每日超10亿次视频流，以EX-4D框架将单目视频转为4D多视角场景，对标谷歌Genie 3与Meta V-JEPA 2。2026年6月火山引擎FORCE原动力大会上，字节并未正式发布这款世界模型，仅对外亮出豆包Seed 2.1系列、Seedance 2.5视频生成模型等前台产品；同期，据业内媒体披露，字节2026年AI战略将“世界模型年底达到全球SOTA”列为首要命题，该项目仍处于内部打磨阶段。华为盘古大模型走产业闭环路线，不单独标榜世界模型，而是作为智能驾驶与具身智能的训练底座，支撑华为ADS实现“两天一个版本”的迭代速度。到2026年6月HDC 2026，盘古大模型升级至7.0，配套昇腾910C算力底座，但世界模型仍延续内嵌产业场景的思路，未单独发布新版本，这一核心路线始终保持一致。放眼全球，谷歌、Meta、英伟达均已重兵押注，英伟达Omniverse更是早已成为工业仿真标杆，足见这是一场全球同步的技术竞赛。

第二阵营是整车企业，作为物理AI最迫切的落地方，它们把世界模型当成智驾系统的“驾校与考场”。6月18日，蔚来正式向全系用户推送NWM（NIO World Model）2.0版本，覆盖超过70万全系用户，支持四年前购车的老车主免费升级，同步落地Banyan、Cedar、Coconut+四大整车系统。AEB覆盖场景达到标准AEB的6.7倍，误制动概率降至十万公里一次，也正是这次升级让蔚来的世界模型正式完成从技术概念到规模化量产落地的跨越。其初代NWM世界模型则最早发布于2024年7月发布，定位为中国首个智能驾驶世界模型。

6月的理想Livis Day技术开放日，理想公布，从DrivingSphere仿真环境迭代至马赫VLA架构，车端双芯片总算力达2560 TOPS，实现感知、预测、规划能力统一，同步公布车端双M100芯片总算力2560 TOPS、系统反应时间0.28秒的核心参数，并给出明确落地路线图：2026年第三季度向AD Max用户推送全新马赫VLA系统，第四季度目标对齐特斯拉FSD V14。同在今年6月，小鹏首次对外展示了完整的世界模型技术图谱，进一步明确其向AI汽车、机器人、飞行汽车多场景延伸的技术路线。

2026年4月1日，小鹏正式发布X-World世界模型技术报告，明确其基于视频扩散生成技术打造，仿真场景规模从一年前的3万个扩充至50多万个，每日仿真测试里程等效3000万公里实车测试，同时支持在线强化学习与海外数据生成。吉利、长城也纷纷推进舱驾融合与VLA方案量产，依托海量存量车队数据快速迭代。

第三阵营是智能驾驶供应商，它们是藏在产业底层的“隐形引擎”，将物理AI做成可复用的标准化方案。Momenta R7强化学习世界模型依托超120亿公里实车里程提炼的1亿段黄金数据预训练，已搭载超90万台量产车辆，覆盖210余款定点车型；地平线HorizonDrive凭借自纠错训练技术，在公开数据集上轨迹精度提升21%，单张消费级显卡即可生成驾驶视频，帮助车企低成本验证高阶智驾。

第四阵营是创业公司，凭借专注与速度冲击技术单点，在原生世界模型、3D空间生成等方向激进探索，但普遍面临数据、算力与落地场景的挑战。据行业媒体统计，国内目前可明确归类的世界模型创业公司共33家，其中85%成立于2023年之后，赛道累计整体融资规模超260亿元，是当前AI领域融资热度攀升最快的细分赛道。技术路线上已分化出六大清晰方向，分别是原生通用世界基座模型、VLA融合具身路线、3D空间生成路线、自动驾驶仿真路线、物理AI仿真路线与Agent交互世界路线，其中原生通用世界模型与具身VLA融合路线资本关注度最高。

地域分布呈现高度集聚特征，北京、上海、深圳三地汇聚了超80%的创业公司，其中北京依托清华、北大等顶尖高校科研资源占据半壁江山，仅海淀区就聚集了半数头部项目，形成了以高校实验室为源头的技术外溢产业集群。团队背景呈现“顶尖学术+产业经验”的双源特质，核心创始团队超60%出自清华、北大、港中文等高校AI实验室，多数拥有地平线、商汤、阿里达摩院等头部科技公司的一线研发经历；赛道内已有4家公司由00后青年学者创立，高学历技术型创始人是绝对主力。融资端呈爆发式增长，2026年上半年单项目平均融资额超3.2亿元，头部项目估值快速跃升。

整体来看，赛道仍处于技术验证向规模化落地过渡的早期阶段，头部公司已在核心评测指标上追平国际水平，但普遍存在真实场景数据不足、商业化路径待跑通的共性问题，未来1-2年将是技术路线收敛与产业闭环形成的关键窗口期，竞争将从“谁能做出模型”转向“谁的模型能嵌入产业闭环”。

物理AI的落地早已突破单一赛道，正在重构众多产业规则。首当其冲的是自动驾驶，它彻底改写了智驾研发逻辑：过去靠实车跑里程积累长尾场景，一年难遇几次极端工况，如今靠世界模型无限生成暴雨突发行人、前车爆胎等极端场景，研发模式从“遇Bug再修复”转向“生成场景先验证”，迭代效率呈数量级提升。其次是人形机器人产业，物理AI让机器人拥有了“脑内训练场”。人形机器人领域，宇树科技、智元机器人等头部厂商均已搭建自研世界模型仿真训练体系，在虚拟环境中完成行走、避障、精细操作等技能的千万次试错后再进行实机微调，据咨询机构统计数据，采用该模式的人形机器人新技能迭代周期缩短72%，实机调试成本降低61%。工业场景是落地最成熟的领域：宝马集团联合英伟达基于Omniverse平台搭建全链路虚拟工厂，在数字孪生环境中完成装配机器人的轨迹规划、碰撞校验与全流程调试，官方披露其装配精度控制在毫米级，单条产线的机器人部署调试周期较传统方式缩短65%；国内华为盘古大模型已落地工业机械臂训练场景，通过高精度数字物理空间仿真实现抓取姿态预演与碰撞预测，使机械臂新场景适配效率提升4倍以上。物理AI的底层物理推演能力正应用于气候预测、材料设计、药物研发等领域，将天价实体实验搬进数字空间，大幅降低试错成本，尽管目前仍处早期，但其长期想象空间远超单一消费级应用。

内容产业领域是离普通用户最近的赛道。从阿里HappyOyster的开放式世界生成到腾讯HY-World的3D内容工业化，再到海外Sora、Genie 3展现的实时交互能力，物理AI正在打破内容生产的成本边界：未来输入一段文字即可生成可探索的虚拟城市，互动短剧、虚拟陪伴、文旅元宇宙都将成为同一技术能力的不同切面，撬动全球万亿美元级的游戏与影视市场，内容生产成本有望降低一个数量级。

之所以说物理AI才刚刚拉开产业基础设施的序幕，核心源于三重判断。其一，技术层面尚未形成通用底座。当前物理AI模型大多是垂直场景专用：车企模型只服务智驾仿真，内容厂商模型只做3D生成，不同领域的模型难以复用，远未出现跨场景通用的物理大模型，这很像2019年之前的大语言模型赛道，垂直模型百花齐放，通用底座的革命尚未到来。其二，产业渗透仍处极早期阶段。目前落地相对成熟的只有自动驾驶赛道，机器人应用刚起步，内容产业还停留在原型演示，工业仿真更是只在头部企业小范围试点，就像互联网初期只有邮件与门户网站，真正改变社会的电商、云计算等基础设施级应用还未爆发，物理AI对产业的改造才刚刚触及表层。其三，价值释放还停留在降本阶段。当下物理AI的商业价值大多体现为节省测试成本、减少制作费用、缩短调试周期，本质是对现有产业流程的效率优化，而非创造全新增量市场。就像云计算最初只是帮企业节省IT开支，直到催生出SaaS、云原生等全新业态，才真正成为数字经济的基础设施。

物理AI的终极价值，是构建与物理世界实时映射、双向交互的数字底座，支撑所有实体产业的智能化升级，而今天所有的布局与落地，都只是为这座宏大基建打下的第一根桩。当AI真正读懂万物运行规律、能预判现实演化、可直接驱动物理行动，它才会从“信息处理工具”升级为“世界运行引擎”，而我们此刻正站在这场产业革命的破晓之时。