物理AI:走出屏幕,重构工业范式

2026年被产业界视为物理AI元年。

今年以来，“物理AI”（Physical AI）频繁出现在产业一线的讨论中。从黄仁勋将其定义为人工智能演进的下一站，到英伟达、特斯拉、华为发布会上的高频曝光，这一概念正从极客圈的术语转化为产业界的公共议题。然而热闹之下，能够把“它是什么、为何重要、如何落地”讲清楚的人并不多。

近期，中欧国际工商学院北京校区“智荟中欧·前沿技术探索与商业化实践”系列活动上，多位嘉宾联合呈现了AI从大脑到四肢、从思考到行动的完整图景。其中，中欧EMBA2023级北京2班校友付强长期深耕物理AI领域，他结合一线实践指出：物理AI已是落地推进的产业范式变革，或将全面重塑工业领域格局。

以下为付强校友演讲内容整理。

核心概览

✦当所有人都在谈物理AI，他们在谈什么

✦核心变革：从“相关性”到“因果性”

✦五层架构：物理AI落地全景图

✦落地案例：接管GW级算力中心

✦写在最后：国产工业软件迎来窗口期

付强

中欧EMBA2023级

光合泰智（杭州）科技有限公司创始人

当所有人都在谈物理AI

他们在谈什么

物理AI并非PPT上的下一个口号，而是一场已经开始落地的工业范式切换。

从去年CES上黄仁勋勾勒的人工智能演进路径（判别式AI→生成式AI→智能体AI→物理AI），到软银创始人孙正义近日将物理AI与机器人作为下一阶段核心投资方向（此前软银以53.75亿美元收购ABB机器人业务），再到孙宇晨直言“普通AI落幕，物理AI才是未来三年主线”——产业、资本、流量三股力量正同时涌入，“Physical AI”几乎成为每位试图讲述AI新故事的人都会挂在嘴边的关键词。

图片由AI生成

要理解物理AI的位置，不妨先回到大语言模型本身。今天广为人知的GPT、Claude、DeepSeek，底层均建立在Transformer架构之上，本质上是由海量语料训练出的“全科生”——靠刷题、靠记忆、靠概率，看得越多、答得越流畅。然而这套范式有一个绕不开的副作用：幻觉。模型按“下一个词最有可能是什么”的概率推进，当语料覆盖不够时，便会顺势“编”下去。

在闲聊、文案等场景中，幻觉的代价并不高，重写一次即可，但放到工业现场，幻觉就是事故。炼钢炉里热空气如何分布、温度如何走，一步计算偏差可能意味着数十万的损失乃至安全事故；GW级数据中心中，数万张GPU的散热、配电与冗余排布若被模型“编”出一个方案，整座机房可能直接宕机。

工业领域最不能接受的正是黑盒与“拍脑袋”，它需要的是精细化控制、实时响应、可解释、可信、可用，却又常面临数据稀缺、语料不足——没有哪家钢厂能像ChatGPT那样把全行业数据喂给模型。

如果说过去的AI是请来一位语文老师教所有学生，那么进入工业场景，必须再请一位物理老师，这正是“物理AI”要解决的问题。

回到黄仁勋的那条演进路径——为什么物理AI被放在终点？因为前三个阶段主要在数字世界里运转，只有物理AI，能让AI真正跨出屏幕，走进物理世界。

核心变革

从“相关性”到“因果性”

要理解物理AI的价值，需要先看清工业领域过去30年的两次范式切换。

第一次：实物试错→传统工业仿真。Ansys、COMSOL以及国内各类CAD/CAE/EDA软件，本质上都是把流体力学、电磁学、化学反应等已知物理公式写进求解器，靠超算硬算。从原子弹爆炸的数值模拟到天气预报，皆由此而来。这条路绝对准确，但痛点清晰：慢且贵，一次复杂流场仿真动辄六小时起步。

这也是中国工业软件被“卡脖子”的重灾区——以EDA为例，电路仿真涉及60余项关键技术点，国产替代多年，目前满足其中40余项，剩下20余项仍在攻坚。

第二次：纯物理仿真→机器学习赋能。用海量数据训练模型，让其自行寻找规律，是过去十年行业的主流路径。它泛化能力强，但给出的是相关关系，而非因果关系。

在银行刷脸开户这一场景中，模型告诉你“是你”或“不是你”，本质上是一个相关性打分——两眼间距、鼻子位置、嘴角关系匹配到一定分数便算“是你”，即便你胖了50斤、老了20岁，只要骨骼固定就能识别。但若追问“为什么这张脸不是我”，模型给不出答案——它只给概率，不给因果。

图片由AI生成

而工业场景恰恰需要因果：为什么这台机器能耗骤增？空调是否应当加大风量？这些问题若无“因为所以”的链条，控制便无从下手。物理AI的关键突破，在于把物理公式重新放回模型，给出因果。

这带来三重价值：数据需求显著下降，有物理方程兜底，无需暴力堆料；精度高，所有结论皆有公式可追溯；模型可解释，能告诉你因为A所以B，不再是黑盒。

更具想象力的是，它能够仿真已知与未知的所有工况——数据覆盖不到的极端场景同样能算，这在工业场景中几乎是降维打击。

五层架构

物理AI落地全景图

物理AI如何落地？我们团队在一篇Nature论文中提出了一个五层架构，近期与英伟达联合编写的《一本书讲透物理AI》正是围绕这五层展开。一句话概括：几何层是骨架，感知层是神经，仿真层是大脑，决策层是行动，自主层是意志。而把“物理老师”真正请进模型的，是中间的仿真层。

几何层——物理世界的骨架

即“这个东西长什么样”。过去工程师靠CAD手绘，今天AI可以拍照、扫描、自动识别、自动建模,把物理实体翻译成数字孪生的骨架。

需要说明的是，“数字孪生”在中国市场存在认知错位——许多企业主理解的数字孪生，是公司大门口那块价值十几万的大屏。若它当真只值一块屏，整个高科技行业便无从谈起。因此团队特意把这一层从“数字孪生”中拎出，命名为“几何层”。

感知层——多模态融合的神经末梢

以自动驾驶为例。今天购入一辆智能汽车，销售会报出一长串配置：几个激光雷达、几个毫米波雷达、几个倒车雷达、几个摄像头。这些传感器的目的在于尽可能丰富地把物理世界扫入模型。

为何需要如此多种？雨天摄像头看不清，需要激光雷达补位；夜间视觉效果差，需要红外补位。在此之上，视觉、点云、传感器、车速、天气、刹车摩擦系数等，需要全部融合进同一状态空间。

前方50米突然蹦出一只小动物，该不该刹、刹不刹得住——这是一道极其复杂的实时计算题。工业场景中同理：炼钢炉内有温度、压力、流量、气体成分等各类传感器，感知层要把所有信号融合，给出对世界的完整描述。

仿真层——最核心、也最具想象力的一层

仿真层目前有三条技术路线。

第一条是显式物理仿真。把流体力学、电磁学、热力学的公式严格求解，靠CPU硬算，Ansys、COMSOL均属此类。精度极高，速度偏慢，是过去三十年工业仿真的主流方法。

第二条是物理信息机器学习（PIML）。也是我们团队当前选择的路线，这种方法通过构建物理信息神经网络（PINN），在传统深度学习的损失函数之外加入物理约束，让神经网络在学习数据的同时，必须遵守流体力学方程、热传导方程等物理规律，从而兼具数据的泛化能力与物理的可解释性。

第三条是世界模型。“AI教母”李飞飞《我看见的世界》中阐述的正是这一路径——通过海量视频让AI反向推理这个世界应有的模样，看得足够多便能“暴力出奇迹”。

去年Sora的出圈正是世界模型的首次亮相。如今Seedance表现强势，底层支撑是字节庞大的视频素材库。举例来说，如果把拍有中欧北京校区校门左半边的视频交给模型，它就能直接补全右半边，因为它曾“见过”这个地方。

世界模型当前主要有三大应用方向：视频生成、游戏生成、机器人控制。

三条路线的区别，可以理解为“物理老师”把知识塞进模型的方式不同——有的直接写公式，有的让模型在数据里学公式，有的则是让模型看视频“悟”出公式。而无论选哪条路线，要想让AI能够根据仿真结果反向优化设计，都离不开一项基础能力——可微分仿真。

传统仿真是“我有一个设计，仿真它的结果”，属于正向求解。可微分仿真则反其道而行之：直接告诉AI你想要的结果，由AI反向推导出设计方案。以某车型0.23的风阻系数为例，过去工程师要画图、做模型、吹风洞、测量、反馈、再改图，循环往复；而可微分仿真则直接输入目标风阻，让AI反向推出车身的造型参数。

这条路工程上仍需以十年计，但一旦闭环，意味着人类想要在月球建基地将不再需要工程师参与设计——AI反向推出图纸，机器人正向制造。听起来像《流浪地球》的桥段，但物理上确实成立。

决策层——从“试错”到“现场答题”

仿真层让“物理老师”把世界算清楚了，接下来要决定如何动手——这是决策层的事。决策层的演进，可以理解为从“盲试”到“有方向的优化”，再到“实时自主”的过程。

最初是现场试错，靠大量尝试，硬试出最优参数，效率极低。随后引入强化学习，给模型设定奖励函数，做对了有奖励，做错了没有，模型逐步学会该往哪走。再进一步引入梯度优化，模型不仅知道“往哪走更好”，还能直接朝最优方向快速前进，这也是当前工业界和多数具身智能公司所处的位置。而未来三年将迈向第四阶段——在线优化与后策略学习，模型既能把握方向，又能临场发挥，面对未知工况也能实时给出最优决策，真正做到“现场答题”。

图片由AI生成

自主层——从“人在回路”到“AI在回路”

最后一层涉及人机关系的根本命题：人在回路还是机器在回路。

第一次开带高阶辅助驾驶的车，多数人不会闭眼撒手，而是选择双手扶住方向盘，随时准备接管，这便是“人在回路”。以我自己的使用体验为例，自动驾驶有时会在路口犹豫不决，有时又激进闯灯，这意味着当下仍然需要人的注意力在场。

但未来必将走向“机器在回路”。偏远地区的太阳能基地、储能站、数据中心等，未来五年内大概率不再需要人值守，可以由机器自我管理。

五层架构最终汇聚的形态，是多智能体协同（Multi-Agent）。在几何层、感知层、仿真层、决策层、自主层之上，运行着热力专家、流体专家、电力专家、调度专家等一群专家智能体，它们彼此会商、彼此校验，共同输出对一个工业系统的最优决策。

这才是物理AI真正的产业愿景。

落地案例

接管GW级算力中心

理论之外，介绍一个我们团队当下重点推进的案例，也是当前最炙手可热的赛道——算力中心优化。

图源自英伟达官方博客

英伟达今年绘制了一张人工智能的“五层蛋糕”：最底层为能源，向上依次是芯片、AI基础设施、模型、AI应用。能源是整个蛋糕的底层基座，黄仁勋的原话是“Can you get enough power?”——电是美国人的烦恼，在中国，如何把电用好才是挑战。

一座1GW级数据中心的电力消耗往往如下：约20%被散热消耗、约10%消耗于各类能源转换损耗、约10%被重启故障消耗，真正用于算力的仅约60%。这意味着接近40%的电被管理成本浪费。这也是国家“十五五”规划中反复强调的“算电协同”——既要有足够的电，也要把电用好。

我们团队所做的，是用物理模型把算力、电力、热力三股流统一仿真起来，覆盖数据治理、设计、验证、采集、生成全流程。

以一个与英伟达联合完成的千卡集群案例为例。设计阶段，过去需要资深工程师耗时一个月，如今提出需求即可由AI自动出图；运行阶段，过去调节空调温度与风量需40分钟才能看到整个热场变化；如今参数一动，热场实时更新；复杂流场仿真过去需要6小时，如今几秒便可完成，提速5000倍以上。运维结果上，GPU热故障下降约92%，整体能耗PUE显著降低，单个数据中心年节省价值近千万。

更关键的是，这套系统把“设计工具”与“运维工具”合而为一——过去两套人马、两套软件，如今一个模型，从机房建成到关停，全程不需要人值守。

类似的实践，团队也在钢厂炼钢炉、轧钢炉热气流管理，以及橡胶厂的热仿真中落地。

写在最后

国产工业软件迎来窗口期

回到企业家与投资人最关心的问题——这件事与我有什么关系？三个判断。

其一，物理AI不是大语言模型的对手，而是大语言模型够不到的工业纵深。对话、写作、设计、营销等场景，大语言模型已足够好。但所有“经不起幻觉”的场景——制造、能源、化工、交通、医疗——都是物理AI的主战场。

其二，物理AI是国产工业软件难得的窗口期。过去30年，中国追美国的EDA、CAE、CAD软件，始终未能追上，因为对手已迭代数十年。但在AI时代用AI重做一遍工业软件，所有玩家重回同一起跑线。这一窗口期，对真做技术的团队是机会，对买技术的企业同样是机会。

其三，物理AI落地的基础已经齐备。算力到位、模型成熟（从Transformer到物理神经网络）、需求明确（“AI+各行各业”已成共识）、底座可用。缺的不是技术，而是真正懂行业know-how的人把它做出来。

回到开篇那个比喻：过去我们请了一位语文老师教所有学生，凡是能背、能套、能写的事，AI都能胜任。但工业世界中尚有大量经不起幻觉、需要因果、需要实时控制的事——这些事，终于到了请物理老师上场的时候。

我们期待，物理AI能够革新工业未来。

编辑 | 陶若诚

推荐阅读 | 校友故事

化解世界杯版权僵局的人，为何是她？

点击卡片，关注中欧北京校区

点赞推荐给更多朋友