


2026年被产业界视为物理AI元年。
今年以来,“物理AI”(Physical AI)频繁出现在产业一线的讨论中。从黄仁勋将其定义为人工智能演进的下一站,到英伟达、特斯拉、华为发布会上的高频曝光,这一概念正从极客圈的术语转化为产业界的公共议题。然而热闹之下,能够把“它是什么、为何重要、如何落地”讲清楚的人并不多。
近期,中欧国际工商学院北京校区“智荟中欧·前沿技术探索与商业化实践”系列活动上,多位嘉宾联合呈现了AI从大脑到四肢、从思考到行动的完整图景。其中,中欧EMBA2023级北京2班校友付强长期深耕物理AI领域,他结合一线实践指出:物理AI已是落地推进的产业范式变革,或将全面重塑工业领域格局。
以下为付强校友演讲内容整理。
核心概览
✦当所有人都在谈物理AI,他们在谈什么
✦核心变革:从“相关性”到“因果性”
✦五层架构:物理AI落地全景图
✦落地案例:接管GW级算力中心
✦写在最后:国产工业软件迎来窗口期

付强
中欧EMBA2023级
光合泰智(杭州)科技有限公司创始人
01
当所有人都在谈物理AI
他们在谈什么
物理AI并非PPT上的下一个口号,而是一场已经开始落地的工业范式切换。
从去年CES上黄仁勋勾勒的人工智能演进路径(判别式AI→生成式AI→智能体AI→物理AI),到软银创始人孙正义近日将物理AI与机器人作为下一阶段核心投资方向(此前软银以53.75亿美元收购ABB机器人业务),再到孙宇晨直言“普通AI落幕,物理AI才是未来三年主线”——产业、资本、流量三股力量正同时涌入,“Physical AI”几乎成为每位试图讲述AI新故事的人都会挂在嘴边的关键词。

图片由AI生成
要理解物理AI的位置,不妨先回到大语言模型本身。今天广为人知的GPT、Claude、DeepSeek,底层均建立在Transformer架构之上,本质上是由海量语料训练出的“全科生”——靠刷题、靠记忆、靠概率,看得越多、答得越流畅。然而这套范式有一个绕不开的副作用:幻觉。模型按“下一个词最有可能是什么”的概率推进,当语料覆盖不够时,便会顺势“编”下去。
在闲聊、文案等场景中,幻觉的代价并不高,重写一次即可,但放到工业现场,幻觉就是事故。炼钢炉里热空气如何分布、温度如何走,一步计算偏差可能意味着数十万的损失乃至安全事故;GW级数据中心中,数万张GPU的散热、配电与冗余排布若被模型“编”出一个方案,整座机房可能直接宕机。
工业领域最不能接受的正是黑盒与“拍脑袋”,它需要的是精细化控制、实时响应、可解释、可信、可用,却又常面临数据稀缺、语料不足——没有哪家钢厂能像ChatGPT那样把全行业数据喂给模型。
如果说过去的AI是请来一位语文老师教所有学生,那么进入工业场景,必须再请一位物理老师,这正是“物理AI”要解决的问题。
回到黄仁勋的那条演进路径——为什么物理AI被放在终点?因为前三个阶段主要在数字世界里运转,只有物理AI,能让AI真正跨出屏幕,走进物理世界。
02
核心变革
从“相关性”到“因果性”
要理解物理AI的价值,需要先看清工业领域过去30年的两次范式切换。
第一次:实物试错→传统工业仿真。Ansys、COMSOL以及国内各类CAD/CAE/EDA软件,本质上都是把流体力学、电磁学、化学反应等已知物理公式写进求解器,靠超算硬算。从原子弹爆炸的数值模拟到天气预报,皆由此而来。这条路绝对准确,但痛点清晰:慢且贵,一次复杂流场仿真动辄六小时起步。
这也是中国工业软件被“卡脖子”的重灾区——以EDA为例,电路仿真涉及60余项关键技术点,国产替代多年,目前满足其中40余项,剩下20余项仍在攻坚。
第二次:纯物理仿真→机器学习赋能。用海量数据训练模型,让其自行寻找规律,是过去十年行业的主流路径。它泛化能力强,但给出的是相关关系,而非因果关系。
在银行刷脸开户这一场景中,模型告诉你“是你”或“不是你”,本质上是一个相关性打分——两眼间距、鼻子位置、嘴角关系匹配到一定分数便算“是你”,即便你胖了50斤、老了20岁,只要骨骼固定就能识别。但若追问“为什么这张脸不是我”,模型给不出答案——它只给概率,不给因果。

图片由AI生成
而工业场景恰恰需要因果:为什么这台机器能耗骤增?空调是否应当加大风量?这些问题若无“因为所以”的链条,控制便无从下手。物理AI的关键突破,在于把物理公式重新放回模型,给出因果。
这带来三重价值:数据需求显著下降,有物理方程兜底,无需暴力堆料;精度高,所有结论皆有公式可追溯;模型可解释,能告诉你因为A所以B,不再是黑盒。
更具想象力的是,它能够仿真已知与未知的所有工况——数据覆盖不到的极端场景同样能算,这在工业场景中几乎是降维打击。
03
五层架构
物理AI落地全景图
物理AI如何落地?我们团队在一篇Nature论文中提出了一个五层架构,近期与英伟达联合编写的《一本书讲透物理AI》正是围绕这五层展开。一句话概括:几何层是骨架,感知层是神经,仿真层是大脑,决策层是行动,自主层是意志。而把“物理老师”真正请进模型的,是中间的仿真层。
几何层——物理世界的骨架
即“这个东西长什么样”。过去工程师靠CAD手绘,今天AI可以拍照、扫描、自动识别、自动建模,把物理实体翻译成数字孪生的骨架。
需要说明的是,“数字孪生”在中国市场存在认知错位——许多企业主理解的数字孪生,是公司大门口那块价值十几万的大屏。若它当真只值一块屏,整个高科技行业便无从谈起。因此团队特意把这一层从“数字孪生”中拎出,命名为“几何层”。

感知层——多模态融合的神经末梢
以自动驾驶为例。今天购入一辆智能汽车,销售会报出一长串配置:几个激光雷达、几个毫米波雷达、几个倒车雷达、几个摄像头。这些传感器的目的在于尽可能丰富地把物理世界扫入模型。
为何需要如此多种?雨天摄像头看不清,需要激光雷达补位;夜间视觉效果差,需要红外补位。在此之上,视觉、点云、传感器、车速、天气、刹车摩擦系数等,需要全部融合进同一状态空间。
前方50米突然蹦出一只小动物,该不该刹、刹不刹得住——这是一道极其复杂的实时计算题。工业场景中同理:炼钢炉内有温度、压力、流量、气体成分等各类传感器,感知层要把所有信号融合,给出对世界的完整描述。
仿真层——最核心、也最具想象力的一层
仿真层目前有三条技术路线。
第一条是显式物理仿真。把流体力学、电磁学、热力学的公式严格求解,靠CPU硬算,Ansys、COMSOL均属此类。精度极高,速度偏慢,是过去三十年工业仿真的主流方法。
第二条是物理信息机器学习(PIML)。也是我们团队当前选择的路线,这种方法通过构建物理信息神经网络(PINN),在传统深度学习的损失函数之外加入物理约束,让神经网络在学习数据的同时,必须遵守流体力学方程、热传导方程等物理规律,从而兼具数据的泛化能力与物理的可解释性。
第三条是世界模型。“AI教母”李飞飞《我看见的世界》中阐述的正是这一路径——通过海量视频让AI反向推理这个世界应有的模样,看得足够多便能“暴力出奇迹”。
去年Sora的出圈正是世界模型的首次亮相。如今Seedance表现强势,底层支撑是字节庞大的视频素材库。举例来说,如果把拍有中欧北京校区校门左半边的视频交给模型,它就能直接补全右半边,因为它曾“见过”这个地方。
世界模型当前主要有三大应用方向:视频生成、游戏生成、机器人控制。

三条路线的区别,可以理解为“物理老师”把知识塞进模型的方式不同——有的直接写公式,有的让模型在数据里学公式,有的则是让模型看视频“悟”出公式。而无论选哪条路线,要想让AI能够根据仿真结果反向优化设计,都离不开一项基础能力——可微分仿真。
传统仿真是“我有一个设计,仿真它的结果”,属于正向求解。可微分仿真则反其道而行之:直接告诉AI你想要的结果,由AI反向推导出设计方案。以某车型0.23的风阻系数为例,过去工程师要画图、做模型、吹风洞、测量、反馈、再改图,循环往复;而可微分仿真则直接输入目标风阻,让AI反向推出车身的造型参数。
这条路工程上仍需以十年计,但一旦闭环,意味着人类想要在月球建基地将不再需要工程师参与设计——AI反向推出图纸,机器人正向制造。听起来像《流浪地球》的桥段,但物理上确实成立。
决策层——从“试错”到“现场答题”
仿真层让“物理老师”把世界算清楚了,接下来要决定如何动手——这是决策层的事。决策层的演进,可以理解为从“盲试”到“有方向的优化”,再到“实时自主”的过程。
最初是现场试错,靠大量尝试,硬试出最优参数,效率极低。随后引入强化学习,给模型设定奖励函数,做对了有奖励,做错了没有,模型逐步学会该往哪走。再进一步引入梯度优化,模型不仅知道“往哪走更好”,还能直接朝最优方向快速前进,这也是当前工业界和多数具身智能公司所处的位置。而未来三年将迈向第四阶段——在线优化与后策略学习,模型既能把握方向,又能临场发挥,面对未知工况也能实时给出最优决策,真正做到“现场答题”。

图片由AI生成
自主层——从“人在回路”到“AI在回路”
最后一层涉及人机关系的根本命题:人在回路还是机器在回路。
第一次开带高阶辅助驾驶的车,多数人不会闭眼撒手,而是选择双手扶住方向盘,随时准备接管,这便是“人在回路”。以我自己的使用体验为例,自动驾驶有时会在路口犹豫不决,有时又激进闯灯,这意味着当下仍然需要人的注意力在场。
但未来必将走向“机器在回路”。偏远地区的太阳能基地、储能站、数据中心等,未来五年内大概率不再需要人值守,可以由机器自我管理。
五层架构最终汇聚的形态,是多智能体协同(Multi-Agent)。在几何层、感知层、仿真层、决策层、自主层之上,运行着热力专家、流体专家、电力专家、调度专家等一群专家智能体,它们彼此会商、彼此校验,共同输出对一个工业系统的最优决策。
这才是物理AI真正的产业愿景。
04
落地案例
接管GW级算力中心
理论之外,介绍一个我们团队当下重点推进的案例,也是当前最炙手可热的赛道——算力中心优化。

图源自英伟达官方博客
英伟达今年绘制了一张人工智能的“五层蛋糕”:最底层为能源,向上依次是芯片、AI基础设施、模型、AI应用。能源是整个蛋糕的底层基座,黄仁勋的原话是“Can you get enough power?”——电是美国人的烦恼,在中国,如何把电用好才是挑战。
一座1GW级数据中心的电力消耗往往如下:约20%被散热消耗、约10%消耗于各类能源转换损耗、约10%被重启故障消耗,真正用于算力的仅约60%。这意味着接近40%的电被管理成本浪费。这也是国家“十五五”规划中反复强调的“算电协同”——既要有足够的电,也要把电用好。
我们团队所做的,是用物理模型把算力、电力、热力三股流统一仿真起来,覆盖数据治理、设计、验证、采集、生成全流程。
以一个与英伟达联合完成的千卡集群案例为例。设计阶段,过去需要资深工程师耗时一个月,如今提出需求即可由AI自动出图;运行阶段,过去调节空调温度与风量需40分钟才能看到整个热场变化;如今参数一动,热场实时更新;复杂流场仿真过去需要6小时,如今几秒便可完成,提速5000倍以上。运维结果上,GPU热故障下降约92%,整体能耗PUE显著降低,单个数据中心年节省价值近千万。
更关键的是,这套系统把“设计工具”与“运维工具”合而为一——过去两套人马、两套软件,如今一个模型,从机房建成到关停,全程不需要人值守。
类似的实践,团队也在钢厂炼钢炉、轧钢炉热气流管理,以及橡胶厂的热仿真中落地。
05
写在最后
国产工业软件迎来窗口期
回到企业家与投资人最关心的问题——这件事与我有什么关系?三个判断。
其一,物理AI不是大语言模型的对手,而是大语言模型够不到的工业纵深。对话、写作、设计、营销等场景,大语言模型已足够好。但所有“经不起幻觉”的场景——制造、能源、化工、交通、医疗——都是物理AI的主战场。
其二,物理AI是国产工业软件难得的窗口期。过去30年,中国追美国的EDA、CAE、CAD软件,始终未能追上,因为对手已迭代数十年。但在AI时代用AI重做一遍工业软件,所有玩家重回同一起跑线。这一窗口期,对真做技术的团队是机会,对买技术的企业同样是机会。
其三,物理AI落地的基础已经齐备。算力到位、模型成熟(从Transformer到物理神经网络)、需求明确(“AI+各行各业”已成共识)、底座可用。缺的不是技术,而是真正懂行业know-how的人把它做出来。
回到开篇那个比喻:过去我们请了一位语文老师教所有学生,凡是能背、能套、能写的事,AI都能胜任。但工业世界中尚有大量经不起幻觉、需要因果、需要实时控制的事——这些事,终于到了请物理老师上场的时候。
我们期待,物理AI能够革新工业未来。
编辑 | 陶若诚
推荐阅读 | 校友故事

点击卡片,关注中欧北京校区
点赞推荐给更多朋友

夜雨聆风