中国科学院软件研究所吴恩华研究员领衔团队综述:物理人工智能的演化、进展、挑战与展望

中国科学院软件研究所吴恩华研究员领衔团队综述:物理人工智能的演化、进展、挑战与展望 | JCST

导读

JCST 近期刊载了一篇关于 Physical AI（物理人工智能）的综述论文。该文系统梳理了 Physical AI 的提出背景、发展脉络、关键研究分支、代表性基准与数据集，并进一步讨论了该领域当前面临的主要技术挑战与未来发展方向。文章提出，Physical AI 正在成为连接世界模型、生成模型与具身智能的重要桥梁，有望推动人工智能从“会感知、会生成”进一步走向“懂物理、能交互、可落地”。

长按识别二维码或拷贝下方地址，阅读全文

https://jcst.ict.ac.cn/article/doi/10.1007/s11390-026-6258-x

论文信息

Physical AI: Evolution, Progress, Challenges, and Prospects

作者：吴恩华，柳有权，徐添辰，任丽欣，秦义明，尉明钰，何小伟，苑东妍，侯文超，马智威，盛斌

单位：中国科学院软件研究所、澳门大学、长安大学、AMD公司、清华大学、上海交通大学

关键词：物理AI、物理信息AI、生成式物理AI、具身智能、物理仿真

引用信息：Wu EH, Liu YQ, Xu TC et al. Physical AI: Evolution, progress, challenges, and prospects. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2026. DOI: 10.1007/s11390-026-6258-x

点击视频两分钟快速了解论文

核心观点

Physical AI 是 AI 走向真实世界的重要阶段。它试图突破传统模型“只会表征、缺少物理约束”的局限，使AI在理解、生成和行动层面都具备物理一致性。

文章提出了 Physical AI 的“三元结构”框架，即：Physics-Informed AI，Generative Physical AI 和 Embodied AI，分别对应“理解物理规律”、“生成符合物理规律的内容”和“在真实物理环境中交互与执行”。
物理规律正在从外部约束走向模型内部能力。从物理先验嵌入网络、可微物理仿真，到语义—物理对齐与世界建模，AI 对“物理世界”的建模正在不断深入。
评测体系仍是制约本领域发展的关键短板。当前相关 benchmark 与训练数据仍较分散，统一的大规模标准化评估框架尚未形成。
未来突破有赖于统一框架、算力优化、稳健的 Sim-to-Real 迁移与标准化评测体系。这将决定 Physical AI 能否真正走向高可信、高鲁棒、可部署的现实应用。

背景意义

近年来，大语言模型、扩散模型、世界模型和具身智能快速发展，人工智能在感知、理解与生成方面取得了显著进步。然而，现有模型往往仍主要工作在数据空间或虚拟语义空间，对真实世界中的力学约束、动态变化、因果关系与交互反馈缺乏深层把握。例如，文本生成视频模型虽然能产生逼真的视觉内容，但在物体运动、碰撞、支撑、重力等基本物理规律上仍可能出现明显违背常识的现象。正是在这一背景下，Physical AI 被视为下一阶段人工智能演进的重要方向：它强调将物理规律、可微仿真、生成建模与具身交互统一起来，使 AI 不仅“看起来聪明”，更能够在物理世界中“行为合理、生成可信、交互有效”。这一方向对于机器人、自动驾驶、数字孪生、虚拟现实、智能制造以及科学计算等领域都具有重要意义。

主要内容

该文首先从 AI 与计算硬件协同演进的历史出发，回顾了从符号智能、统计智能、感知智能、生成智能、Agentic AI 逐步走向 Physical AI 的发展路径，指出 Physical AI 是 AI 从“抽象推理”迈向“物理落地”的关键一步。随后，论文提出了 Physical AI 的核心“三元结构”（如图1）：1）Physics-Informed AI，强调把偏微分方程、守恒定律、动力学约束等物理知识融入神经网络结构或损失函数中，使模型输出既符合数据也符合物理规律；2）Generative Physical AI，关注在视频、三维/四维场景、动态对象和交互过程生成中引入显式或隐式的物理一致性，减少“看起来真实、实际上不合理”的伪真实现象；3）Embodied AI，聚焦智能体如何通过传感器、执行器与真实环境形成闭环，并围绕从真实数据学习、从仿真迁移到现实、仿真与AI接口设计等问题展开讨论。论文还进一步梳理了相关 benchmark 和数据集，指出当前领域虽然发展迅速，但在统一框架、评测标准、训练资源与可复现生态方面仍存在明显不足。

图1. Physical AI 的三元结构：物理信息学习、物理一致生成与具身交互

结论与展望

论文认为，Physical AI 不是单一技术分支，而是一个面向未来智能系统的新型综合范式。它试图将世界模型、生成模型与具身智能进一步统一，通过把物理规律嵌入感知、推理、生成和行动全过程，使人工智能具备更强的真实性、可靠性与可部署性。

面向未来，文章提出了若干值得重点关注的发展方向：1）构建更具通用性的统一物理AI框架或“物理基础模型”，融合视觉、触觉、语言、符号与动力学知识；2）推进更稳健的 Sim-to-Real 迁移，缓解仿真与现实之间在噪声、动力学、环境复杂度方面的差异；3）发展更高效、更节能的计算方案，以支撑大规模、多物理场、多智能体系统的实时推理；4）建立更系统的 benchmark、数据集与评价体系，推动领域从“概念热度”走向“标准成熟”。总体来看，Physical AI 的真正价值，不仅在于让机器更会“看”和“说”，更在于让其逐步具备对真实世界的可解释理解、可信生成与稳健行动能力。这也预示着人工智能正从信息世界走向物理世界，从数字智能迈向可落地的现实智能。