JCST 近期刊载了一篇关于 Physical AI(物理人工智能)的综述论文。该文系统梳理了 Physical AI 的提出背景、发展脉络、关键研究分支、代表性基准与数据集,并进一步讨论了该领域当前面临的主要技术挑战与未来发展方向。文章提出,Physical AI 正在成为连接世界模型、生成模型与具身智能的重要桥梁,有望推动人工智能从“会感知、会生成”进一步走向“懂物理、能交互、可落地”。长按识别二维码或拷贝下方地址,阅读全文https://jcst.ict.ac.cn/article/doi/10.1007/s11390-026-6258-x
论文信息
Physical AI: Evolution, Progress, Challenges, and Prospects
作者:吴恩华,柳有权,徐添辰,任丽欣,秦义明,尉明钰,何小伟,苑东妍,侯文超,马智威,盛斌
单位:中国科学院软件研究所、澳门大学、长安大学、AMD公司、清华大学、上海交通大学
关键词:物理AI、物理信息AI、生成式物理AI、具身智能、物理仿真
引用信息:Wu EH, Liu YQ, Xu TC et al. Physical AI: Evolution, progress, challenges, and prospects. JOURNAL OF COMPUTER SCIENCE AND TECHNOLOGY, 2026. DOI: 10.1007/s11390-026-6258-x
点击视频 两分钟快速了解论文
核心观点
Physical AI 是 AI 走向真实世界的重要阶段。它试图突破传统模型“只会表征、缺少物理约束”的局限,使AI在理解、生成和行动层面都具备物理一致性。
文章提出了 Physical AI 的“三元结构”框架,即:Physics-Informed AI,Generative Physical AI 和 Embodied AI,分别对应“理解物理规律”、“生成符合物理规律的内容”和“在真实物理环境中交互与执行”。
未来突破有赖于统一框架、算力优化、稳健的 Sim-to-Real 迁移与标准化评测体系。这将决定 Physical AI 能否真正走向高可信、高鲁棒、可部署的现实应用。
背景意义
近年来,大语言模型、扩散模型、世界模型和具身智能快速发展,人工智能在感知、理解与生成方面取得了显著进步。然而,现有模型往往仍主要工作在数据空间或虚拟语义空间,对真实世界中的力学约束、动态变化、因果关系与交互反馈缺乏深层把握。例如,文本生成视频模型虽然能产生逼真的视觉内容,但在物体运动、碰撞、支撑、重力等基本物理规律上仍可能出现明显违背常识的现象。正是在这一背景下,Physical AI 被视为下一阶段人工智能演进的重要方向:它强调将物理规律、可微仿真、生成建模与具身交互统一起来,使 AI 不仅“看起来聪明”,更能够在物理世界中“行为合理、生成可信、交互有效”。这一方向对于机器人、自动驾驶、数字孪生、虚拟现实、智能制造以及科学计算等领域都具有重要意义。
主要内容
该文首先从 AI 与计算硬件协同演进的历史出发,回顾了从符号智能、统计智能、感知智能、生成智能、Agentic AI 逐步走向 Physical AI 的发展路径,指出 Physical AI 是 AI 从“抽象推理”迈向“物理落地”的关键一步。随后,论文提出了 Physical AI 的核心“三元结构”(如图1):1)Physics-Informed AI,强调把偏微分方程、守恒定律、动力学约束等物理知识融入神经网络结构或损失函数中,使模型输出既符合数据也符合物理规律;2)Generative Physical AI,关注在视频、三维/四维场景、动态对象和交互过程生成中引入显式或隐式的物理一致性,减少“看起来真实、实际上不合理”的伪真实现象;3)Embodied AI,聚焦智能体如何通过传感器、执行器与真实环境形成闭环,并围绕从真实数据学习、从仿真迁移到现实、仿真与AI接口设计等问题展开讨论。论文还进一步梳理了相关 benchmark 和数据集,指出当前领域虽然发展迅速,但在统一框架、评测标准、训练资源与可复现生态方面仍存在明显不足。
图1. Physical AI 的三元结构:物理信息学习、物理一致生成与具身交互
结论与展望
论文认为,Physical AI 不是单一技术分支,而是一个面向未来智能系统的新型综合范式。它试图将世界模型、生成模型与具身智能进一步统一,通过把物理规律嵌入感知、推理、生成和行动全过程,使人工智能具备更强的真实性、可靠性与可部署性。
面向未来,文章提出了若干值得重点关注的发展方向:1)构建更具通用性的统一物理AI框架或“物理基础模型”,融合视觉、触觉、语言、符号与动力学知识;2)推进更稳健的 Sim-to-Real 迁移,缓解仿真与现实之间在噪声、动力学、环境复杂度方面的差异;3)发展更高效、更节能的计算方案,以支撑大规模、多物理场、多智能体系统的实时推理;4)建立更系统的 benchmark、数据集与评价体系,推动领域从“概念热度”走向“标准成熟”。总体来看,Physical AI 的真正价值,不仅在于让机器更会“看”和“说”,更在于让其逐步具备对真实世界的可解释理解、可信生成与稳健行动能力。这也预示着人工智能正从信息世界走向物理世界,从数字智能迈向可落地的现实智能。