最近半年,物理 AI 这个词在行业里出现的频率越来越高。英伟达、谷歌这些科技巨头都在加速布局,推的是一件事:让 AI 从虚拟世界走进现实世界,让机器人不只是能"看"能"听",还能真正理解物理规律,知道怎么抓东西、怎么走路、怎么在复杂环境里完成任务。这件事听起来有点科幻,但它正在发生。
物理 AI 跟我们过去几年熟悉的那种 AI 不太一样。ChatGPT、Midjourney 这些工具很强,但它们的强项是处理语言、图像、文本这些虚拟信息。你问它"怎么煮一碗面",它能给你写出详细步骤,但你让它真去厨房煮,它就傻眼了。因为它不理解"水烧开"是什么状态,不知道"面条软了"该用多大力气捞起来,也不懂"锅烫"意味着不能直接用手碰。这些在物理世界里理所当然的常识,对传统 AI 来说都是盲区。
物理 AI 要解决的,就是这个盲区。它需要让机器人具备三种能力:感知、认知、行动。感知是"看见"物理世界,认知是"理解"物理规律,行动是"执行"任务。三件事缺一不可,而且必须实时协同。这比单纯训练一个语言模型或图像识别模型,难度要高出好几个数量级。
国内外都有玩家在往这个方向冲。肇观电子推出了 VPU 芯片,专门用来处理视觉和物理信息的融合计算。西工大研发了一套类脑认知导航框架,让机器人能像人一样在陌生环境里找路。天娱数科在构建空间智能平台,把物理空间的信息数字化,给 AI 提供更精准的环境理解能力。这些动作单独看都是技术突破,合起来看就是在为物理 AI 补齐拼图。
业内对这件事的预测挺一致。2026 到 2030 年,物理 AI 会从"专用"走向"通用"。现在的物理 AI 大多还是针对特定场景,比如工厂里的分拣机器人、仓库里的搬运机器人、矿区里的无人驾驶车。每个场景都要单独训练,换个环境就不灵了。但接下来几年,行业要做的事,是让物理 AI 具备更强的泛化能力,能在不同场景之间迁移,甚至能处理从来没见过的任务。这才是真正的"通用"。
物理 AI 的兴起,其实也暴露了传统 AI 的一个短板:它不理解物理因果。你给 GPT 看一段视频,它能告诉你"一个人把杯子推下桌子,杯子掉到地上碎了",但它不理解"为什么杯子会掉""为什么会碎""如果杯子是塑料的会不会碎"。这些因果关系,对人来说是常识,对 AI 来说是黑箱。物理 AI 要做的,就是把这个黑箱打开。
技术路线上,现在有两个方向在融合。一个是 VLA,也就是视觉-语言-动作模型,另一个是世界模型。VLA 的强项是把视觉、语言、动作三种信息打通,让机器人能"看懂指令、理解场景、执行动作"。世界模型的强项是预测物理世界的变化,比如"我推这个杯子,它会往哪个方向倒"。两者单独都有局限,但如果能融合成一个"物理世界专属模型",那机器人的能力会有质的飞跃。
网上有人调侃"AI 终于要从键盘侠进化成实干家了",这话虽然是玩笑,但也说到点子上了。过去几年 AI 的进步,主要集中在"动嘴"这件事上——写文章、画图、聊天、写代码,都是在虚拟世界里完成的任务。但真正改变生活的 AI,一定是能"动手"的 AI。能做饭、能搬东西、能修东西、能照顾老人小孩,这才是 AI 走进千家万户的前提。
专家们的看法更务实一些。他们强调,物理 AI 不是单纯堆算力或者堆数据就能解决的,需要构建"脑眼行动"一体化系统。"脑"是决策和推理,"眼"是感知和理解,"行动"是执行和反馈,三者必须实时协同,形成闭环。这套系统的难点不在于单点技术,而在于系统集成和实时性。
一个机器人在抓杯子的时候,视觉系统要实时判断杯子的位置和姿态,决策系统要计算抓取的角度和力度,执行系统要控制机械臂的每个关节,整个过程可能只有零点几秒,任何一个环节卡壳都会失败。这种实时性要求,跟训练一个语言模型完全不是一回事。
具身智能这个词,最近也被提得越来越多。它指的就是这种"有身体"的 AI,不再是飘在云端的算法,而是真正能在物理世界里行动的智能体。具身智能的终极目标,是让机器人能像人一样,在复杂、动态、不确定的环境里完成任务。这件事的难度,远远超过让 AI 下围棋或者写诗。
从产业角度看,物理 AI 的爆发,会带动一整条产业链的升级。芯片、传感器、机械结构、控制算法、仿真平台,每个环节都需要重新设计。过去做语言模型,主要拼的是算力和数据,做物理 AI,还得拼硬件集成能力和工程化能力。这对国内供应链来说,既是挑战也是机会。
当然,物理 AI 现在还处于早期阶段。实验室里的 demo 跟真正能商用的产品,中间还有很长的路要走。成本、可靠性、安全性,都是绕不开的问题。一个能在实验室里稳定抓杯子的机器人,放到真实家庭环境里,可能会因为光线变化、桌面材质不同、杯子形状不规则而失败。这些"长尾问题",才是物理 AI 真正要啃的硬骨头。
但方向已经很清楚了。AI 的下一站,不在云端,在现实世界。从键盘侠到实干家,这一步迈出去,AI 才算真正走进了生活。

夜雨聆风