从「会说话」到「会干活」:物理 AI 这条主线,到底该怎么分清真假?

┌──────────────────────── 30 秒速读 ────────────────────────┐│                                                          ││  · 物理 AI（Physical AI）不是给机器人接个聊天模型。它是        ││    在生成式 AI 之上，叠加「理解空间、力、材质、反馈 +           ││    输出动作」的一整套系统：感知 → 推理 → 执行 闭环。            ││                                                          ││  · 今天为什么讲：海外，LG 与英伟达今日（6/8）官宣物理 AI        ││    联盟「M.A.P.」；6 月初英伟达又开放了一批物理 AI 工具和       ││    人形机器人参考设计。不是概念再炒，是工程底座在变厚。          ││                                                         ││  · 产业链是四层，不是一台机器人：算力工厂 → 数据与仿真 →         ││    世界模型/基础模型 → 传感器+边缘+执行器。                   ││                                                         ││  · 给投资人：这是真实的工程主线，但「概念泛化」严重。本文        ││    给一张「证据强度分层表」+ 四个筛子，帮你把沾边和真相关        ││    分开。同样叫物理 AI，证据强度能差出几个量级。                ││                                                           │└──────────────────────────────────────────────────────── ──┘

引子：今天，这个词又被资本同时按了两次

过去两年，我们理解的 AI 大多在屏幕里——写文章、画图、生成代码，像一个越来越聪明的云端大脑。

最近市场反复在讲一个更硬的词：Physical AI，物理 AI。它不是凭空热起来的。

就在今天（2026 年 6 月 8 日），LG 与英伟达在首尔官宣了一项叫「M.A.P.」的战略联盟——三个字母分别指向 Mobility、AI Infra、Physical AI，黄仁勋和 LG 会长一起站台，把物理 AI 明确列为韩国制造业的下一个增长极。

这不是孤立动作。6 月初，英伟达刚一次性开放了一批物理 AI 的开发工具和技能，还发布了一套人形机器人参考设计；几个月前，它和现代汽车敲定了约 30 亿美元的 AI 工厂。一条线在快速变粗。

而在国内盘面，这个词同样在发酵：资金开始把「物理 AI」映射到制造、端侧载体、机器人零部件这些环节。

一边是海外巨头的战略卡位，一边是国内资金的题材映射——这正是今天值得把这条主线讲清楚的原因：它既有真东西，也有大量包装，投资人最需要的，是一把能分真假的尺子。

一、先把概念说准：物理 AI 到底是什么

很多人一听物理 AI，脑子里就是「人形机器人里塞个大模型」。这个理解最直观，也最容易错。

让机器人听懂一句话，只是第一步。真正难的是后面这一串：

看见环境  └─ 理解空间关系（哪近哪远、什么材质、会不会滑）       └─ 判断下一步动作            └─ 控制身体执行（关节、力矩、轨迹）                 └─ 根据失败反馈实时调整                      └─ 全程保持安全和稳定

在屏幕里，AI 答错一句，最多是答案不好。在物理世界里，机器人抓错东西、车判错距离、机械臂撞到人，代价完全不同。

所以用英伟达官方术语表的定义：物理 AI 是在生成式 AI 的基础上，叠加对空间关系和物理规律的理解，能把文本、图像、声音、3D 数据转成机器可执行的动作，形成「感知—推理—执行」的闭环。

这里有几个常被混用的词，投资人有必要分清——因为它们对应产业链的不同环节：

┌─ 具身智能（Embodied AI）── 强调「有身体 + 传感器 + 认知执行」的│                            智能体，是物理 AI 的底层范式│├─ 世界模型（World Model）── AI 的「物理想象力」：根据当前画面预测│                            「如果这样动，下一刻世界会变成什么样」，│                            不是静态地图（代表：英伟达 Cosmos 系列）│├─ 机器人基础模型 ────────── 跨不同机器人通用的大模型，降低迁移成本│   (Robot Foundation Model) （代表：英伟达 GR00T 系列）│└─ VLA 模型 ──────────────── 视觉-语言-动作，比普通多模态模型多了   (Vision-Language-Action)  「动作」这个输出维度，把「看/听/说」接到「动」                             （代表：Gemini Robotics、GR00T、OpenVLA）

一句话锚点：Agent 是软件里的机器人，机器人是硬件里的 Agent。物理 AI，就是让这两者合体。

顺手澄清三个最常见的误区，投资人尤其要记住：

「物理 AI = 机器人硬件」——错。硬件只是载体，核心是世界模型 + 基础模型这套「大脑」。
「ChatGPT 直接就能控制机器人」——不行。语言模型擅长文本推理，缺乏对物理规律的建模，不经专门训练和仿真直接上机，是安全风险。
「物理 AI 万事俱备、马上普及」——远没到。第五节专门讲它的「现实重力」。

二、为什么是「现在」：三个条件同时成熟 + 一次范式催化

机器人、自动驾驶、工业自动化都发展很多年了。物理 AI 这个词，2025 年初由黄仁勋在 CES 系统性提出。它在 2026 年突然变重，不是因为某一场发布会，而是三个底层变量同时到位。

① 模型能力到了新阶段。 多模态模型能处理图像、视频、声音；世界模型开始预测物理场景；VLA 模型把视觉、语言直接转成动作。「理解现实世界」从口号变成了工程问题。

② 数据和仿真成了胜负手。 机器人最难的不是 Demo，是长尾——工厂里一个异常动作、仓库里一次遮挡、路上一个罕见路况，都可能让系统失效。而真实物理动作数据极其稀缺、极其贵（有创投机构估算，全网高质量机器人操纵数据可能只有几十万小时量级，离通用化所需的门槛差几个数量级）。于是行业的解法变成：用仿真和世界模型批量生成「物理上可信」的合成数据，再用领域随机化、Real2Sim 等手段做到「真人示教一次、虚拟世界进化上万次」。这就是「数据/仿真比硬件更值钱」的逻辑起点。

③ 边缘算力跟上了。 机器进入现实，不能每一步都等云端返回，很多动作必须本地实时判断。这就是 Jetson Thor 这类机器人边缘算力平台的意义——让机器人「身体里」也跑得动较强的模型。

而真正的范式催化点，发生在 6 月初。 英伟达一次性开源了一大批物理 AI 的 agent 工具和技能，把 Omniverse、Cosmos、Isaac、Metropolis、Jetson 这套全栈，变成 agent 可以直接调用的「技能」；同一时间还发布了 Isaac GR00T 人形机器人参考设计，把 Unitree H2 Plus 本体、Sharpa 触觉手、Jetson Thor 算力和 GR00T 软件栈打包成一个开放平台。

这件事的意义，不在于「某台机器人马上量产」，而在于：研发路径开始标准化。当一个行业从「每家自己摸索」走向「有参考平台、有开发工具、有评估体系」，扩散速度会变快——这往往是产业从主题走向业绩的前置信号。

三、海内外信息梳理：这一年到底发生了什么

把噪音过滤掉，2025—2026 这条主线已核实的关键节点，是这样的：

2025-01  CES  ──  黄仁勋系统性提出 Physical AI，定为长期主线2025-03  ──────  Google DeepMind 发布 Gemini Robotics / Robotics-ER（VLA）2025-12  ──────  英伟达 GR00T N1.6（更大世界模型 + 更大动作生成网络）2026-01  CES  ──  波士顿动力 × DeepMind：Gemini 具身模型进电动 Atlas，主攻汽车装配2026-01  ──────  特斯拉 Q4 股东材料：从「硬件公司」转向「物理 AI 公司」2026-初  ──────  小鹏二代 VLA（号称首个 L4 级「物理世界大模型」），大众列为中国市场首个客户，Robotaxi 开放道路测试2026-02  ──────  Waymo World Model 发布，基于 DeepMind 的 Genie 3，联合生成相机 + 激光雷达长尾场景2026-02  ──────  ADI 提出「2026：物理智能元年」，主打感知 / 混合信号 / 边缘2026-03  GTC  ──  英伟达 Physical AI Data Factory 蓝图（数据采集-合成-评估）2026-06-01 ────  英伟达开源物理 AI agent 工具栈 + Isaac GR00T 人形参考设计2026-06-08 ────  今天：LG × 英伟达官宣物理 AI 联盟「M.A.P.」

读这条线，有三个产业含义，投资人值得记住。

海外：两条腿在跑。 一条是英伟达的「全栈卖铲子」——算力 + 仿真 + 世界模型 + 数据工厂 + 开发工具 + 边缘芯片，再用现代（约 30 亿美元 AI 工厂）、LG（今天的 M.A.P.）这样的国家级制造伙伴把生态铺开。另一条是模型大厂的「具身大脑」——Google DeepMind 用 Gemini Robotics 进波士顿动力的电动 Atlas，特斯拉把自动驾驶能力迁移到 Optimus。人形机器人的竞争，正在从「机械本体」变成「硬件身体 + 模型大脑 + 仿真训练」的组合。

自动驾驶，是物理 AI 落地最快、数据最密的赛道。 特斯拉、小鹏、Waymo 不约而同从「感知—决策—控制」分层架构，转向「世界模型 + 端到端 VLA」。值得注意的是两件事：Waymo 用 DeepMind 的 Genie 3 来造长尾场景，小鹏二代 VLA 把大众列为中国市场首个客户——这说明「世界模型 + VLA」不只是 PPT，已经在产生真实的技术采购和跨厂合作。

但这里要钉一道边界：小鹏官方同时说明，二代 VLA 仍是「有监督的智能驾驶系统」，更高级别自动驾驶的商业化，取决于监管演进。重要技术路线，不等于已经完全无人驾驶商用。 特斯拉那句「我们是物理 AI 公司」，也该当成公司定位和叙事来看，而不是已兑现的财报。

国内：从「量产」叠加「AI」的二次升级。 国内机器人产业过去几年解决的是「量产 + 降本」，现在叠加的是「理解物理世界 + 自主决策」这层 AI 升级。资金正沿着这个逻辑，把题材映射到机器人零部件、端侧载体、精密制造等环节。这里划重点：这些属于「市场映射」，不是已兑现的订单或业绩。 怎么分，下一节那张表会讲。

四、产业链不是一台机器人，而是四层系统 + 一群「隐形配角」

把物理 AI 拆开看，它至少是四层。投资人最容易犯的错，是只盯「机器人整机」，而真正的价值往往沉在上下游。

┌─────────────────────────────────────────────────────────────┐│  第①层  云端 AI 工厂                                          ││         算力 / 网络互联 / 数据中心 / 电力 / 冷却               ││         —— 训练世界模型和仿真的地基，仍然吃算力               │├─────────────────────────────────────────────────────────────┤│  第②层  数据工厂 + 仿真                                       ││         合成数据 / 数字孪生 / Sim2Real / 领域随机化           ││         —— 物理数据太贵，这一层是「软实力护城河」             │├─────────────────────────────────────────────────────────────┤│  第③层  世界模型 + 机器人基础模型                             ││         Cosmos / GR00T / Gemini Robotics / VLA               ││         —— 「大脑」：理解空间、预测后果、规划动作             │├─────────────────────────────────────────────────────────────┤│  第④层  现实世界的「身体」                                    ││         传感器 / 触觉 / 激光雷达 / 力控 / 电机减速器          ││         / 边缘计算芯片 / 电池 / 整机                          ││         —— 没有可靠的身体，模型再聪明也干不稳活               │└─────────────────────────────────────────────────────────────┘        ↓ 真实场景部署：工厂 → 仓储 → 自动驾驶 → 医疗 → 家庭

第④层往下，还藏着一批容易被忽略的半导体「隐形配角」——它们才是「机器进入现实」时真正放量的环节：

感知端  ──  模拟/混合信号芯片、高精度 ADC、各类传感器前端执行端  ──  BCD 工艺（逻辑+高压驱动+模拟反馈三合一）、GaN 功率器件            （让机器人关节在不增重的前提下提升力矩、控制发热）连接端  ──  时间敏感网络（TSN）、精密时钟/振荡器（保证全身微秒级同步）边缘端  ──  「实时核 + GPU」异构计算（硬实时安全刹车 + 高级认知分工）

这也是为什么 ADI 这类模拟芯片厂商要喊「2026 是物理智能元年」——机器要进入现实，第一步就是可靠地感知和驱动现实，而这恰好是它们的主场。

落地节奏上，可控程度决定先后：工厂 / 仓储（环境最可控、ROI 最好算）→ 自动驾驶（数据最密）→ 医疗手术（安全冗余要求最高）→ 家庭服务（场景最非结构化，最慢）。越靠前的场景，确定性越高。

五、一个判断框架：先分层，再筛选，最后看反面

物理 AI 是真实的工程主线，但今天市场最大的问题是概念泛化——任何机器人、传感器、制造、端侧 AI 公司都能贴上这个标签，真变化和包装混在一起。

第一步，别急着选公司，先按证据强度，把「沾边」和「真相关」分开。这张表不排收益，只排证据：

阶	环节	证据强度	公开锚点（不列代码）
一阶 · 强相关	全栈算力与工具、世界模型/VLA、端到端智驾	有官方合作或采购	英伟达开放工具栈 + LG/现代合作；DeepMind × 波士顿动力；小鹏 VLA 2.0—大众首个客户；Waymo × Genie 3
二阶 · 参考设计/数据相关	人形本体、触觉手、边缘算力	进了官方参考设计或训练数据	进 GR00T 参考设计的本体（Unitree H2 Plus）、触觉手（Sharpa）、Jetson Thor
三阶 · 题材映射	国内机器人零部件 / 端侧 / 精密制造 / 传感器 / 执行器	资金叙事，暂无官方证据	随物理 AI 叙事被映射的国内制造与零部件
四阶 · 纯概念	沾边贴标签	无	——

同样叫物理 AI，从一阶强相关到四阶纯概念，证据强度差出几个量级。

三点边界说在前面：这张表按证据强度排序，不是收益排序，更不是推荐排序；一阶里很多主体是海外或港美股，A 股的直接对应反而少；「进了参考设计」不等于「拿到量产订单」。分层是用来防止把四阶当一阶买，不是用来排谁会涨。

第二步，对单个标的，过四个筛子：

筛子 1  有没有真实场景？        工厂/仓储/自动驾驶/医疗/巡检 比「家庭万能机器人」现实，        因为环境可控、ROI 算得清。筛子 2  有没有数据闭环？        能「采真实数据 → 仿真扩增 → 训模型 → 回真实场景验证」        形成飞轮的，才有长期壁垒。这一层是软实力护城河。筛子 3  有没有边缘 + 感知能力？        物理世界不是纯软件。传感器、力控、边缘芯片、低功耗推理，        是「机器进入现实」时真正放量、真正吃订单的环节。筛子 4  有没有订单和利润？        概念可以先涨，但最终要回到商业兑现。尤其中报预告期临近，        只有叙事、没有订单的公司会越来越难讲。

第三步，也是最容易被忽略的一步——把反面看一遍。这决定了为什么不能把所有机器人概念当成一起飞的理由：

┌─ 风险 1 · 「80% → 99.9% 死亡之渊」│   实验室拍个成功率 80% 的 Demo 不难，工业级要 99.9%，│   背后所需的数据覆盖、容错冗余呈非线性激增。│   多数初创，就死在最后这 19.9%。│├─ 风险 2 · ROI 倒挂│   地坪平整、网络升级、安全围栏、边缘 GPU 电费、软件年费……│   隐性成本叠加后，回本期常达三四年，未必比雇人划算。│├─ 风险 3 · 数据碎片化│   单臂/双臂/四足/人形 的关节映射、采样率都不通，│   难合成统一语料，动作级的「ChatGPT 时刻」还没到来。│├─ 风险 4 · 安全与责任真空│   ISO 10218 / ANSI-RIA R15 是硬门槛；一旦出事（手术失误、│   无人车事故、机器人伤人），责任归模型方、集成商还是运营方？│   法律仍是灰区，这会拖慢大企业规模化的决心。│└─ 风险 5 · 概念泛化    贴标签的多，有真实能力的少。市场最终会做筛选。

所以更准确的说法是：物理 AI 给机器人和端侧智能提供了一个新的上层逻辑，但它不会一夜兑现，方向不能被当作明天的订单。 这条主线值得长期跟踪，但跟踪不等于追高。

结尾：下一场竞争，是谁能让模型「稳定做事」

过去，AI 公司比的是模型会不会答题。

接下来，物理 AI 比的是：模型能不能在现实世界里，安全、可靠、低成本地把一件事做完。

这会把竞争从屏幕带到工厂、仓库、道路、医院；也会把产业链从 GPU 和云端，继续拉向数据工厂、仿真、世界模型、机器人基础模型、传感器、边缘计算和执行器。

云端不会消失，而是变成物理世界的训练场。

让 AI 生成一段话很难，但让 AI 在现实里稳稳干完一件活，难一个量级。这恰恰是这条主线值得跟踪的原因——它指向的是 AI 未来几年最真实的工程战场，而不是又一个一周就凉的概念。

免责声明：本文仅为个人科技与市场观察记录，所涉公司、产品、事件均来自公开信息整理，不构成任何投资建议，也不构成对任何证券的买卖推荐。文中公司均为产业链结构分析所需的代表样本，不代表任何买入、卖出或持有建议。市场有风险，决策需独立判断。

主要资料来源（公开信息）

官方术语表 · NVIDIA Glossary — What is Physical AI / What is a World Model
官方公告 · NVIDIA：开源物理 AI agent 工具与技能（2026-06-01）；Isaac GR00T 人形参考设计（2026-06-01）；Physical AI Data Factory 蓝图（2026-03）；Cosmos 世界模型平台（2025-01）
官方公告 · NVIDIA × 现代 AI 工厂（约 30 亿美元，2025-10）；LG × NVIDIA「M.A.P.」联盟（2026-06-08）
官方博客 · Google DeepMind — Gemini Robotics / Gemini Robotics-ER
媒体报道 · 波士顿动力 × Google DeepMind，电动 Atlas（CES 2026，2026-01-05）
官方博客 · Waymo — The Waymo World Model（2026-02，基于 DeepMind Genie 3）
股东材料 · Tesla Q4 2025（从硬件公司向物理 AI 公司过渡）
官方公告 · 小鹏 VLA 2.0 全球部署与公开道路测试（含「有监督智能驾驶」边界说明）
官方公告 · Analog Devices — 2026：物理智能元年（2026-02-09）
行业研究 · IEEE/清华综述《Embodied AI: From LLMs to World Models》；Physical Intelligence π0.7 技术博客