┌──────────────────────── 30 秒速读 ────────────────────────┐│ ││ · 物理 AI(Physical AI)不是给机器人接个聊天模型。它是 ││ 在生成式 AI 之上,叠加「理解空间、力、材质、反馈 + ││ 输出动作」的一整套系统:感知 → 推理 → 执行 闭环。 ││ ││ · 今天为什么讲:海外,LG 与英伟达今日(6/8)官宣物理 AI ││ 联盟「M.A.P.」;6 月初英伟达又开放了一批物理 AI 工具和 ││ 人形机器人参考设计。不是概念再炒,是工程底座在变厚。 ││ ││ · 产业链是四层,不是一台机器人:算力工厂 → 数据与仿真 → ││ 世界模型/基础模型 → 传感器+边缘+执行器。 ││ ││ · 给投资人:这是真实的工程主线,但「概念泛化」严重。本文 ││ 给一张「证据强度分层表」+ 四个筛子,帮你把沾边和真相关 ││ 分开。同样叫物理 AI,证据强度能差出几个量级。 ││ │└──────────────────────────────────────────────────────── ──┘引子:今天,这个词又被资本同时按了两次
过去两年,我们理解的 AI 大多在屏幕里——写文章、画图、生成代码,像一个越来越聪明的云端大脑。
最近市场反复在讲一个更硬的词:Physical AI,物理 AI。它不是凭空热起来的。
就在今天(2026 年 6 月 8 日),LG 与英伟达在首尔官宣了一项叫「M.A.P.」的战略联盟——三个字母分别指向 Mobility、AI Infra、Physical AI,黄仁勋和 LG 会长一起站台,把物理 AI 明确列为韩国制造业的下一个增长极。
这不是孤立动作。6 月初,英伟达刚一次性开放了一批物理 AI 的开发工具和技能,还发布了一套人形机器人参考设计;几个月前,它和现代汽车敲定了约 30 亿美元的 AI 工厂。一条线在快速变粗。
而在国内盘面,这个词同样在发酵:资金开始把「物理 AI」映射到制造、端侧载体、机器人零部件这些环节。
一边是海外巨头的战略卡位,一边是国内资金的题材映射——这正是今天值得把这条主线讲清楚的原因:它既有真东西,也有大量包装,投资人最需要的,是一把能分真假的尺子。
一、先把概念说准:物理 AI 到底是什么
很多人一听物理 AI,脑子里就是「人形机器人里塞个大模型」。这个理解最直观,也最容易错。
让机器人听懂一句话,只是第一步。真正难的是后面这一串:
看见环境 └─ 理解空间关系(哪近哪远、什么材质、会不会滑) └─ 判断下一步动作 └─ 控制身体执行(关节、力矩、轨迹) └─ 根据失败反馈实时调整 └─ 全程保持安全和稳定在屏幕里,AI 答错一句,最多是答案不好。在物理世界里,机器人抓错东西、车判错距离、机械臂撞到人,代价完全不同。
所以用英伟达官方术语表的定义:物理 AI 是在生成式 AI 的基础上,叠加对空间关系和物理规律的理解,能把文本、图像、声音、3D 数据转成机器可执行的动作,形成「感知—推理—执行」的闭环。
这里有几个常被混用的词,投资人有必要分清——因为它们对应产业链的不同环节:
┌─ 具身智能(Embodied AI)── 强调「有身体 + 传感器 + 认知执行」的│ 智能体,是物理 AI 的底层范式│├─ 世界模型(World Model)── AI 的「物理想象力」:根据当前画面预测│ 「如果这样动,下一刻世界会变成什么样」,│ 不是静态地图(代表:英伟达 Cosmos 系列)│├─ 机器人基础模型 ────────── 跨不同机器人通用的大模型,降低迁移成本│ (Robot Foundation Model) (代表:英伟达 GR00T 系列)│└─ VLA 模型 ──────────────── 视觉-语言-动作,比普通多模态模型多了 (Vision-Language-Action) 「动作」这个输出维度,把「看/听/说」接到「动」 (代表:Gemini Robotics、GR00T、OpenVLA)一句话锚点:Agent 是软件里的机器人,机器人是硬件里的 Agent。物理 AI,就是让这两者合体。
顺手澄清三个最常见的误区,投资人尤其要记住:
「物理 AI = 机器人硬件」——错。硬件只是载体,核心是世界模型 + 基础模型这套「大脑」。 「ChatGPT 直接就能控制机器人」——不行。语言模型擅长文本推理,缺乏对物理规律的建模,不经专门训练和仿真直接上机,是安全风险。 「物理 AI 万事俱备、马上普及」——远没到。第五节专门讲它的「现实重力」。
二、为什么是「现在」:三个条件同时成熟 + 一次范式催化
机器人、自动驾驶、工业自动化都发展很多年了。物理 AI 这个词,2025 年初由黄仁勋在 CES 系统性提出。它在 2026 年突然变重,不是因为某一场发布会,而是三个底层变量同时到位。
① 模型能力到了新阶段。 多模态模型能处理图像、视频、声音;世界模型开始预测物理场景;VLA 模型把视觉、语言直接转成动作。「理解现实世界」从口号变成了工程问题。
② 数据和仿真成了胜负手。 机器人最难的不是 Demo,是长尾——工厂里一个异常动作、仓库里一次遮挡、路上一个罕见路况,都可能让系统失效。而真实物理动作数据极其稀缺、极其贵(有创投机构估算,全网高质量机器人操纵数据可能只有几十万小时量级,离通用化所需的门槛差几个数量级)。于是行业的解法变成:用仿真和世界模型批量生成「物理上可信」的合成数据,再用领域随机化、Real2Sim 等手段做到「真人示教一次、虚拟世界进化上万次」。这就是「数据/仿真比硬件更值钱」的逻辑起点。
③ 边缘算力跟上了。 机器进入现实,不能每一步都等云端返回,很多动作必须本地实时判断。这就是 Jetson Thor 这类机器人边缘算力平台的意义——让机器人「身体里」也跑得动较强的模型。
而真正的范式催化点,发生在 6 月初。 英伟达一次性开源了一大批物理 AI 的 agent 工具和技能,把 Omniverse、Cosmos、Isaac、Metropolis、Jetson 这套全栈,变成 agent 可以直接调用的「技能」;同一时间还发布了 Isaac GR00T 人形机器人参考设计,把 Unitree H2 Plus 本体、Sharpa 触觉手、Jetson Thor 算力和 GR00T 软件栈打包成一个开放平台。
这件事的意义,不在于「某台机器人马上量产」,而在于:研发路径开始标准化。当一个行业从「每家自己摸索」走向「有参考平台、有开发工具、有评估体系」,扩散速度会变快——这往往是产业从主题走向业绩的前置信号。
三、海内外信息梳理:这一年到底发生了什么
把噪音过滤掉,2025—2026 这条主线已核实的关键节点,是这样的:
2025-01 CES ── 黄仁勋系统性提出 Physical AI,定为长期主线2025-03 ────── Google DeepMind 发布 Gemini Robotics / Robotics-ER(VLA)2025-12 ────── 英伟达 GR00T N1.6(更大世界模型 + 更大动作生成网络)2026-01 CES ── 波士顿动力 × DeepMind:Gemini 具身模型进电动 Atlas,主攻汽车装配2026-01 ────── 特斯拉 Q4 股东材料:从「硬件公司」转向「物理 AI 公司」2026-初 ────── 小鹏二代 VLA(号称首个 L4 级「物理世界大模型」),大众列为中国市场首个客户,Robotaxi 开放道路测试2026-02 ────── Waymo World Model 发布,基于 DeepMind 的 Genie 3,联合生成相机 + 激光雷达长尾场景2026-02 ────── ADI 提出「2026:物理智能元年」,主打感知 / 混合信号 / 边缘2026-03 GTC ── 英伟达 Physical AI Data Factory 蓝图(数据采集-合成-评估)2026-06-01 ──── 英伟达开源物理 AI agent 工具栈 + Isaac GR00T 人形参考设计2026-06-08 ──── 今天:LG × 英伟达官宣物理 AI 联盟「M.A.P.」读这条线,有三个产业含义,投资人值得记住。
海外:两条腿在跑。 一条是英伟达的「全栈卖铲子」——算力 + 仿真 + 世界模型 + 数据工厂 + 开发工具 + 边缘芯片,再用现代(约 30 亿美元 AI 工厂)、LG(今天的 M.A.P.)这样的国家级制造伙伴把生态铺开。另一条是模型大厂的「具身大脑」——Google DeepMind 用 Gemini Robotics 进波士顿动力的电动 Atlas,特斯拉把自动驾驶能力迁移到 Optimus。人形机器人的竞争,正在从「机械本体」变成「硬件身体 + 模型大脑 + 仿真训练」的组合。
自动驾驶,是物理 AI 落地最快、数据最密的赛道。 特斯拉、小鹏、Waymo 不约而同从「感知—决策—控制」分层架构,转向「世界模型 + 端到端 VLA」。值得注意的是两件事:Waymo 用 DeepMind 的 Genie 3 来造长尾场景,小鹏二代 VLA 把大众列为中国市场首个客户——这说明「世界模型 + VLA」不只是 PPT,已经在产生真实的技术采购和跨厂合作。
但这里要钉一道边界:小鹏官方同时说明,二代 VLA 仍是「有监督的智能驾驶系统」,更高级别自动驾驶的商业化,取决于监管演进。重要技术路线,不等于已经完全无人驾驶商用。 特斯拉那句「我们是物理 AI 公司」,也该当成公司定位和叙事来看,而不是已兑现的财报。
国内:从「量产」叠加「AI」的二次升级。 国内机器人产业过去几年解决的是「量产 + 降本」,现在叠加的是「理解物理世界 + 自主决策」这层 AI 升级。资金正沿着这个逻辑,把题材映射到机器人零部件、端侧载体、精密制造等环节。这里划重点:这些属于「市场映射」,不是已兑现的订单或业绩。 怎么分,下一节那张表会讲。
四、产业链不是一台机器人,而是四层系统 + 一群「隐形配角」
把物理 AI 拆开看,它至少是四层。投资人最容易犯的错,是只盯「机器人整机」,而真正的价值往往沉在上下游。
┌─────────────────────────────────────────────────────────────┐│ 第①层 云端 AI 工厂 ││ 算力 / 网络互联 / 数据中心 / 电力 / 冷却 ││ —— 训练世界模型和仿真的地基,仍然吃算力 │├─────────────────────────────────────────────────────────────┤│ 第②层 数据工厂 + 仿真 ││ 合成数据 / 数字孪生 / Sim2Real / 领域随机化 ││ —— 物理数据太贵,这一层是「软实力护城河」 │├─────────────────────────────────────────────────────────────┤│ 第③层 世界模型 + 机器人基础模型 ││ Cosmos / GR00T / Gemini Robotics / VLA ││ —— 「大脑」:理解空间、预测后果、规划动作 │├─────────────────────────────────────────────────────────────┤│ 第④层 现实世界的「身体」 ││ 传感器 / 触觉 / 激光雷达 / 力控 / 电机减速器 ││ / 边缘计算芯片 / 电池 / 整机 ││ —— 没有可靠的身体,模型再聪明也干不稳活 │└─────────────────────────────────────────────────────────────┘ ↓ 真实场景部署:工厂 → 仓储 → 自动驾驶 → 医疗 → 家庭第④层往下,还藏着一批容易被忽略的半导体「隐形配角」——它们才是「机器进入现实」时真正放量的环节:
感知端 ── 模拟/混合信号芯片、高精度 ADC、各类传感器前端执行端 ── BCD 工艺(逻辑+高压驱动+模拟反馈三合一)、GaN 功率器件 (让机器人关节在不增重的前提下提升力矩、控制发热)连接端 ── 时间敏感网络(TSN)、精密时钟/振荡器(保证全身微秒级同步)边缘端 ── 「实时核 + GPU」异构计算(硬实时安全刹车 + 高级认知分工)这也是为什么 ADI 这类模拟芯片厂商要喊「2026 是物理智能元年」——机器要进入现实,第一步就是可靠地感知和驱动现实,而这恰好是它们的主场。
落地节奏上,可控程度决定先后:工厂 / 仓储(环境最可控、ROI 最好算)→ 自动驾驶(数据最密)→ 医疗手术(安全冗余要求最高)→ 家庭服务(场景最非结构化,最慢)。越靠前的场景,确定性越高。
五、一个判断框架:先分层,再筛选,最后看反面
物理 AI 是真实的工程主线,但今天市场最大的问题是概念泛化——任何机器人、传感器、制造、端侧 AI 公司都能贴上这个标签,真变化和包装混在一起。
第一步,别急着选公司,先按证据强度,把「沾边」和「真相关」分开。这张表不排收益,只排证据:
| 一阶 · 强相关 | |||
| 二阶 · 参考设计/数据相关 | |||
| 三阶 · 题材映射 | |||
| 四阶 · 纯概念 |
同样叫物理 AI,从一阶强相关到四阶纯概念,证据强度差出几个量级。
三点边界说在前面:这张表按证据强度排序,不是收益排序,更不是推荐排序;一阶里很多主体是海外或港美股,A 股的直接对应反而少;「进了参考设计」不等于「拿到量产订单」。分层是用来防止把四阶当一阶买,不是用来排谁会涨。
第二步,对单个标的,过四个筛子:
筛子 1 有没有真实场景? 工厂/仓储/自动驾驶/医疗/巡检 比「家庭万能机器人」现实, 因为环境可控、ROI 算得清。筛子 2 有没有数据闭环? 能「采真实数据 → 仿真扩增 → 训模型 → 回真实场景验证」 形成飞轮的,才有长期壁垒。这一层是软实力护城河。筛子 3 有没有边缘 + 感知能力? 物理世界不是纯软件。传感器、力控、边缘芯片、低功耗推理, 是「机器进入现实」时真正放量、真正吃订单的环节。筛子 4 有没有订单和利润? 概念可以先涨,但最终要回到商业兑现。尤其中报预告期临近, 只有叙事、没有订单的公司会越来越难讲。第三步,也是最容易被忽略的一步——把反面看一遍。这决定了为什么不能把所有机器人概念当成一起飞的理由:
┌─ 风险 1 · 「80% → 99.9% 死亡之渊」│ 实验室拍个成功率 80% 的 Demo 不难,工业级要 99.9%,│ 背后所需的数据覆盖、容错冗余呈非线性激增。│ 多数初创,就死在最后这 19.9%。│├─ 风险 2 · ROI 倒挂│ 地坪平整、网络升级、安全围栏、边缘 GPU 电费、软件年费……│ 隐性成本叠加后,回本期常达三四年,未必比雇人划算。│├─ 风险 3 · 数据碎片化│ 单臂/双臂/四足/人形 的关节映射、采样率都不通,│ 难合成统一语料,动作级的「ChatGPT 时刻」还没到来。│├─ 风险 4 · 安全与责任真空│ ISO 10218 / ANSI-RIA R15 是硬门槛;一旦出事(手术失误、│ 无人车事故、机器人伤人),责任归模型方、集成商还是运营方?│ 法律仍是灰区,这会拖慢大企业规模化的决心。│└─ 风险 5 · 概念泛化 贴标签的多,有真实能力的少。市场最终会做筛选。所以更准确的说法是:物理 AI 给机器人和端侧智能提供了一个新的上层逻辑,但它不会一夜兑现,方向不能被当作明天的订单。 这条主线值得长期跟踪,但跟踪不等于追高。
结尾:下一场竞争,是谁能让模型「稳定做事」
过去,AI 公司比的是模型会不会答题。
接下来,物理 AI 比的是:模型能不能在现实世界里,安全、可靠、低成本地把一件事做完。
这会把竞争从屏幕带到工厂、仓库、道路、医院;也会把产业链从 GPU 和云端,继续拉向数据工厂、仿真、世界模型、机器人基础模型、传感器、边缘计算和执行器。
云端不会消失,而是变成物理世界的训练场。
让 AI 生成一段话很难,但让 AI 在现实里稳稳干完一件活,难一个量级。这恰恰是这条主线值得跟踪的原因——它指向的是 AI 未来几年最真实的工程战场,而不是又一个一周就凉的概念。
免责声明:本文仅为个人科技与市场观察记录,所涉公司、产品、事件均来自公开信息整理,不构成任何投资建议,也不构成对任何证券的买卖推荐。文中公司均为产业链结构分析所需的代表样本,不代表任何买入、卖出或持有建议。市场有风险,决策需独立判断。
主要资料来源(公开信息)
官方术语表 · NVIDIA Glossary — What is Physical AI / What is a World Model 官方公告 · NVIDIA:开源物理 AI agent 工具与技能(2026-06-01);Isaac GR00T 人形参考设计(2026-06-01);Physical AI Data Factory 蓝图(2026-03);Cosmos 世界模型平台(2025-01) 官方公告 · NVIDIA × 现代 AI 工厂(约 30 亿美元,2025-10);LG × NVIDIA「M.A.P.」联盟(2026-06-08) 官方博客 · Google DeepMind — Gemini Robotics / Gemini Robotics-ER 媒体报道 · 波士顿动力 × Google DeepMind,电动 Atlas(CES 2026,2026-01-05) 官方博客 · Waymo — The Waymo World Model(2026-02,基于 DeepMind Genie 3) 股东材料 · Tesla Q4 2025(从硬件公司向物理 AI 公司过渡) 官方公告 · 小鹏 VLA 2.0 全球部署与公开道路测试(含「有监督智能驾驶」边界说明) 官方公告 · Analog Devices — 2026:物理智能元年(2026-02-09) 行业研究 · IEEE/清华综述《Embodied AI: From LLMs to World Models》;Physical Intelligence π0.7 技术博客
夜雨聆风