NVIDIA物理AI新工具:智能体化开发栈,加速物理AI规模化落地

摘要：本文解析NVIDIA在GTC台北与Computex发布的全新物理AI开发工具，揭秘它如何把整个物理AI技术栈智能体化，让AI智能体自动完成数据生成、仿真、训练、部署的全流程，把机器人开发周期从数周压缩到数小时，同时推出了开源的人形机器人参考设计，大幅降低物理AI的开发门槛，加速机器人、自动驾驶、工业数字孪生的规模化落地。

引言：物理AI开发的效率瓶颈

随着物理AI的快速发展，机器人、自动驾驶、工业数字孪生这些领域的开发，却遇到了越来越高的复杂度门槛：传统的开发流程里，开发者要自己搭建数据生成、仿真、训练、部署的全链路，不仅要花大量的时间做底层的基础设施工作，还要处理不同组件的适配问题，导致一个新的应用，往往要花数月甚至更久才能落地。

而且，随着智能体AI的兴起，软件领域已经实现了用AI智能体来自动化开发流程，但物理AI领域，却一直没能跟上这个趋势，开发者还是要手动完成大部分的工作，效率很难提升。

现在，NVIDIA终于解决了这个问题，在GTC台北和Computex上，他们发布了全新的开源物理AI技能与工具，把整个物理AI的技术栈，都做成了智能体可调用的，彻底改变了物理AI的开发模式。

1. 核心突破：把整个物理AI栈，做成智能体可用的

这次NVIDIA最核心的突破，就是把他们整个物理AI的技术栈，全部优化成了智能体可用的，把原来的库、模型、框架，都变成了智能体能直接调用的工具，让AI智能体，能自动完成整个开发流程。

这些工具覆盖了物理AI的全领域，包括：

+-NVIDIACosmos3：面向物理世界推理与生成的世界基础模型，能理解视频和文本，预测接下来会发生什么，生成对应的动作。

+-NVIDIAOmniverse：仿真与数字孪生的相关库，用来做工业的虚拟仿真。

+-NVIDIAIsaac：机器人仿真与机器人学习的平台，支撑机器人的全流程开发。

+-NVIDIAMetropolis：视觉AI的相关工具，用来做视觉相关的应用。

+-NVIDIAAlpamayo：自动驾驶的开发平台，支撑自动驾驶的研发。

+-NVIDIAJetson：边缘AI的开发平台，用来做端侧的部署。

NVIDIA的创始人兼CEO黄仁勋表示：“AI智能体正在彻底改变软件开发，而这个变革，现在也来到了物理AI领域，延伸到那些会改变交通、制造、医疗和机器人的系统里。当智能体能直接使用NVIDIA的库、模型和框架的时候，物理AI的开发速度会变得更快，让开发者能以前所未有的速度，打造未来的机器人、自动驾驶和工业系统。”

2. 技术细节：新的技能，让智能体自动完成开发流程

为了让这些工具能被智能体使用，NVIDIA推出了全新的技能，把物理AI的开发流程，变成了可重复的指令，编码智能体可以直接遵循这些指令，自动完成开发工作，包括调用什么工具、输出什么结果、怎么验证结果。

同时，他们还推出了：

+-NVIDIANemoClaw：蓝图工具，让开发者能安全地构建和部署自主智能体。

+-NVIDIAOpenShell：运行时，提供基于策略的安全和隐私治理，不管是本地还是云端的硬件，都能支持。

这些技能，能覆盖物理AI的所有领域，包括：

+-机器人与边缘AI：机器人开发者可以用这些技能，加速整个机器人的开发管线，从生成感知和mobility的训练数据，到仿真，自动化导航训练，推进机器人学习，还有Jetson端侧系统的调优部署。

+-自动驾驶：自动驾驶开发者，能用这些技能，把车队采集的数据，重建为仿真环境，大规模生成photorealistic的驾驶场景，还能运行闭环的强化学习，扩展训练和评估的覆盖范围。

+-实时视觉AI智能体：自动化检测和视频智能的开发者，能用这些技能生成合成训练数据，微调模型，自动化标注，还能构建视频AI智能体，用来搜索、总结和分析实时或者录制的视频。

+-工业AI：工业软件开发者，能把工程数据，转化为CAD资产，用来做数字孪生的仿真，优化大型的OpenUSD场景，不用手动的配置。

+-医疗：医疗团队，能引导智能体，创建医院环境的数字孪生，做sim-to-real的数据生成，还有软件在环的策略测试，在部署到临床环境之前，完成所有的验证。

这些技能还可以组合，集成到更大的智能体系统里，让开发者能编排和自动化复杂的工作流，比如数据生成、仿真、优化、推理调优、持续评估这些，全部都能自动化完成。

3. 效果验证：已经有大量企业落地，效率提升显著

这些新的工具，已经有大量的企业在使用了，而且带来了非常显著的效率提升：

机器人领域的落地

1XTechnologies、AgileRobots、Agility、FieldAI、HexagonRobotics、NEURARobotics、SkildAI、UniversalRobots这些机器人公司，都已经在用NVIDIA的智能体就绪的物理AI栈了。

比如，用了IsaacGR00T的更新之后，端到端的工作流，几个小时就能搭建完成，而之前要花几周的时间，而且它支持全模态的输入输出，视频、传感器、文本、声音都能支持。

还有Foxconn和Compal，在用IsaacforHealthcare来加速医院机器人的开发，Compal正在推进PolyMedX机器人的开发，打造医院级的编排平台，集成仿真、AI和真实的运营；Foxconn则在把Nurabot扩展到多个医院和长期护理的环境里，还推出了新的scrubnurse协作机器人，用来优化手术室的工作流。

制造领域的效率提升

在电子制造领域，TSMC和Pegatron都在用这些工具来微调视觉检测模型：

+-Pegatron用DefectImageGeneration技能生成的合成数据，把模型的训练和部署时间，降低了67%。

+-DeltaElectronics用同样的技能，生成了合成的缺陷数据，把金属汇流排的多余焊料的检测率，提升了17%。

+-Inventec集成了这个技能，打造了自己的观测智能体检测管线，把笔记本chassis制造的缺陷数据收集工作，减少了30%。

+-Foxconn用这个技能，把制造的良率，提升了大约3%，更早地发现错误，提升了效率。

还有SKhynix，正在用Omniverse打造半导体fab的数字孪生，还在验证NVIDIAAgentToolkit，用来做制造专属的物理AI。

自动驾驶领域的落地

自动驾驶的开发者，比如LiAuto、Afari、[DeepRoute.ai](DeepRoute.ai)，都在用OmniverseNuRec模型，做神经场景重建和渲染，他们已经生成了超过1000个重建，每天能做超过30万个渲染和仿真。

还有Foxconn、VinFast、Uber、HUMAIN，都加入了NVIDIADRIVEHyperion生态，用来开发和部署SAELevel4的robotaxi。

4. 人形机器人的新突破：开源参考设计，降低开发门槛

除了开发工具，NVIDIA还发布了全新的NVIDIAIsaacGR00TReferenceHumanoidRobot，一个开源的人形机器人参考设计，基于Unitree的H2底盘，还有JetsonThor平台，用来降低人形机器人的开发门槛，让更多的开发者能参与进来。

这个参考设计，是模块化的，开发者可以用整个平台，也可以把部分能力，集成到自己的开发管线里，不用再重复搭建基础设施，就能快速推进人形机器人的研发。

它的核心配置包括：

+-UnitreeH2人形底盘：1.8米高，68公斤重，31个自由度，支持人类级别的测试。

+-双SharpaWave触觉五指手：22个自由度，让整个机器人的自由度达到了75个，支持精细的操作。

+-多视角感知：头部的立体相机，140度水平、102度垂直的视野，还有手腕的相机，用来做近距离的操作，还有IMU用来做运动跟踪。

+-全身控制：手臂扭矩最高120牛米，腿部扭矩最高360牛米，额定手臂payload7公斤，峰值15公斤，支持更强的举升和伸展能力。

+-JetsonAGXThorT5000端侧计算：BlackwellGPU，2070FP4teraflops的AI性能，14核ArmCPU，128GB的统一内存，支持实时的传感器处理和机器人推理。

+-完整的连接和电池：支持以太网、Wi-Fi6、蓝牙5.2，还有3小时的续航。

现在，Ai2、ETHZurich、斯坦福机器人中心、UCSanDiego的先进机器人与控制实验室，这些顶尖的研究机构，都计划用这个参考设计，来推进人形机器人的研究，这个设计，会在2026年底，由Unitree正式发布。

5. 行业意义：智能体化，物理AI开发的新范式

这次NVIDIA的这些工具，彻底改变了物理AI的开发模式：过去，物理AI的开发者，要自己搭建整个开发管线，从数据生成，到仿真，到训练，到部署，每个环节都要手动完成，不仅慢，而且复杂度很高，门槛也很高，只有大团队才能做。

而现在，智能体化的开发栈，把这些工作，都变成了AI智能体能自动完成的流程，开发者只需要专注在自己的核心应用上，不用再花时间做底层的基础设施工作，这就把开发的时间，从数月，压缩到了数天，甚至数小时，门槛也大幅降低，小团队、学生团队，都能快速开发出自己的物理AI应用。

而且，开源的人形机器人参考设计，也让更多的开发者，能参与到人形机器人的研发里，不用再花大成本去做自己的硬件平台，这会加速整个行业的创新，让人形机器人的落地，变得更快。

6. 未来展望：物理AI的规模化落地新窗口

现在，这些物理AI智能体工具，已经正式发布了，开发者可以通过GitHub和[skills.sh](skills.sh)来使用，而且，还有很多的云服务商，比如Microsoft、CoreWeave、Nebius，都在集成这些工具，让开发者能更方便地规模化使用。

接下来，整个物理AI行业，都会进入一个新的阶段：智能体化的开发，会成为新的常态，开发者能以前所未有的速度，开发出新的机器人、自动驾驶、工业AI应用，这会加速整个物理AI的规模化落地，让我们更快地迎来，这些技术走进我们生活的时代。

结语

NVIDIA这次的物理AI新工具，是整个物理AI领域的一个全新里程碑：它第一次，把整个物理AI的技术栈，都做成了智能体可调用的，让AI智能体，能自动完成整个开发流程，把开发的时间，从数周压缩到了数小时，同时，开源的人形机器人参考设计，也大幅降低了行业的开发门槛。

这不仅解决了物理AI开发的效率瓶颈，也为整个行业，打开了全新的创新窗口，未来，我们会看到，越来越多的开发者，用这些工具，快速开发出新的应用，加速物理AI的规模化落地，让机器人、自动驾驶、工业AI这些技术，更快地走进我们的生活。

点击“阅读原文”查看更多