OpenClaw爆火,英伟达NemoClaw出手“收编”,GTC 2026:从芯片到AI生态的全面狂飙

智元宇宙是一家致力于普及AIGC技术与应用的新媒体平台。我们为您提供最新的AIGC行业资讯，精选优质企业应用案例和实用方法，旨在帮助企业和个人迅速掌握人工智能应用技巧。我们的愿景是让人工智能成为普惠企业和个人的基础设施，实现无处不在的智能化服务。

GTC 2026在圣何塞一开场，皮衣老黄闪亮登场！全场狂热劲儿堪比顶流演唱会。

两个多小时的演讲里，老黄从芯片到AI新物种、从营收豪言到未来布局，全程高能。

此次王炸产品——新一代Vera Rubin，由七颗芯片合体而成，首次集成Groq技术，提升速度堪称离谱。

聊起业绩，老黄底气拉满。过去一年，Blackwell和Rubin芯片狂卷全球5000亿美元大单，紧接着他放出豪言：“2027年芯片营收直指1万亿美金”。

老黄还自嘲为“Token之王”，这并非夸大——如今token已是AI时代硬通货，而英伟达正是掌握其生产能力的核心玩家。

此次老黄不止谈芯片，更宣告了新物种NemoClaw的降临，而这一切都始于OpenClaw的爆火。

OpenClaw上线仅几周，就超越Linux三十年成就，成为全球最受欢迎开源项目，老黄在现场也忍不住惊叹其爆发力。

他用解读操作系统的思路拆解OpenClaw，涵盖资源管理、工具调用等AI核心需求，还下了个懂行人才懂的定论：Mac和Windows是个人电脑的OS，OpenClaw则是个人AI的OS——PC时代OS决定生态入口，老黄显然不愿让出AI时代的这一核心。

但OpenClaw这只网友口中的“野龙虾”风险不小，能读文件、跑代码、自主上网的它，放进企业内网如同定时炸弹。老黄点出三大风险：访问敏感信息、执行代码、对外通信。

NemoClaw便是英伟达的解决方案，一条命令即可安装，将OpenClaw纳入自家软硬件生态，既保实力又解隐患。

它主要做了三件事：内置OpenShell运行时加安全沙箱，让企业敢用；搭载Nemotron开源模型，日常任务不出内网、需强算力时调用云端；绑定多类硬件，满足Agent 7×24小时运转需求，助力企业迈入GaaS时代——从卖工具转向出租可干活的Agent。

本场最重磅的硬件，当属专为“智能体系统”设计的Vera Rubin，这是一个庞大而复杂的系统，包含七款全新芯片，旨在打造全球最大规模的 AI 工厂，针对 AI 各个阶段进行了优化，涵盖从预训练、后训练和测试时扩展到智能体推理的各个环节。

它的诞生标志着垂直整合的“系统巨兽”终于来临。

Vera Rubin并非单颗芯片，而是包含Vera CPU、Rubin GPU、NVLink 6 交换机、NVIDIA ConnectX 9 超级网卡、BlueField4 DPU、Spectrum-6 以太网交换机，以及新集成的 Groq 3 LPU在内的七颗全新芯片组成的AI超算平台。

现场展示的Vera Rubin全程100%液冷，线缆全消失，安装时间从两天缩至两小时；45°水冷却卸去数据中心能耗压力，省出的电全部用于计算，性价比拉满。

其中第六代NVLink是英伟达的“秘密武器”，研发难度极高；Groq 3 LPU已量产，配备8颗Grace芯片，很快就能落地。

老黄还亮出全球首款CPO Spectrum-X交换机，由英伟达与台积电联合研发，通过CoWoS工艺实现光子与电子直接转换，效率大幅提升。

Vera CPU作为第二代自研CPU，专为Agentic AI设计，88个定制核心搭配1.5TB内存，是全球唯一用于数据中心的LPDDR5 CPU，适配Agent工具调用场景。

压轴的Rubin Ultra更是强悍，GPU封装含4颗计算die，1TB内存，单个封装FP4推理算力达100 PFLOPS；装入Kyber机架后，一个机架即可组成超算，性能比Blackwell GB300 NVL72强14倍。

老黄感慨，十年前DGX ONE仅170 TFLOPS，如今Vera Rubin已是其4000万倍，进化速度令人震撼。

老黄抛出的一张图，被他称为“所有CEO都会关注”，图中展示了同等功耗下大模型的吞吐量与token生成速度，堪称AI工厂的“效率仪表盘”——数据中心是工厂，电力是产能，token是产品。

图中四条线对应四个档位：免费档用廉价小模型追求吞吐，中等档兼顾性能与成本，高价档用高端模型做深度推理，超级档针对关键任务，每百万token可赚150美元，利润空间极高。

硬件对比更直观：Hopper为起点，Grace Blackwell将吞吐量拉高35倍，Vera Rubin再翻5倍；按老黄的简化模型，Vera Rubin比Hopper多赚25倍收入，赚钱能力惊人。

去年底，英伟达斥200亿美元拿下Groq的LPU技术，还吸纳其核心团队，为性能提升再添助力。

Groq 3 LPU与英伟达GPU反差极大，容量仅500MB SRAM，却拥有150 TB/s带宽，是Rubin的近7倍，天生适配低延迟token生成。

英伟达并未让Groq替代GPU，而是通过Dynamo软件拆分推理流程：GPU负责需大量算力的prefill和attention，Groq负责低延迟的解码与token生成，两者耦合后延迟减半。

这一搭配让Groq在超级档位再提35倍性能，助力企业提升收益。目前Groq 3 LPU已量产，Q3出货，老黄建议：高吞吐场景用Vera Rubin，编码等需求可搭配25% Groq。

老黄总结，两年内Token生成率从200万增至7亿，实现350倍跨越，这还只是开始。

老黄公布了英伟达的超密集路线图，继Rubin之后，2028年将推出Feynman架构，配备全新芯片，首次同时支持铜缆和CPO扩展。

目前英伟达已锁死年更节奏，每代推理性能提3-5倍、训练性能提2-3倍，持续打破算力天花板。

英伟达甚至将目光投向太空，推出Vera Rubin Space-1 Module，太空推理性能是H100的25倍；Thor芯片已进入卫星，下一步计划在轨道建数据中心。

除了数字Agent，老黄还重点介绍了有物理身体的Physical AI，自动驾驶是首个落地战场。

现场演示的奔驰CLA，用Alpamayo 1.5模型实时决策，还能解说行驶逻辑、响应语音请求。老黄判断，自动驾驶的“ChatGPT时刻”已至，将成为首个万亿级机器人产业。

Physical AI的瓶颈的是真实训练数据不足，英伟达用Physical AI Data Factory Blueprint解决——通过Cosmos模型将有限真实数据“膨胀”为大规模合成数据，覆盖稀有场景。

老黄的“计算就是数据”一语中的：算力足够，数据就不再是瓶颈。

现场110台机器人中，迪士尼的Olaf机器人最抢镜，内置Jetson芯片，学会了自主走路、适应地形，还能和老黄俏皮互动，让人畅想未来迪士尼的全新形态。

- END -

智元易成科技有限公司专注于先进人工智能底层技术和专业应用开发，现已推出面向企业专属的AIGC应用平台——智元3.0，独有的企业级架构、自主可控的BrainByte AI大模型底座、无监督学习技术、低成本微调技术和各类企业级强应用。

👇点击关注“智元宇宙”，AIGC就在你身边