GTC台北大会总结

Coding作为Generative AI最重要的垂类应用,最近几年成倍增长。3000万开发者,3万亿美元工资,产生9万亿产出。

智能体应用= LLM + Harness,prompt输入模型,软件harness编排智能体了解上下文,推理,行动,调用工具和skills,存在短期记忆和长期记忆。
以后只要和AI说出需求,AI可以自动调用工具生成执行达到输出结果。

Cuda library 可以变成skills,智能体学习使用library,CPU用来智能体编排,DPU bluefield storage 安全计算,内存也会不断迭代。
Vera Rubin

核心一句话:AI进入智能体时代;英伟达从GPU公司升级为全栈AI基础设施巨头,端侧RTX Spark+云端Vera Rubin双线引爆算力革命。

英伟达基础设施DSX AI 工厂生态,未来1000亿美元的AI工厂投入

计算未来就是企业的营收,每个token就是营收,需要保证每token/watt足够高,系统太复杂,可靠性足够高。每几个月软件迭代足够快,需要架构足够灵活,系统不断进行迭代更新。

下图从左到右:
Vera Rubin 用“无线缆背板+模块化托盘”把上一代大量铜线(飞线)全部干掉,装配时间从2小时压到5分钟(-97%),同时信号更稳、维护更简单。
Vera CPU Tray = 专门放 Vera CPU 的独立托盘/机架,是 Rubin 平台里负责智能体AI/强化学习的专用CPU算力柜,不和GPU混在一个托盘。
放 256颗 Vera CPU(88核ARM,自研Olympus核心)
• 全液冷、模块化、无内部铜线(背板硬连接)
• 每颗CPU:1.2TB/s 内存带宽(LPDDR5X)、1.8TB/s NVLink-C2C 互联
• 跑智能体环境(Agent Sandbox):代码执行、工具调用、Python/JS沙箱、数据检索、结果评估
• 支撑22,500+ 并发RL环境,给NVL72 GPU集群喂数据、发指令、收反馈
最后一个负责存储

LPU(Language Processing Unit)30:Groq 研发的大模型推理专用芯片,主打超低延迟、确定性执行、片上超大 SRAM,推理速度比 GPU 快、功耗更低。

NVLink Switch Tray = Scale‑Up(纵向/向上扩展):机柜内、GPU之间超高速、全互联、低延迟私有网络,用于张量并行、紧耦合训练。
以太网Switch Scale‑Out(横向扩展):机柜间、节点间大规模、可伸缩、标准以太网组网,用于数据并行、分布式训练/推理。

智能体推动计算革新,CPU延迟需要减少
Vera Rubin 负责思考,有2个CPU,一个负责编排GPU,管理KV Cach,还有Grace Bluefield负责安全和隔离。
Vera compute负责harness,编排AI 模型,读取资料库,调用工具。
Bluefield 负责存储,智能体需要很快读取存储

新CPU给智能体Vera
最强Single thread performance
3.4 TB/s core to core 带宽
LPDDR5X,1.2TB/s带宽(≈Grace的2倍、x86的数倍)。

一、核心判断
• 范式切换:AI从“生成内容”进化到“自主完成任务”,Agentic AI成主流。
• 新经济公式:算力即收入(Compute is Revenue),数据中心=智能体工厂。
• 英伟达定位升维:从卖GPU→AI全栈基础设施提供商,软硬一体、端云闭环。
二、端侧核弹:RTX Spark+N1X,颠覆PC格局
• 联手微软+联发科,N1X(3nm) 为核心的RTX Spark平台,2026秋季登陆Windows高端笔电/台式机。
• 参数炸裂:6144 CUDA核心、1Petaflop AI算力、128GB统一内存,笔电可本地跑70B大模型。
• 行业冲击:CUDA完整进入Windows,英特尔在PC芯片30年垄断遭重创;PC变“私人AI机器人”。
三、云端霸权:Vera Rubin量产,AI工厂落地
• 新一代超算平台Vera Rubin正式量产,面向智能体推理,OpenAI/Anthropic等为首批客户。
• Vera CPU:专为AI设计,能效翻倍,支撑大规模智能体集群。
• DSX平台:AI超级工厂,一站式训练/部署/运维,降低智能体落地门槛。
四、全栈闭环:覆盖数据中心/PC/汽车/机器人
• 智能驾驶:比亚迪、吉利、极氪、小米等采用Hyperion平台,中国车企全面上车。
• 人形机器人:Omniverse仿真+Isaac平台,2026成商业化元年。
• 软件壁垒:OpenClaw(智能体OS),开源生态对标Linux,重构应用交互。
五、黄仁勋金句
• “有用的AI已经到来,智能体是核心标志”。
• “AI减少就业?一派胡言”(GitHub代码量3年涨2倍)。
• “PC重塑堪比手机变智能机,智能体将跑在所有新电脑上”。
六、市场影响
• 英伟达股价夜盘涨约3%,算力链全线提振。
• 结论:2026是智能体元年,英伟达凭端云双线+全栈生态,锁定AI时代最大红利。
夜雨聆风