
本次路演英伟达发布了面向AI时代的多款新产品,覆盖数据中心推理、AI代理计算、个人PC、物理AI与机器人领域,明确了未来以代理式计算为核心的行业发展方向,同时公布了开放模型生态与合作伙伴计划。
Mellanox CPO技术与推理优化方向
* 早期AI架构定位:Hopper架构最初设计定位为大模型预训练,是英伟达早期重点推进的核心AI训练架构。
* 推理技术优化成果:英伟达针对大模型推理的高难度需求,开发出NVLink 72技术,将英伟达的token成本降低了数个数量级,达到全球最低水平。
* Vera Rubin系统创新:Vera Rubin系统采用中心PCB连接结构替代原有大量电缆,将装配时间从2小时缩短至5分钟,系统可靠性大幅提升。
Vera CPU的AI时代定位与核心参数
* 产品设计定位:Vera是专为AI代理设计的全新CPU架构,不同于传统面向人类使用的CPU,核心要求是极致低延迟。
* 核心性能指标:Vera每个时钟周期可提取、解码并执行10条指令,IPC为全球最高;内部核心互连总带宽达到3.6TB每秒,支持PCI Express Gen6,LPDDR5带宽达到1.2TB每秒,是现有高性能CPU的3倍。
* 产品优势表现:SQL运行速度可达传统x86 CPU的3倍,纽约证券交易所实时流处理性能可达传统x86 CPU的6倍,整体代理沙箱性能可达x86 CPU的1.8倍。
* 产业落地基础:英伟达已经售出数百万片Grace CPU,全行业软件栈、安全栈均已完成针对Grace的优化,Vera可直接复用该成熟生态。英伟达已经成为全球最大的CPU厂商之一。
英伟达企业AI代理工具包架构
* 工具包四大组成部分:工具包包含可定制修改的大模型、用于整体调度的编排框架、CUDA X类工具技能库,以及负责整体调度运行的OpenShell运行时。
*OpenShell核心特性:OpenShell是开源的安全运行时,可提供企业内部安全策略管控、隐私保护与身份权限管理,目前Red Hat、Canonical、微软均计划采用该框架。
* Cadence芯片设计合作案例:英伟达与Cadence合作打造芯片设计超级代理,可自动完成RTL生成、测试台创建、回归测试与debug流程,将原本需要数周的验证周期压缩到数小时,速度提升超过40倍。
Nemotron 3 Ultra开放大模型发布
* 模型核心参数与架构:Nemotron 3 Ultra是全球首个基于SSM混合专家架构的大模型,推理速度达到现有最优开放模型的5倍,整体运行成本降低30%。
* 开放生态策略:英伟达开放了Nemotron 3 Ultra的完整模型、训练所用数据集与训练脚本,允许合作伙伴在此基础上定制修改为自有专有模型。
* 产品路线规划:目前英伟达已经启动Nemotron 4的开发工作,后续将持续推进模型性能升级。
RTX Spark新一代AI PC发布
* 核心硬件参数:RTX Spark搭载Blackwell RTX GPU,包含6144个CUDA核心,提供1PetaFLOP的AI算力,集成20核心定制Grace CPU,搭配128GB统一内存,采用台积电3纳米工艺,总计集成700亿晶体管。
* 软件兼容特性:RTX Spark完全兼容所有Windows应用,支持英伟达全栈CUDA软件,可运行数字生物学、地震勘探、天体物理等全品类专业应用,同时原生支持本地AI代理运行。
* 产品生态布局:微软与英伟达合作推出覆盖笔记本、台式机、工作站的全新AI PC产品线,全球PC产业100%参与支持该全新产品布局。
* DGX Station桌面工作站配置:Windows兼容的DGX Station配备768GB内存,可运行万亿参数大模型,提供20PetaFLOP算力与8TB每秒内存带宽,适合大模型与AI代理本地开发。
AI PC行业发展
* 产品形态变革逻辑:就像智能手机改变了手机的核心用途,未来PC的核心定位也会从点击启动应用的工具,转变为家庭中持续运行的个人AI代理超级计算机。
* 产品迭代路线:英伟达每一代新架构都会推出对应的笔记本、台式机、工作站产品,形成完整的AI PC产品家族。
* 开发者生态支持:Adobe已经为RTX Spark重新优化了Photoshop与Premiere,性能提升一倍,同时添加了MCP服务器支持,实现本地AI代理交互。
Cosmos 3物理AI基础模型发布
* 产品定位与特性:Cosmos 3是面向物理AI的开放基础模型,可解决物理AI领域数据采集难的核心痛点,当前在全球各类物理AI任务排行榜上均位居首位。
* 核心能力覆盖:Cosmos 3可作为视觉语言模型理解物理场景,可生成符合物理规律的合成视频,可作为闭环仿真器用于策略训练评估,也可直接作为机器人策略模型使用。
* 开放生态规则:和Nemotron一致,英伟达开放了Cosmos 3的完整模型、数据与训练方法,允许开发者定制修改为自有专有模型。
自动驾驶与机器人领域新产品发布
* Alphamale 2自动驾驶开放模型:Alphamale 2是面向自动驾驶的开放推理模型,全球80%的汽车厂商已加入英伟达Hyperion平台,97%的全球出行服务已接入英伟达生态,可直接部署使用该模型。
* Isaac Groot人形机器人参考平台:Isaac Groot是全集成的人形机器人参考开发平台,整高6英尺,体重150磅,单手掌拥有25自由度,全身总计31自由度,搭载Thor计算平台与全栈英伟达软件。
* 平台开发价值:该平台可让高校与研究人员省去数月的从零搭建工作,数小时内即可启动机器人研究,所有组件均模块化开放,支持替换自定义部件。
AI产业发展整体预判
* 统一计算模式:所有AI系统,无论是云端数据中心、PC、自动驾驶还是机器人,都遵循统一的代理计算模式:大模型+编排框架+工具技能+运行时,仅会根据场景选择不同组件。
* 未来市场规模:未来全球将诞生数百亿量级的代理式AI计算系统,其市场规模会远超传统面向人类的计算产品市场。
* 英伟达产业定位:英伟达已经转型为全栈AI基础设施公司,不仅提供GPU,还可提供从CPU、网络、系统到软件栈的完整代理计算解决方案。Vera CPU已经获得大量订单,有望成为英伟达历史上增长最快的新产品。微软和英伟达联合推出全新AI PC产品线,开启个人计算新时代,代理计算模式未来会复制到所有类型的计算设备,覆盖从云端到边缘的所有场景。
- “Inference equals money.”
- “There will be billions of agents and these agents are gonna be using the CPUs with very little patience because the cost of the GPUs they sit next to is too high and therefore too valuable too precious.”
- “This market will surely be larger than the last and the reason for that is because there'll be a lot more agents than there are people.”
- “Every company will be an agent company every company will have agents running inside every company will see that agents will need its own operating system.”
- “This reinvention of the computer is as big of a deal as the reinvention of the phone into what we now know as the smartphone.”
- “The computing pattern of an agent that's a model a harness that uses tools with skills and runs in a run time. That run time depends on whether it's in the cloud or on prem on a PC or in a robot but the computing pattern is exactly the same for all of them.”
-“推理算力等同于收益。”
- “未来将会诞生数十亿智能体,这类智能体对CPU资源的等待容忍度极低,因为与之配套的GPU成本高昂,稀缺且价值珍贵。”
- “该市场规模势必超越以往所有市场,核心原因是智能体的数量将会远超全球人口总数。”
- “每家企业都将转型为智能体企业,企业内部都会部署运行智能体,并且企业会意识到智能体需要专属的操作系统。”
- “这场计算机架构的革新,重要程度堪比功能机迭代为如今智能手机的变革。”
(工具英译汉,仅供参考)


点个赞,财运追着你不散!
夜雨聆风