NVIDIA,终于把AI算力塞进每台PC里了。
今天,黄仁勋在GTC台北keynote上正式揭晓NVIDIA第一颗PC SoC—— N1X。
先一句话:这不是一张显卡,这是一整颗芯片,CPU、GPU、NPU全塞在一颗4nm的硅片上。
对应消费级GPU的话,GPU部分对标的是RTX 5070移动端。但跟现在的AI PC比——不管是英特尔Ultra还是AMD Ryzen AI——N1X的AI推理性能都不在一个数量级。
首批上车的就两家:戴尔和微软。Surface用,XPS也用。
今年底开卖。
GPU厂做CPU,这事靠谱吗?
N1X最反常识的一点:它不用x86,用的ARM。
黄仁勋的说法是,到了AI时代,PC的核心不再是CPU跑分,而是"这机器能不能在本地跑大模型"。
N1X的统一内存最高干到128GB。这个数字什么概念?跑70B参数模型,量化完刚好装进去,本地跑,不联网。
目前市面上能把70B模型跑在本地的消费级设备,只有苹果的Mac Studio(M3 Ultra 192GB版),起售价52999元。
N1X最便宜的版本,1999美元。换算过来大概1万4。
便宜一半。
而且CUDA还在。开发者不需要重新学一套东西——过去十几年在NVIDIA显卡上写的AI代码,换到N1X上照样跑。这是NVIDIA做ARM最不一样的地方。
Windows on ARM这事,微软断断续续推了十几年没成。但现在情况变了:AI应用本来就是新的,不存在"为了ARM重新编译"的历史包袱。
戴尔那边,首批产品的定价区间在1999美元 ~ 4999美元。入门款1999美元,GPU性能打平RTX 5070移动端,还能本地跑70B模型。
这个价格,有点意思。
x86双雄,这次压力真来了
说一个细节。
英特尔最新的Core Ultra 9 275HX,NPU算力是45 TOPS。AMD的Ryzen AI Max+ 395,NPU能跑到55 TOPS。
N1X的NPU+GPU联合推理,黄仁勋现场说的保守数字是200+ TOPS。
不是差一倍,是差一个数量级。
根本原因很简单:x86的NPU是把AI加速器"加"在CPU旁边,N1X是把整个SoC"围绕"AI推理设计的。从架构第一天就考虑的事,跟半路加装的,效率完全不一样。
打个比方:x86的NPU像是在燃油车里塞了个小电池搞混动。N1X是从设计图开始就是台纯电车。
但这不是说英特尔和AMD立刻就要完。
N1X最低1999美元,暂时不打主流市场。英特尔和AMD在3000-8000块的价位段,至少还有两三年好日子。
关键变量在微软。
如果Windows对N1X的AI特性做了深度绑定——比如明年Windows内置的本地Agent只能在NVIDIA芯片上跑最好——那故事的走向就完全不一样了。
改写的不止是PC
N1X出来,最值得关注的不是这颗芯片本身,是它背后那条逻辑线。
过去两年,黄仁勋反复讲一个比喻:AI是五层蛋糕——能源、芯片、基础设施、模型、应用。
数据中心这层,他已经把第三层(GPU算力基础设施)吃透了,全球80%以上的AI训练都跑在NVIDIA上。第四层也布了局,Nemotron模型。
现在他往两个方向同时延伸:往下,N1X把算力基础设施从数据中心推到终端设备;往上,动态工作流、Agent能力直接怼到应用层。
五层蛋糕,NVIDIA现在咬住了三层半。
这也是为什么英特尔和AMD要担心的不是N1X这颗芯片本身——今天市场盘后,英特尔股价已经跌了超过6%——而是NVIDIA正在把AI计算的链条从头做到尾。
从云端训练到终端推理,一次性闭环。
夜雨聆风