黄仁勋昨天干了件大事。
不是发新显卡。不是秀算力。是正式杀进了PC CPU市场。
他和联发科联手搞了一颗叫 RTX Spark 的"超级芯片"——Arm架构、3纳米工艺、Blackwell RTX GPU + 20核CPU集成在一起,128GB统一内存。今年秋天,戴尔、联想、华硕、惠普、微软全都会推出搭载这颗芯片的AI PC。
黄仁勋在台上说得很直白:"我们要重新定义个人电脑。"
翻译成大白话就是——跟苹果Mac正面开战。
但问题是:NVIDIA这个"AI PC",打得过已经统治移动计算五年的苹果M系列芯片吗?
我拉了5个维度的硬数据,一条条比给你看。
一、先搞清楚两边各是什么
NVIDIA RTX Spark
- CPU:20核Arm架构(10个X925超大核 + 10个A725能效核),跟联发科联合定制
- GPU:Blackwell RTX,6144核心,图形性能≈RTX 5070移动版
- AI算力:最高1 PetaFLOP(FP4精度)
- 内存:128GB统一内存,CPU和GPU共享,NVLink高速互联
- 制程:台积电3nm
- 系统:Windows on Arm(跟微软合作三年深度适配)
- 上市:2026年秋季,首发30+款笔记本、10款台式机,最薄14mm
Apple M5 Max(代表Mac最强AI配置)
- CPU:Apple自研,3nm N3P工艺
- GPU:内置神经网络加速器,每个GPU核心都有专用AI单元
- AI算力:约70 TFLOPS(FP16精度),16核Neural Engine + GPU神经加速器协同
- 内存:最高128GB统一内存,614 GB/s带宽
- 系统:macOS,Core ML + MLX框架
- 功耗:M5 Max约50W
- 已上市:MacBook Pro / Mac Studio 可买到
⚠️ 注意:FP4和FP16是不同精度,不能简单除。FP4推理≈2倍FP16效率,实际可用算力差距没那么夸张。但即便换算,RTX Spark的算力优势依然巨大(约7-10倍)。
二、5个维度,核心对决
| 维度 | NVIDIA RTX Spark | Apple M5 Max |
| AI算力 | 1 PetaFLOP FP4 换算约500 TFLOPS FP16等效 | ~70 TFLOPS FP16 GPU神经加速器+Neural Engine |
| 内存带宽 | 273 GB/s NVLink统一内存 | 614 GB/s 带宽领先2.25倍 |
| 能耗比 | 笔记本版待测试 桌面版DGX Spark约300W | 约50W 能效比业界领先 |
| AI生态 | CUDA + TensorRT AI开发标准,20年积累 | Core ML / MLX 专属但不如CUDA通用 |
| 软件兼容 | Windows on Arm ⚠️ x86兼容待验证 | macOS原生 Rosetta 2转译成熟 |
| 本地大模型 | 最高200B参数 ⚠️ 带宽瓶颈影响生成速度 | 70B 4bit流畅 高带宽推理解放 |
| GPU图形 | RTX 5070级别 光追+DLSS | 集成GPU 光追三代引擎 |
三、逐条深度解析
① AI算力——NVIDIA碾压级领先
1 PetaFLOP对70 TFLOPS,即使用FP4/FP16换算后,RTX Spark的AI算力大约是M5 Max的7-10倍。
这意味着什么?
如果你需要微调模型、跑批量推理、训练小型LoRA——RTX Spark完胜。128GB统一内存能装下的模型,在Blackwell GPU上跑起来比M5 Max快一个数量级。
但得提醒一句:1 PetaFLOP是FP4精度,主要用于大模型推理加速。做训练时一般用FP16/BF16,实际可用算力会打折扣。
② 内存带宽——Mac的关键杀招
这是最反直觉的一个数据。M5 Max的614 GB/s带宽是RTX Spark(273 GB/s)的2.25倍。
为什么带宽这么重要?
大模型推理有两个阶段:
- Prefill(预填充):吃算力,NVIDIA占优
- Decode(逐Token生成):吃带宽,GPU需要频繁从内存读取模型权重
你在聊天界面看到AI一个字一个字往外蹦,这就是Decode阶段——带宽越大,字蹦得越快。
所以一个反直觉的事实:本地跑大模型聊天,Mac可能比RTX Spark响应更快。虽然算力差7-10倍,但Decode阶段带宽是王道。
③ 软件生态——CUDA的护城河有多深
如果你是AI开发者,CUDA就是你的"母语"。
PyTorch默认CUDA后端。HuggingFace默认CUDA。FlashAttention、vLLM、TensorRT-LLM——这些让大模型跑得飞快的优化库,全都基于CUDA。
苹果这边有MLX和Core ML,能用,但没有FlashAttention这类底层优化,也没有多节点分布式训练的成熟方案。如果一个模型需要超过128GB内存,Apple生态里基本没辙。
另外:Windows on Arm的x86兼容性是个不确定因素。跟三年前M1 Mac刚出来一样,第一批软件总有兼容问题。微软和NVIDIA说花了三年适配,但大量x86 AI工具在Arm Windows上到底跑得怎么样——要等实物出来才知道。
④ 能效——Mac依然无敌
M5 Max整机功耗约50W,笔记本能撑10小时以上。DGX Spark桌面版约300W,笔记本版功耗待公布,但大概率在65-120W之间(14mm机身散热极限)。
如果你需要不插电跑AI,Mac目前没有对手。
⑤ 图形性能——NVIDIA重夺阵地
RTX 5070级别的图形性能意味着:3D渲染、视频剪辑、游戏——这些场景RTX Spark全面领先。NVIDIA还有光追和DLSS,Mac的光追引擎虽然进步很大,但和独立RTX GPU不是一个量级。
四、一句话结论:看你是谁
| 你是这类人 | 选NVIDIA RTX Spark | 选Mac |
| AI模型训练/微调 | ✅ 算力碾压,CUDA原生态 | ❌ 算力不够,生态不全 |
| 本地跑大模型聊天 | ⚠️ 带宽瓶颈,可能不如Mac快 | ✅ 高带宽+低功耗,体验更好 |
| 移动办公+轻度AI | ⚠️ 续航和便携待验证 | ✅ 10小时续航,行业标杆 |
| 3D渲染/视频剪辑 | ✅ RTX 5070级图形+光追DLSS | ⚠️ 集成GPU,勉强够用 |
| 预算敏感 | ⚠️ 新品溢价,价格待公布 | ⚠️ M5 Max 128GB超$5500 |
五、3条Take Away
① 算力选NVIDIA,体验选Mac。这不是互斥——是使用场景不同。训模型用RTX Spark,跑模型本地聊天用Mac。两者在AI PC市场的定位目前是互补,不是零和。
② 今年秋天是分水岭。RTX Spark上市前,Mac是AI笔记本的唯一选择。上市后,NVIDIA用CUDA生态+算力优势,会抢走大量AI开发者用户。苹果要守住AI笔记本市场,M6必须在算力上缩小差距。
③ 真正的变量不是芯片,是Windows on Arm。RTX Spark硬件再强,如果x86兼容性问题解决不好,开发者不会买单。历史规律:第一代Arm Windows设备通常要经历1-2年阵痛期。敢不敢第一批上车,考验你的风险承受力。
你怎么看?RTX Spark上市后,你会选NVIDIA还是继续用Mac?欢迎留言区聊聊你的选机逻辑 👇
关注「每日AI洞察」,每天一个行业深度分析,不错过AI改变世界的关键节点。
夜雨聆风