算力王炸+软件操作系统:AI双线爆发的24小时-夜雨聆风

算力王炸+软件操作系统:AI双线爆发的24小时

本周AI圈有两颗炸弹，间隔不到24小时。

一颗来自台北，黄仁勋在Computex 2026的主题演讲上把牌桌掀了。RTX Spark消费级超算、DGX Station桌面AI超算、5500亿参数开源模型，一口气全端上来。

另一颗来自北京，字节跳动在6月1日悄悄上线了扣子Coze 3.0。多人多Agent协作、接入Claude Code、开箱即用的行业专家模板——把”人和Agent一起干活”这件事做成了产品。

一个在底层算力上掀桌子，一个在顶层应用上搭架子。这不是巧合，是AI产业从”模型竞赛”切换到”全栈竞争”的信号。

“把超算塞进笔记本”

黄仁勋这次最狠的产品叫RTX Spark。

20核Grace CPU（Arm架构），6144个CUDA核心的Blackwell RTX GPU，128GB LPDDR5X统一内存，1 PFLOP FP4算力。CPU和GPU共享同一个内存池，零拷贝数据传输，没有PCIe瓶颈。

如果你对苹果M系列芯片的统一内存架构印象深刻，那RTX Spark就是英伟达的回答——但内存是M4 Ultra的两倍，算力是另一个量级。

1 PFLOP什么概念？2018年全球最快的超算Summit，算力大约200 PFLOP。现在英伟达把1/200个Summit塞进了笔记本。起步价1499美元。

黄仁勋的原话：”用户只需提出需求，剩下的都将由电脑来完成。”

翻译一下：这不是一台电脑，是一个AI助手。它本地就能跑700亿参数的大模型，不需要联网，不需要云服务，所有数据留在本地。

六大PC厂商——戴尔、惠普、联想、华硕、微星、微软Surface——今年秋季会推出30多款笔记本和10款台式机。旗舰型号3499美元。

苹果该紧张了。

“1万亿参数，放桌上跑”

RTX Spark是给普通用户的，DGX Station是给硬核玩家的。

GB300 Grace Blackwell Ultra桌面超级芯片，72核Grace CPU，748GB相干统一内存，20 PFLOP FP4算力。配ConnectX-8 SuperNIC，网络速度800Gb/s。还能加一块RTX PRO 6000做光线追踪可视化。

最炸裂的数字：支持运行1万亿参数的AI模型。数百个AI智能体同时执行任务。

1万亿参数，GPT-4级别的模型，放在你桌上跑。不需要机房，不需要冷却塔，不需要Linux运维团队。插上Windows就能用——微软跟英伟达一起做了适配，专门解决了企业AI工作负载从Linux到Windows的鸿沟。

价格呢？4.5万到8.5万美元。对个人来说不便宜，但对任何一家需要在云端租GPU跑推理的公司来说，半年就能回本。

更有意思的是模型侧。英伟达同时扔了Nemotron 3 Ultra：5500亿总参数，混合Mamba-Transformer MoE架构，100万token上下文窗口。比Qwen3.5快5倍，比GPT-OSS快2.2倍，推理成本比竞争对手低30%。而且开源，Apache 2.0许可。

还有Cosmos 3，全球首个开源的物理AI全能模型，把视觉推理、世界生成和动作生成统一到一个模型里。以前做机器人需要三个系统分别处理”看懂世界””想象未来””执行动作”，现在一个模型全干了。

说人话：英伟达不仅在卖算力，它在卖”跑我算力的理由”。

“一人+多Agent，多人+多Agent”

算力准备好了，谁来用？

6月1日，字节跳动给出了一个答案。扣子Coze 3.0正式上线，核心只有一句话：多人多Agent协作，开箱即用。

这是两种协作模式。第一种：一人驱动多个Agent。你是主脑，Agent们是手脚。你下一个指令，后端自动拆任务、分角色、并行执行。以前要手动串工作流，现在平台帮你把协作逻辑内化了。

第二种：多人+多Agent。这才是真正的新东西。你的团队成员可以同时操作不同的Agent，Agent之间也能互相调用。多项目独立管理，资产自动沉淀。说白了，AI Agent成了团队里的”数字员工”，有手有脚还有记忆。

这个打法直接对准的不是Dify，不是FastGPT，是企业的协作中台。钉钉、飞书做了人和人的协作，Coze想做人和Agent、Agent和Agent的协作。

Coze 3.0还有一个狠招：支持接入本地Agent。Claude Code、Codex CLI、OpenClaw，这些第三方工具可以直接嵌进Coze的工作流。你在Coze里排工作流，需要写代码了，调Claude Code；需要处理本地文件了，调OpenClaw。全流程在Coze里完成，但算力可以落在本地。

对企业客户来说，这意味着数据不用全部上传云端，合规压力小了很多。

“开箱即用的行业专家”

扣子3.0内置了精品行业模板，覆盖五个领域：自媒体、法律、金融、互联网、医疗健康。

这件事的意图很明显：降低门槛。以前你要自己写Prompt、调工作流、接API，现在直接用一个”行业专家技能包”，Agent一起步就是有专业能力的。自媒体Agent懂选题和排版，法律Agent能处理文书，金融Agent能做投研辅助。

从官方描述看，它用的是”专家技能”这个词。我倾向于认为，字节跳动把自己在自媒体（抖音/TikTok生态）、互联网（字节内部工具链）、金融（抖音支付/电商数据）上的积累，封装成了可复用的Agent技能包。这不是通用AI公司能做得到的，需要有真实的行业数据和场景积累。

Coze 3.0支持自由切换主流平台，完成从开发到上线的全流程工作流。手机电脑跨端同步，App端也能推进编程和视频项目。以前要做成一个能用的AI应用，至少要在三四个平台之间跳转。现在Coze想把这一整条链路吃下来。

对开发者来说，省掉的是集成成本。对企业来说，省掉的是多平台采购和运维成本。但反过来想，这也意味着你对Coze的依赖会更深。

“从卖芯片到卖操作系统”

把英伟达和Coze的动作放在一起看，一条完整的产业链正在成型。

英伟达的路径是：底层硬件（RTX Spark/DGX Station）→ 中间模型（Nemotron/Cosmos）→ 上层平台（OpenShell/NemoClaw/Dynamo）。从芯片到模型到操作系统，一条线全吃。

字节跳动的路径是：底层Agent框架（Coze 3.0多Agent引擎）→ 中间行业技能包（五大领域模板）→ 上层协作平台（多人多Agent+全平台全流程）。从开发工具到协作中台到行业解决方案，它也想一条线全吃。

两家公司的赛道不同，但逻辑是一样的：不再卖单一产品，而是卖”全套方案”。你用我的芯片，就跑我的模型；你用我的Agent平台，就接入我的行业技能包。

这才是最可怕的地方。AI竞争的上半场是”谁的模型强”，下半场是”谁能把硬件、模型、平台、行业应用全部串起来”。

英伟达在赌全栈算力，字节跳动在赌全栈Agent操作系统。

谁会赢？现在说还早。但方向是清楚的：单点突破的时代结束了，接下来是全产业链的对抗。

AI不再是某一家公司的技术优势，它正在变成一套完整的基础设施。谁先跑通，谁就定义了下一个十年。

关注我，每天带你读懂AI产业的每一个关键变化。