算力王炸+软件操作系统:AI双线爆发的24小时
本周AI圈有两颗炸弹,间隔不到24小时。
一颗来自台北,黄仁勋在Computex 2026的主题演讲上把牌桌掀了。RTX Spark消费级超算、DGX Station桌面AI超算、5500亿参数开源模型,一口气全端上来。
另一颗来自北京,字节跳动在6月1日悄悄上线了扣子Coze 3.0。多人多Agent协作、接入Claude Code、开箱即用的行业专家模板——把”人和Agent一起干活”这件事做成了产品。
一个在底层算力上掀桌子,一个在顶层应用上搭架子。这不是巧合,是AI产业从”模型竞赛”切换到”全栈竞争”的信号。
01
“把超算塞进笔记本”
黄仁勋这次最狠的产品叫RTX Spark。
20核Grace CPU(Arm架构),6144个CUDA核心的Blackwell RTX GPU,128GB LPDDR5X统一内存,1 PFLOP FP4算力。CPU和GPU共享同一个内存池,零拷贝数据传输,没有PCIe瓶颈。
如果你对苹果M系列芯片的统一内存架构印象深刻,那RTX Spark就是英伟达的回答——但内存是M4 Ultra的两倍,算力是另一个量级。
1 PFLOP什么概念?2018年全球最快的超算Summit,算力大约200 PFLOP。现在英伟达把1/200个Summit塞进了笔记本。起步价1499美元。
黄仁勋的原话:”用户只需提出需求,剩下的都将由电脑来完成。”
翻译一下:这不是一台电脑,是一个AI助手。它本地就能跑700亿参数的大模型,不需要联网,不需要云服务,所有数据留在本地。
六大PC厂商——戴尔、惠普、联想、华硕、微星、微软Surface——今年秋季会推出30多款笔记本和10款台式机。旗舰型号3499美元。
苹果该紧张了。

02
“1万亿参数,放桌上跑”
RTX Spark是给普通用户的,DGX Station是给硬核玩家的。
GB300 Grace Blackwell Ultra桌面超级芯片,72核Grace CPU,748GB相干统一内存,20 PFLOP FP4算力。配ConnectX-8 SuperNIC,网络速度800Gb/s。还能加一块RTX PRO 6000做光线追踪可视化。
最炸裂的数字:支持运行1万亿参数的AI模型。数百个AI智能体同时执行任务。
1万亿参数,GPT-4级别的模型,放在你桌上跑。不需要机房,不需要冷却塔,不需要Linux运维团队。插上Windows就能用——微软跟英伟达一起做了适配,专门解决了企业AI工作负载从Linux到Windows的鸿沟。
价格呢?4.5万到8.5万美元。对个人来说不便宜,但对任何一家需要在云端租GPU跑推理的公司来说,半年就能回本。
更有意思的是模型侧。英伟达同时扔了Nemotron 3 Ultra:5500亿总参数,混合Mamba-Transformer MoE架构,100万token上下文窗口。比Qwen3.5快5倍,比GPT-OSS快2.2倍,推理成本比竞争对手低30%。而且开源,Apache 2.0许可。
还有Cosmos 3,全球首个开源的物理AI全能模型,把视觉推理、世界生成和动作生成统一到一个模型里。以前做机器人需要三个系统分别处理”看懂世界””想象未来””执行动作”,现在一个模型全干了。
说人话:英伟达不仅在卖算力,它在卖”跑我算力的理由”。
03
“一人+多Agent,多人+多Agent”
算力准备好了,谁来用?
6月1日,字节跳动给出了一个答案。扣子Coze 3.0正式上线,核心只有一句话:多人多Agent协作,开箱即用。
这是两种协作模式。第一种:一人驱动多个Agent。你是主脑,Agent们是手脚。你下一个指令,后端自动拆任务、分角色、并行执行。以前要手动串工作流,现在平台帮你把协作逻辑内化了。
第二种:多人+多Agent。这才是真正的新东西。你的团队成员可以同时操作不同的Agent,Agent之间也能互相调用。多项目独立管理,资产自动沉淀。说白了,AI Agent成了团队里的”数字员工”,有手有脚还有记忆。
这个打法直接对准的不是Dify,不是FastGPT,是企业的协作中台。钉钉、飞书做了人和人的协作,Coze想做人和Agent、Agent和Agent的协作。
Coze 3.0还有一个狠招:支持接入本地Agent。Claude Code、Codex CLI、OpenClaw,这些第三方工具可以直接嵌进Coze的工作流。你在Coze里排工作流,需要写代码了,调Claude Code;需要处理本地文件了,调OpenClaw。全流程在Coze里完成,但算力可以落在本地。
对企业客户来说,这意味着数据不用全部上传云端,合规压力小了很多。

04
“开箱即用的行业专家”
扣子3.0内置了精品行业模板,覆盖五个领域:自媒体、法律、金融、互联网、医疗健康。
这件事的意图很明显:降低门槛。以前你要自己写Prompt、调工作流、接API,现在直接用一个”行业专家技能包”,Agent一起步就是有专业能力的。自媒体Agent懂选题和排版,法律Agent能处理文书,金融Agent能做投研辅助。
从官方描述看,它用的是”专家技能”这个词。我倾向于认为,字节跳动把自己在自媒体(抖音/TikTok生态)、互联网(字节内部工具链)、金融(抖音支付/电商数据)上的积累,封装成了可复用的Agent技能包。这不是通用AI公司能做得到的,需要有真实的行业数据和场景积累。
Coze 3.0支持自由切换主流平台,完成从开发到上线的全流程工作流。手机电脑跨端同步,App端也能推进编程和视频项目。以前要做成一个能用的AI应用,至少要在三四个平台之间跳转。现在Coze想把这一整条链路吃下来。
对开发者来说,省掉的是集成成本。对企业来说,省掉的是多平台采购和运维成本。但反过来想,这也意味着你对Coze的依赖会更深。

05
“从卖芯片到卖操作系统”
把英伟达和Coze的动作放在一起看,一条完整的产业链正在成型。
英伟达的路径是:底层硬件(RTX Spark/DGX Station)→ 中间模型(Nemotron/Cosmos)→ 上层平台(OpenShell/NemoClaw/Dynamo)。从芯片到模型到操作系统,一条线全吃。
字节跳动的路径是:底层Agent框架(Coze 3.0多Agent引擎)→ 中间行业技能包(五大领域模板)→ 上层协作平台(多人多Agent+全平台全流程)。从开发工具到协作中台到行业解决方案,它也想一条线全吃。
两家公司的赛道不同,但逻辑是一样的:不再卖单一产品,而是卖”全套方案”。你用我的芯片,就跑我的模型;你用我的Agent平台,就接入我的行业技能包。
这才是最可怕的地方。AI竞争的上半场是”谁的模型强”,下半场是”谁能把硬件、模型、平台、行业应用全部串起来”。
英伟达在赌全栈算力,字节跳动在赌全栈Agent操作系统。
谁会赢?现在说还早。但方向是清楚的:单点突破的时代结束了,接下来是全产业链的对抗。
AI不再是某一家公司的技术优势,它正在变成一套完整的基础设施。谁先跑通,谁就定义了下一个十年。
关注我,每天带你读懂AI产业的每一个关键变化。
夜雨聆风