黄仁勋掏出N1X引爆AI PC;MiniMax M3三线齐开;宇树73天闪电过会|算力界头条

算力界 AI 头条

今日 AI 风向

9 条关键变化，先看懂模型、算力、产品与资本动向。

01黄仁勋从口袋掏出N1X处理器，英伟达正式杀入AI PC赛道

02英伟达宣布Vera Rubin平台全面投产，4万名工程师参与构建

03MiniMax发布M3新旗舰模型，三条科技树同时点满

04英伟达发布Cosmos 3"全能"世界模型，物理AI训练从数月缩至数天

05宇树科技73天闪电过会，即将成为"A股人形机器人第一股"

06清华00后团队万格智元连续完成两轮融资，要解决Agent时代的Token账单焦虑

07OpenAI重启机器人团队，Sam Altman宣布"人人都有自己的机器人"

08GitHub Copilot正式转token计费，GPT-5.5输出价格已高于Claude Opus

09阶跃星辰开源Step 3.7 Flash：198B参数激活仅11B，400 token/s极速推理

黄仁勋从口袋掏出N1X处理器，英伟达正式杀入AI PC赛道

6月2日，英伟达GTC Taipei 2026开幕演讲上，黄仁勋在回顾完过去一年的成绩后，突然把手伸进口袋，掏出了一块面向个人AI电脑的处理器——N1X。英伟达夜盘股价直线拉升近3%，台股纬创、华硕等PC产业链公司集体大涨，联发科涨幅超过5%，A股AI PC概念同步走强。引爆市场情绪的，就是这颗CPU。

英伟达将搭载N1X的RTX Spark定义为"面向个人AI智能体时代的超级芯片"。从架构上看，RTX Spark并非传统CPU，而是一颗集成了Blackwell RTX GPU（6144个CUDA核心、第五代Tensor Core）与20核心Grace CPU的SoC，通过NVLink-C2C互联，CPU部分由联发科参与设计。最高可提供1 Petaflops AI算力，配备128GB统一内存，足以在本地运行1200亿参数、100万Token上下文的大语言模型。搭载RTX Spark的笔记本最薄仅14毫米、重量低至1.36公斤，却能渲染90GB的3D场景、编辑12K视频、运行大模型推理。

黄仁勋说："过去四十年，人们打开应用、点击菜单、输入命令来工作。有了RTX Spark和Windows，用户只需要提出需求，剩下的交给PC完成。"RTX Spark笔记本和桌面主机将于今年秋季上市，首批合作伙伴包括华硕、戴尔、惠普、联想、微软Surface和微星。这意味着，NVIDIA正式从数据中心AI芯片向个人计算市场扩张，Windows PC主处理器市场将从Intel、AMD双雄争霸，进入Intel、AMD、Qualcomm、NVIDIA四方混战的新格局。（来源：IT时报、云头条）

英伟达宣布Vera Rubin平台全面投产，4万名工程师参与构建

同样在GTC Taipei 2026上，黄仁勋宣布英伟达新一代Vera Rubin平台已全面投产。这不再只是发布会上的路线图，而是进入实际交付阶段。Vera Rubin采用美光、SK海力士和三星三大厂商的HBM高带宽内存，提供机柜级（POD）一体化AI工厂底座，面向Agentic AI、推理、训练和大规模推理工作负载。

从规格来看，单个Vera Rubin NVL72机柜整合72颗Rubin GPU和36颗Vera CPU，使用NVLink 6高速互联，可提供最高3600 PFLOPS的NVFP4推理性能、2520 PFLOPS训练性能，配备20.7TB HBM4显存和1580TB/s显存带宽。此前Dell创始人Michael Dell已宣布首台Dell+NVIDIA Vera Rubin NVL72机柜在CoreWeave完成实机验证，测试结果为PASS。CoreWeave预计成为首批在2026年下半年部署Rubin平台的云服务商。

黄仁勋在演讲中还给出了一个重要判断："生成式AI已经到来，实用AI已经到来。"他以GitHub代码提交量为例——2023年约3亿次、2024年4亿次、2025年5亿次，2026年前几个月的数据已经接近此前水平的数倍增长。全球约3000万至4000万专业软件工程师正在被AI工具深刻改变工作方式，AI已经从实验室走向真正的生产工具。（来源：AI前线、云头条）

MiniMax发布M3新旗舰模型，三条科技树同时点满

MiniMax启动科创板IPO辅导后，新一代旗舰模型M3也正式登场。M3把前沿Coding能力、100万token超长上下文、原生多模态三条科技树同时点满，MiniMax称这是目前开源模型中唯一能同时做到这三点的。在SWE-Bench Pro上，M3超过了GPT-5.5和Gemini 3.1 Pro，接近Claude Opus 4.7；在面向自主Agent的端到端评测Claw-Eval上拿到了最高分。

为了证明三种能力确实同时在线，MiniMax团队把一篇ICLR 2025获奖论文丢给M3独立复现——论文又长又硬、图文并茂，要看懂曲线图和公式需要多模态能力，论文、代码、实验日志一次性塞进窗口需要长上下文，长线程甚至并发地跑完复现需要编程和Agent能力。结果M3独立跑了接近12小时，成功把论文的核心实验全部跑通。核心技术机制是MiniMax Sparse Attention（MSA），让模型在长上下文里更省算力、更快处理信息。

资本层面，MiniMax已于5月29日向上海证监局提交上市辅导备案报告，与此前已提交A股上市辅导备案的智谱一同冲刺"A股大模型第一股"。在OpenRouter全球AI托管平台上，中国大模型持续占据前列。M3的发布意味着中国AI公司在开源模型领域的能力边界再次拓展——不再是单一能力突出，而是开始在多个维度同时追赶甚至超越闭源模型。（来源：量子位、夕小瑶科技说）

英伟达发布Cosmos 3"全能"世界模型，物理AI训练从数月缩至数天

在GTC Taipei 2026期间，英伟达发布了Cosmos 3——一款基于突破性Transformer混合架构的物理AI世界模型。这是全球首个完全开源的全能模型（Omni-Model），能够以领先的物理精度原生理解和生成文本、图像、视频、环境声音和动作，将物理AI的训练和评估周期从数月缩短到数天。黄仁勋表示："得益于多模态推理语言、视觉和世界模型的突破，物理AI的爆发式增长指日可待。"

在此之前，Cosmos系列平台均由多个专用模型整合而来，需要跑多个模型才能完成推理、生成、动作的完整流程。Cosmos 3解决了物理AI的一个根本挑战：使机器人和自动驾驶汽车在训练数据有限、仿真堆栈分散的情况下，也能在现实世界稳定工作。在已开源的世界模型中，Cosmos 3的世界生成准确率在Artificial Analysis、Physics-IQ、PAI-Bench和R-Bench测试中均排名第一。

这款模型的发布标志着英伟达在AI基础设施布局上的又一关键落子。从训练芯片（Vera Rubin）到个人计算（RTX Spark/N1X）再到物理AI世界模型（Cosmos 3），英伟达正在构建一个覆盖从云端到终端、从数字世界到物理世界的完整AI生态。对于机器人和自动驾驶领域的开发者来说，Cosmos 3的开源意味着获取高质量世界模型的门槛大幅降低。（来源：财联社AI daily）

宇树科技73天闪电过会，即将成为"A股人形机器人第一股"

6月1日，宇树科技股份有限公司科创板首发申请获通过，从3月20日IPO申请获受理到成功过会仅用时73天，创下科创板"预先审阅"机制落地以来的最快审核纪录，刷新了近年来科创板IPO"闪电上会"速度。此前纪录由摩尔线程保持（88天）。这意味着，这家全球人形机器人出货量第一的企业将正式登陆科创板，成为"A股人形机器人第一股"。

宇树科技创始人王兴兴出生于1990年，本科毕业于浙江理工大学，研究生就读于上海大学。求学阶段他自主研发出四足机器人原型XDog，2016年在杭州创立宇树科技。2023年正式切入人形机器人赛道，发布通用人形机器人H1。截至2025年，宇树四足机器人累计销量超3.3万台，人形机器人年度出货量突破5500台，两项业务市场占有率均居全球首位。招股书显示，2023年至2025年营收分别为1.59亿元、3.92亿元、16.99亿元，2025年扣非净利润5.91亿元，毛利率从44.22%提升至60.27%。

宇树科技的"闪电过会"是2026年以来科创板整体审核提速、制度红利持续释放的集中体现。同期还有长鑫科技、国仪量子、频准激光等多家硬科技企业快速过会。业内人士分析，宇树科技审核速度快的原因：一是"预先审阅"机制下部分审核工作已在正式受理前完成；二是符合科创板重点支持的"硬科技"和"未来产业"方向；三是财务和商业化验证相对清晰——在国内少有的已实现规模化盈利的具身智能企业中，宇树科技走在了最前面。（来源：财联社AI daily、科创板日报）

清华00后团队万格智元连续完成两轮融资，要解决Agent时代的Token账单焦虑

《智能涌现》独家获悉，清华00后团队万格智元近日连续完成两轮五源资本、峰瑞资本参投的数千万元天使轮及天使+轮融资，源合资本担任独家财务顾问。CEO王冠博现博士就读于清华大学计算机系，团队约20人，近90%为00后，多来自清华、北大等院校，也有来自亚马逊、OpenAI、字节跳动的成员。融资将用于产品研发和市场推广。

万格智元要解决的是一个越来越紧迫的问题：随着Claude Code、Codex、OpenClaw等Agent能力爆发，Token需求迎来爆炸式增长，但现有的推理引擎大多关注速度提升而忽略内存消耗。在端侧，芯片厂商推出的内存通常不超过32GB，内存过大使用场景受限。因此厂商的诉求是：在现有内存条件下，让芯片推理更快、搭载的模型更大，且不额外增加硬件成本。万格智元给出了端侧推理引擎的解决方案，让用户实现从"租赁智能"到"拥有智能"的转变。

这个赛道的热度正在急剧升温。近日曝出一家企业在短短1个月内因忘记设置Claude使用额度上限，刷爆5亿美元Token账单。另一名谷歌云用户因API key被滥用，7美元预算的账户一夜收到1.8万美元账单。GitHub Copilot也正式转向按token消耗计费，GPT-5.5每100万token输出价格30美元，已高于Claude Opus 4.7/4.8的25美元。Token成本正在成为AI应用落地的核心瓶颈，谁能解决这个问题，谁就掌握了下一个增长入口。（来源：智能涌现、新智元、夕小瑶科技说）

OpenAI重启机器人团队，Sam Altman宣布"人人都有自己的机器人"

近日，Sam Altman在X平台发文宣布OpenAI Robotics正在招聘全栈硬件、运营、系统及机器学习工程师，目标是"人人都有自己的机器人"。这标志着OpenAI在2023年解散机器人研究团队后，正式重拾机器人梦。此次招聘涵盖从硬件设计到机器学习的完整技术栈，显示出OpenAI对具身智能赛道的战略重视。

OpenAI重返机器人领域并非偶然。随着大语言模型能力的飞速提升，AI从数字世界走向物理世界的条件正在成熟。英伟达在GTC上发布的Cosmos 3世界模型为机器人训练提供了开源基础设施，国内宇树科技人形机器人年出货量突破5500台并即将登陆科创板，整个具身智能赛道正从概念验证进入规模化落地阶段。OpenAI此时入场，既有技术积累的优势，也面临着来自特斯拉Optimus、Figure AI等先发者的竞争压力。

机器人赛道近期热度持续攀升。高盛近期调研了多家中国机器人公司，星海图发布新一代具身智能基础模型G0.5，清华AIR开源UniLab机器人强化学习训练架构，原华为天才少年李一同加盟吉翼智能。从硅谷到中国，AI巨头正在集体涌入机器人赛道。黄仁勋在GTC上也发布了人形机器人参考设计，将英伟达的算力优势延伸到具身智能领域。2026年，机器人正在成为AI下一个爆发点。（来源：夕小瑶科技说、AI提效手册）

GitHub Copilot正式转token计费，GPT-5.5输出价格已高于Claude Opus

即日起，GitHub Copilot开始转向usage-based billing（按用量计费），用户使用不同模型时将根据输入、缓存输入和输出token产生不同费用。GitHub官方价格表显示，GPT-5.5每100万token输入价格为5美元、缓存输入0.5美元、输出30美元；相比之下，Claude Opus 4.7/4.8输入同为5美元、缓存输入0.5美元、输出25美元。也就是说，在Copilot的计费体系内，GPT-5.5的输出价格已经高于Claude Opus 4.7/4.8。

这一转变背后是AI编程工具市场竞争的白热化。据The Information报道，微软计划在本届Build 2026大会（6月2-3日旧金山举行）上展示一批自研AI模型，其中包括面向编程任务的模型，用于增强GitHub Copilot，被视为微软反击Cursor、Claude Code等AI编程工具的重要动作。除编程模型外，微软还在筹划推出覆盖转录、推理、语音和图像等垂直任务的多种参数规格自研大模型。

与此同时，Codex Windows端也正式支持Computer Use功能，可以在Windows应用中识别屏幕内容、点击按钮并输入文字，用于测试、调试和完善本地项目。用户还可以通过ChatGPT手机端或Mac上的Codex远程接管Windows机器上的任务进度。AI编程工具的竞争已经从单纯的模型能力比拼，升级为涵盖计费模式、平台生态、多端协同的系统级战争。（来源：夕小瑶科技说）

阶跃星辰开源Step 3.7 Flash：198B参数激活仅11B，400 token/s极速推理

阶跃星辰近日发布并开源Step 3.7 Flash模型，这是一款专为生产级Agent打造的Flash模型。采用稀疏MoE架构，总参数198B加上1.8B ViT，实际推理时每次仅激活11B参数，原生多模态支持256K上下文，生成速度最高可达400 token/s。以Apache 2.0协议开源，权重可直接下载。

关键评测数据：SWE-Bench Pro（编程Agent评测）56.3%，超过Gemini 3.5 Flash的55.1%；ClawEval（开源Agent框架评测）67.1%，在Flash级模型中排名第一（仅次于真实好用的Claude Opus 4.6的70.8%）；SimpleVQA（多模态搜索问答）79.2%，与GPT-5.5的79.1%基本持平。400 token/s的速度意味着人类眨一次眼（约0.3秒）的时间里，模型已经生成了120个token。

这款模型的价值在于：它证明了在极低的推理成本下（11B激活参数），依然可以达到接近顶级闭源模型的能力水平。对于需要高频调用、实时响应的Agent应用场景来说，Step 3.7 Flash提供了一个极具性价比的选择。在OpenRouter全球AI托管平台上，中国大模型凭借极致性价比持续占据前列——小米MiMo、阶跃星辰Step 3.5 Flash、MiniMax、DeepSeek、Kimi等均在榜单之上。"借助中国模型，谁都能用上高性价比的AI服务"正在成为全球开发者的共识。（来源：AGI Hunt、新浪财经）

关于算力界

算力界是一家 AI 战略咨询机构，帮助企业把 AI 落到内容增长、业务流程和长期资产配置三件事上；同时作为香港 SFC Type 4/9 持牌机构，提供 AI 主题资产配置服务。

人AI IP 与 AI 员工，搭建内容增长与岗位 Agent 工作流。

事业务 AI 改造，把 AI 嵌进真实流程，形成可量化的降本增效。

钱AI 主题资产配置，在合规框架下连接产业认知与长期资本配置。

和李菲特交流AI落地

企业 AI 转型 · AI IP · Agent 工作流 · AI 资产配置