
算力界 AI 头条
今日 AI 风向
9 条关键变化,先看懂模型、算力、产品与资本动向。
01黄仁勋从口袋掏出N1X处理器,英伟达正式杀入AI PC赛道
02英伟达宣布Vera Rubin平台全面投产,4万名工程师参与构建
03MiniMax发布M3新旗舰模型,三条科技树同时点满
04英伟达发布Cosmos 3"全能"世界模型,物理AI训练从数月缩至数天
05宇树科技73天闪电过会,即将成为"A股人形机器人第一股"
06清华00后团队万格智元连续完成两轮融资,要解决Agent时代的Token账单焦虑
07OpenAI重启机器人团队,Sam Altman宣布"人人都有自己的机器人"
08GitHub Copilot正式转token计费,GPT-5.5输出价格已高于Claude Opus
09阶跃星辰开源Step 3.7 Flash:198B参数激活仅11B,400 token/s极速推理
黄仁勋从口袋掏出N1X处理器,英伟达正式杀入AI PC赛道
6月2日,英伟达GTC Taipei 2026开幕演讲上,黄仁勋在回顾完过去一年的成绩后,突然把手伸进口袋,掏出了一块面向个人AI电脑的处理器——N1X。英伟达夜盘股价直线拉升近3%,台股纬创、华硕等PC产业链公司集体大涨,联发科涨幅超过5%,A股AI PC概念同步走强。引爆市场情绪的,就是这颗CPU。
英伟达将搭载N1X的RTX Spark定义为"面向个人AI智能体时代的超级芯片"。从架构上看,RTX Spark并非传统CPU,而是一颗集成了Blackwell RTX GPU(6144个CUDA核心、第五代Tensor Core)与20核心Grace CPU的SoC,通过NVLink-C2C互联,CPU部分由联发科参与设计。最高可提供1 Petaflops AI算力,配备128GB统一内存,足以在本地运行1200亿参数、100万Token上下文的大语言模型。搭载RTX Spark的笔记本最薄仅14毫米、重量低至1.36公斤,却能渲染90GB的3D场景、编辑12K视频、运行大模型推理。
黄仁勋说:"过去四十年,人们打开应用、点击菜单、输入命令来工作。有了RTX Spark和Windows,用户只需要提出需求,剩下的交给PC完成。"RTX Spark笔记本和桌面主机将于今年秋季上市,首批合作伙伴包括华硕、戴尔、惠普、联想、微软Surface和微星。这意味着,NVIDIA正式从数据中心AI芯片向个人计算市场扩张,Windows PC主处理器市场将从Intel、AMD双雄争霸,进入Intel、AMD、Qualcomm、NVIDIA四方混战的新格局。(来源:IT时报、云头条)
英伟达宣布Vera Rubin平台全面投产,4万名工程师参与构建
同样在GTC Taipei 2026上,黄仁勋宣布英伟达新一代Vera Rubin平台已全面投产。这不再只是发布会上的路线图,而是进入实际交付阶段。Vera Rubin采用美光、SK海力士和三星三大厂商的HBM高带宽内存,提供机柜级(POD)一体化AI工厂底座,面向Agentic AI、推理、训练和大规模推理工作负载。
从规格来看,单个Vera Rubin NVL72机柜整合72颗Rubin GPU和36颗Vera CPU,使用NVLink 6高速互联,可提供最高3600 PFLOPS的NVFP4推理性能、2520 PFLOPS训练性能,配备20.7TB HBM4显存和1580TB/s显存带宽。此前Dell创始人Michael Dell已宣布首台Dell+NVIDIA Vera Rubin NVL72机柜在CoreWeave完成实机验证,测试结果为PASS。CoreWeave预计成为首批在2026年下半年部署Rubin平台的云服务商。
黄仁勋在演讲中还给出了一个重要判断:"生成式AI已经到来,实用AI已经到来。"他以GitHub代码提交量为例——2023年约3亿次、2024年4亿次、2025年5亿次,2026年前几个月的数据已经接近此前水平的数倍增长。全球约3000万至4000万专业软件工程师正在被AI工具深刻改变工作方式,AI已经从实验室走向真正的生产工具。(来源:AI前线、云头条)
MiniMax发布M3新旗舰模型,三条科技树同时点满
MiniMax启动科创板IPO辅导后,新一代旗舰模型M3也正式登场。M3把前沿Coding能力、100万token超长上下文、原生多模态三条科技树同时点满,MiniMax称这是目前开源模型中唯一能同时做到这三点的。在SWE-Bench Pro上,M3超过了GPT-5.5和Gemini 3.1 Pro,接近Claude Opus 4.7;在面向自主Agent的端到端评测Claw-Eval上拿到了最高分。
为了证明三种能力确实同时在线,MiniMax团队把一篇ICLR 2025获奖论文丢给M3独立复现——论文又长又硬、图文并茂,要看懂曲线图和公式需要多模态能力,论文、代码、实验日志一次性塞进窗口需要长上下文,长线程甚至并发地跑完复现需要编程和Agent能力。结果M3独立跑了接近12小时,成功把论文的核心实验全部跑通。核心技术机制是MiniMax Sparse Attention(MSA),让模型在长上下文里更省算力、更快处理信息。
资本层面,MiniMax已于5月29日向上海证监局提交上市辅导备案报告,与此前已提交A股上市辅导备案的智谱一同冲刺"A股大模型第一股"。在OpenRouter全球AI托管平台上,中国大模型持续占据前列。M3的发布意味着中国AI公司在开源模型领域的能力边界再次拓展——不再是单一能力突出,而是开始在多个维度同时追赶甚至超越闭源模型。(来源:量子位、夕小瑶科技说)
英伟达发布Cosmos 3"全能"世界模型,物理AI训练从数月缩至数天
在GTC Taipei 2026期间,英伟达发布了Cosmos 3——一款基于突破性Transformer混合架构的物理AI世界模型。这是全球首个完全开源的全能模型(Omni-Model),能够以领先的物理精度原生理解和生成文本、图像、视频、环境声音和动作,将物理AI的训练和评估周期从数月缩短到数天。黄仁勋表示:"得益于多模态推理语言、视觉和世界模型的突破,物理AI的爆发式增长指日可待。"
在此之前,Cosmos系列平台均由多个专用模型整合而来,需要跑多个模型才能完成推理、生成、动作的完整流程。Cosmos 3解决了物理AI的一个根本挑战:使机器人和自动驾驶汽车在训练数据有限、仿真堆栈分散的情况下,也能在现实世界稳定工作。在已开源的世界模型中,Cosmos 3的世界生成准确率在Artificial Analysis、Physics-IQ、PAI-Bench和R-Bench测试中均排名第一。
这款模型的发布标志着英伟达在AI基础设施布局上的又一关键落子。从训练芯片(Vera Rubin)到个人计算(RTX Spark/N1X)再到物理AI世界模型(Cosmos 3),英伟达正在构建一个覆盖从云端到终端、从数字世界到物理世界的完整AI生态。对于机器人和自动驾驶领域的开发者来说,Cosmos 3的开源意味着获取高质量世界模型的门槛大幅降低。(来源:财联社AI daily)
宇树科技73天闪电过会,即将成为"A股人形机器人第一股"
6月1日,宇树科技股份有限公司科创板首发申请获通过,从3月20日IPO申请获受理到成功过会仅用时73天,创下科创板"预先审阅"机制落地以来的最快审核纪录,刷新了近年来科创板IPO"闪电上会"速度。此前纪录由摩尔线程保持(88天)。这意味着,这家全球人形机器人出货量第一的企业将正式登陆科创板,成为"A股人形机器人第一股"。
宇树科技创始人王兴兴出生于1990年,本科毕业于浙江理工大学,研究生就读于上海大学。求学阶段他自主研发出四足机器人原型XDog,2016年在杭州创立宇树科技。2023年正式切入人形机器人赛道,发布通用人形机器人H1。截至2025年,宇树四足机器人累计销量超3.3万台,人形机器人年度出货量突破5500台,两项业务市场占有率均居全球首位。招股书显示,2023年至2025年营收分别为1.59亿元、3.92亿元、16.99亿元,2025年扣非净利润5.91亿元,毛利率从44.22%提升至60.27%。
宇树科技的"闪电过会"是2026年以来科创板整体审核提速、制度红利持续释放的集中体现。同期还有长鑫科技、国仪量子、频准激光等多家硬科技企业快速过会。业内人士分析,宇树科技审核速度快的原因:一是"预先审阅"机制下部分审核工作已在正式受理前完成;二是符合科创板重点支持的"硬科技"和"未来产业"方向;三是财务和商业化验证相对清晰——在国内少有的已实现规模化盈利的具身智能企业中,宇树科技走在了最前面。(来源:财联社AI daily、科创板日报)
清华00后团队万格智元连续完成两轮融资,要解决Agent时代的Token账单焦虑
《智能涌现》独家获悉,清华00后团队万格智元近日连续完成两轮五源资本、峰瑞资本参投的数千万元天使轮及天使+轮融资,源合资本担任独家财务顾问。CEO王冠博现博士就读于清华大学计算机系,团队约20人,近90%为00后,多来自清华、北大等院校,也有来自亚马逊、OpenAI、字节跳动的成员。融资将用于产品研发和市场推广。
万格智元要解决的是一个越来越紧迫的问题:随着Claude Code、Codex、OpenClaw等Agent能力爆发,Token需求迎来爆炸式增长,但现有的推理引擎大多关注速度提升而忽略内存消耗。在端侧,芯片厂商推出的内存通常不超过32GB,内存过大使用场景受限。因此厂商的诉求是:在现有内存条件下,让芯片推理更快、搭载的模型更大,且不额外增加硬件成本。万格智元给出了端侧推理引擎的解决方案,让用户实现从"租赁智能"到"拥有智能"的转变。
这个赛道的热度正在急剧升温。近日曝出一家企业在短短1个月内因忘记设置Claude使用额度上限,刷爆5亿美元Token账单。另一名谷歌云用户因API key被滥用,7美元预算的账户一夜收到1.8万美元账单。GitHub Copilot也正式转向按token消耗计费,GPT-5.5每100万token输出价格30美元,已高于Claude Opus 4.7/4.8的25美元。Token成本正在成为AI应用落地的核心瓶颈,谁能解决这个问题,谁就掌握了下一个增长入口。(来源:智能涌现、新智元、夕小瑶科技说)
OpenAI重启机器人团队,Sam Altman宣布"人人都有自己的机器人"
近日,Sam Altman在X平台发文宣布OpenAI Robotics正在招聘全栈硬件、运营、系统及机器学习工程师,目标是"人人都有自己的机器人"。这标志着OpenAI在2023年解散机器人研究团队后,正式重拾机器人梦。此次招聘涵盖从硬件设计到机器学习的完整技术栈,显示出OpenAI对具身智能赛道的战略重视。
OpenAI重返机器人领域并非偶然。随着大语言模型能力的飞速提升,AI从数字世界走向物理世界的条件正在成熟。英伟达在GTC上发布的Cosmos 3世界模型为机器人训练提供了开源基础设施,国内宇树科技人形机器人年出货量突破5500台并即将登陆科创板,整个具身智能赛道正从概念验证进入规模化落地阶段。OpenAI此时入场,既有技术积累的优势,也面临着来自特斯拉Optimus、Figure AI等先发者的竞争压力。
机器人赛道近期热度持续攀升。高盛近期调研了多家中国机器人公司,星海图发布新一代具身智能基础模型G0.5,清华AIR开源UniLab机器人强化学习训练架构,原华为天才少年李一同加盟吉翼智能。从硅谷到中国,AI巨头正在集体涌入机器人赛道。黄仁勋在GTC上也发布了人形机器人参考设计,将英伟达的算力优势延伸到具身智能领域。2026年,机器人正在成为AI下一个爆发点。(来源:夕小瑶科技说、AI提效手册)
GitHub Copilot正式转token计费,GPT-5.5输出价格已高于Claude Opus
即日起,GitHub Copilot开始转向usage-based billing(按用量计费),用户使用不同模型时将根据输入、缓存输入和输出token产生不同费用。GitHub官方价格表显示,GPT-5.5每100万token输入价格为5美元、缓存输入0.5美元、输出30美元;相比之下,Claude Opus 4.7/4.8输入同为5美元、缓存输入0.5美元、输出25美元。也就是说,在Copilot的计费体系内,GPT-5.5的输出价格已经高于Claude Opus 4.7/4.8。
这一转变背后是AI编程工具市场竞争的白热化。据The Information报道,微软计划在本届Build 2026大会(6月2-3日旧金山举行)上展示一批自研AI模型,其中包括面向编程任务的模型,用于增强GitHub Copilot,被视为微软反击Cursor、Claude Code等AI编程工具的重要动作。除编程模型外,微软还在筹划推出覆盖转录、推理、语音和图像等垂直任务的多种参数规格自研大模型。
与此同时,Codex Windows端也正式支持Computer Use功能,可以在Windows应用中识别屏幕内容、点击按钮并输入文字,用于测试、调试和完善本地项目。用户还可以通过ChatGPT手机端或Mac上的Codex远程接管Windows机器上的任务进度。AI编程工具的竞争已经从单纯的模型能力比拼,升级为涵盖计费模式、平台生态、多端协同的系统级战争。(来源:夕小瑶科技说)
阶跃星辰开源Step 3.7 Flash:198B参数激活仅11B,400 token/s极速推理
阶跃星辰近日发布并开源Step 3.7 Flash模型,这是一款专为生产级Agent打造的Flash模型。采用稀疏MoE架构,总参数198B加上1.8B ViT,实际推理时每次仅激活11B参数,原生多模态支持256K上下文,生成速度最高可达400 token/s。以Apache 2.0协议开源,权重可直接下载。
关键评测数据:SWE-Bench Pro(编程Agent评测)56.3%,超过Gemini 3.5 Flash的55.1%;ClawEval(开源Agent框架评测)67.1%,在Flash级模型中排名第一(仅次于真实好用的Claude Opus 4.6的70.8%);SimpleVQA(多模态搜索问答)79.2%,与GPT-5.5的79.1%基本持平。400 token/s的速度意味着人类眨一次眼(约0.3秒)的时间里,模型已经生成了120个token。
这款模型的价值在于:它证明了在极低的推理成本下(11B激活参数),依然可以达到接近顶级闭源模型的能力水平。对于需要高频调用、实时响应的Agent应用场景来说,Step 3.7 Flash提供了一个极具性价比的选择。在OpenRouter全球AI托管平台上,中国大模型凭借极致性价比持续占据前列——小米MiMo、阶跃星辰Step 3.5 Flash、MiniMax、DeepSeek、Kimi等均在榜单之上。"借助中国模型,谁都能用上高性价比的AI服务"正在成为全球开发者的共识。(来源:AGI Hunt、新浪财经)

关于算力界
算力界是一家 AI 战略咨询机构,帮助企业把 AI 落到内容增长、业务流程和长期资产配置三件事上;同时作为香港 SFC Type 4/9 持牌机构,提供 AI 主题资产配置服务。
人AI IP 与 AI 员工,搭建内容增长与岗位 Agent 工作流。
事业务 AI 改造,把 AI 嵌进真实流程,形成可量化的降本增效。
钱AI 主题资产配置,在合规框架下连接产业认知与长期资本配置。
和李菲特交流AI落地
企业 AI 转型 · AI IP · Agent 工作流 · AI 资产配置

扫码添加微信,备注你的业务场景。
夜雨聆风