AI内参|NVIDIA闯PC芯片大战Intel,华为发半导体新定律,Vera CPU交到Anthropic手中
2026-06-01 · 第 23 周
5 月 29 日,Microsoft 和 NVIDIA 在 X/Twitter 上同步发布"a new era of PC"预热消息,GPS 坐标指向台北音乐中心。6 月 1 日上午 11 时,NVIDIA CEO 黄仁勋在 Computex 2026 开幕式上正式发布了 N1X SoC——这是 NVIDIA 首款面向 Windows PC 的 Arm 架构处理器,标志着这家市值 $5.1 万亿的 GPU 巨头正式杀入 Intel、AMD 和 Qualcomm 把持的 PC CPU 市场。
🛠️ 技术生态
◆ NVIDIA N1X 正式亮相 Computex:20 核 Arm CPU + 6,144 CUDA 核心,全面冲击 PC 处理器市场
5 月 29 日,Microsoft 和 NVIDIA 在 X/Twitter 上同步发布"a new era of PC"预热消息,GPS 坐标指向台北音乐中心。6 月 1 日上午 11 时,NVIDIA CEO 黄仁勋在 Computex 2026 开幕式上正式发布了 N1X SoC——这是 NVIDIA 首款面向 Windows PC 的 Arm 架构处理器,标志着这家市值 $5.1 万亿的 GPU 巨头正式杀入 Intel、AMD 和 Qualcomm 把持的 PC CPU 市场。
技术规格:N1X 集成了 20 个 Arm v9.2 CPU 核心(10×10 双簇设计)和 6,144 个 CUDA 核心,基于 NVIDIA Blackwell GPU 架构,支持最高 128GB LPDDR5X 统一内存。媒体估计其图形性能可达到 RTX 5070 级别,同时凭借 Arm 架构实现远低于 x86 竞争对手的功耗。N1X 被定位为直接对标 Apple M5 Pro 和 Qualcomm Snapdragon X2 Elite。
首发 OEM:Microsoft Surface 品牌和 Dell 被确认为首批出货厂商。Dell 据报有已预约的 XPS 系列 N1X 机型,计划配合 Computex 发布。Tom's Hardware 指出,N1X 使用统一内存池(CPU 与 GPU 共享 LPDDR5X),GPU 带宽约 273 GB/s——低于独立显存笔记本,但在能效上有显著优势。
软件生态挑战:业内人士此前报告称,N1X 的 Windows 适配"是一场噩梦",涉及大量驱动程序兼容性修复。但 Computex 的正式发布表明这些问题已取得实质性进展。Tom's Guide 评论称,N1X 的成败将不取决于硬件性能——NVIDIA 在硬件上已经证明了自己——而取决于 Windows on Arm 的应用生态成熟度。同时发布低端的 N1(12 核 CPU,面向主流市场)进一步扩大了产品覆盖面。
行业意义:这是自 2020 年 Apple 推出 M1 芯片以来 PC 处理器市场最重大的格局变化。NVIDIA 加入 Arm PC 阵营,意味着 x86 体系将面临来自两个方向的冲击——Apple 在高端、NVIDIA + Microsoft 在中高端。对于 AI PC 市场,N1X 将 Blackwell GPU 直接集成在 SoC 中意味着端侧 AI 推理能力将远超当前任何 x86 竞争对手。2026 年下半年将迎来 Rubin 平台大规模出货和 N1X PC 上市的双重产品浪潮。
https://www.tomshardware.com/laptops/nvidia-and-microsoft-tease-a-new-era-of-pc-ahead-of-computex-2026-coordinated-social-media-posts-could-indicate-that-rumored-n1x-laptops-will-be-windows-on-arm-systems
https://www.tomsguide.com/computing/cpus/nvidia-n1x-cpu-everything-we-know-so-far
https://www.techtimes.com/articles/317428/20260530/nvidia-arm-laptop-chip-n1x-confirmed-computex-cuda-rtx-5070-gpu-onboard.htm
https://www.msn.com/en-us/news/insight/nvidia-and-microsoft-set-to-unveil-arm-based-n1x-pcs-at-computex
https://www.xda-developers.com/mere-days-before-computex-2026-information-on-the-nvidia-n1-chip-leaked-online
https://en.gamegpu.com/news/zhelezo/nvidia-i-microsoft-gotovyat-anons-protsessora-n1x-na-computex-2026
◆ NVIDIA Vera CPU 首度交付:88 核定制处理器专为 Agentic AI 时代设计
5 月 30 日,NVIDIA 副总裁 Ian Buck 亲自将首批 Vera CPU 系统交到了 Anthropic 旧金山 SoMa 办公室、OpenAI Mission Bay 园区、SpaceXAI Palo 办公室以及 Oracle Cloud Infrastructure 手中。这是 NVIDIA 首款定制 CPU,也是"Agentic AI 工厂"概念从公告走向生产的关键节点。
技术参数:Vera CPU 采用 88 个自定义 Olympus 核心,是 Grace CPU(72 核)的继任者。单核性能较 Grace 提升 50%。Vera 是业界首款使用 LPDDR5X 内存的数据中心 CPU,提供 1.2 TB/s 内存带宽——远超传统 DDR5 服务器内存。作为对比,当前主流服务器 CPU 的内存带宽通常在 500-700 GB/s 级别。
Agentic AI 定位:NVIDIA 明确将 Vera 定义为"Agentic AI 时代的第一颗 CPU"。Ian Buck 在交付时表示:"Agentic AI 正在创造 AI 工厂中的新 CPU 时刻——当模型从'回答问题'转向'执行任务'时,Vera 就是为了让这种大规模工作持续运转而设计的。"Vera 的 88 核设计特别适合 Agent 工作负载中的长上下文检索、并行任务调度和实时推理编排——这些正是现代 AI Agent 系统的核心瓶颈。
部署计划:Oracle Cloud Infrastructure 被 NVIDIA 称为"首个在超大规模部署 Vera 的云服务商",计划 2026 年起部署数十万颗 Vera CPU。Vera 也是 Vera Rubin NVL72 超级计算机的宿主 CPU,通过第二代 NVLink-C2C 互联连接两颗 Rubin GPU。SpaceXAI 正在评估将 Vera 用于强化学习和基于 Agent 的仿真训练。
行业意义:Vera 的交付标志着 NVIDIA 在 GPU 之外开辟了一条独立的 CPU 产品线——而且这条产品线不是用于通用计算,而是专门为 Agentic AI 优化的。在 AI 推理负载中,CPU 承担的任务编排、上下文管理和 I/O 调度正在成为瓶颈。Vera 的 88 核 + 1.2 TB/s 带宽直面这一瓶颈。Anthropic 和 OpenAI 作为首批客户,也说明了前沿模型公司对专用 CPU 基础设施的迫切需求。
https://blogs.nvidia.com/blog/vera-cpu-delivery
https://www.pcmag.com/news/nvidia-exec-hand-delivers-first-vera-cpu-systems-to-ai-heavy-hitters
https://finance.yahoo.com/sectors/technology/articles/nvidia-delivers-next-gen-vera-150358500.html
https://www.tweaktown.com/news/111686/nvidia-hand-delivers-the-first-vera-cpu-systems-to-anthropic-openai-spacexai-and-more/index.html
https://www.linkedin.com/posts/nvidia_vera-cpu-delivery-activity-7462260051433660416-pN7Q
◆ OpenRouter 完成 $113M B 轮融资:AI 模型交换枢纽估值达 $13 亿
5 月 26 日,AI 模型聚合平台 OpenRouter 宣布完成 $1.13 亿(1.13 亿美元) Series B 轮融资,估值达到 $13 亿(13 亿美元)。本轮由 Alphabet 旗下独立增长基金 CapitalG 领投,NVIDIA 的风险投资部门 NVentures、ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Ventures 以及现有投资者 a16z 和 Menlo Ventures 参与跟投。
增长数据:OpenRouter 当前每周处理 25 万亿(25T)tokens,覆盖 400 多种 AI 模型,全球用户超过 800 万。其年化推理支出从 2024 年 10 月的 $1000 万增长到 2025 年 5 月的 $1 亿以上——半年 10 倍增长。平台已从纯文本扩展到多模态推理,支持图像、音频、语音、转录、嵌入和视频模型。
战略投资者阵容解读:本轮投资者名单几乎覆盖了整个 AI 基础设施生态——CapitalG(Alphabet/Google 云)、NVentures(NVIDIA 硬件)、ServiceNow(企业 AI 代理)、MongoDB/Snowflake/Databricks(数据基础设施)。这种"全栈"投资阵容表明,OpenRouter 将接口标准化和模型路由优化的定位被视为 AI 基础设施中的关键"中间层"。
竞争与定位:OpenRouter 的独特价值在于模型中立——它不绑定任何单一模型提供商,而是充当"AI 模型交易所",让开发者通过一个 API 访问所有主流模型。在模型价格战(GPT-5.5 降价、DeepSeek V4-Pro 永久降价 75%)和市场碎片化的背景下,这种聚合层的价值正在快速放大。
https://openrouter.ai/announcements/series-b
https://www.businesswire.com/news/home/20260526953416/en/OpenRouter-Raises-%24113-Million-CapitalG-led-Series-B-as-Weekly-Volume-Explodes-to-25T-Tokens
https://www.kucoin.com/blog/OpenRouter-raises-113m-series-b-as-valuation-hits-billions
https://www.startuphub.ai/investment_rounds/openrouter-series-b-2026
🏢 大厂动态
◆ MiniMax 启动 A 股上市辅导:"AI 大模型六小虎"加速 A+H 双平台布局
5 月 30 日,中国证监会官网披露,通用人工智能公司 MiniMax 已于 5 月 29 日与中信证券签署首次公开发行股票并上市辅导备案报告,正式启动 A 股 IPO 进程。MiniMax 将冲刺 A+H 双上市平台——该公司于 2026 年 1 月登陆港交所,从成立到 IPO 仅用时约四年半,创下全球 AI 公司最快上市纪录。
财务数据:MiniMax 2025 年全年总收入 7903.8 万美元(约 5.7 亿人民币),同比增长 158.9%,毛利率提升至 25.4%。其中超过 73% 的收入来自海外市场。经调整净亏损 2.5 亿美元,较上年大幅收窄。公司在过去两个月实现了 年化经常性收入(ARR)翻倍,翻番周期压缩至 60 天,增速对标全球 AI 公司同期最快档。
商业化里程碑:MiniMax 当前服务全球超过 100 万企业和开发者客户,较半年前增长 5 倍;全球用户规模约 3 亿。公司已从"技术公司"向"平台型 AI 基础设施服务商"转型,AI 原生产品与企业服务贡献比例各约一半。公司 M2.7 模型发布后吸引了大量用户,推动 ARR 超出此前预测。
"六小虎"会师 A 股:MiniMax 启动 A 股辅导后,"AI 大模型六小虎"中已有 两家(MiniMax 与智谱) 推进 A+H 双平台布局。智谱于 2026 年 2 月签署 A 股辅导协议,比 MiniMax 早约三个月。两者均于 2026 年 1 月在港交所上市,智谱挂牌时间早于 MiniMax 一天。MiniMax 港股首日大涨 109%,当前股价 840 港元,市值 2635 亿港元(约 340 亿美元)。MINIMAX-W 于 5 月 22 日获纳入恒生科技指数,6 月 8 日生效。
https://www.cnr.cn/newscenter/native/gd/20260530/t20260530_527641377.shtml
https://www.jfdaily.com/news/detail?id=1120552
https://www.bbtnews.com.cn/2026/0530/594830.shtml
https://finance.sina.com.cn/stock/bxjj/2026-05-30/doc-inhzswye6924234.shtml
https://c.m.163.com/news/a/KU6MFOQB0519814N.html
https://money.udn.com/money/story/5604/9535557
◆ 华为发表"韬定律":以时间缩微替代几何缩微,2031 年达等效 1.4nm 制程
5 月 25 日,在上海举行的 IEEE 国际电路与系统研讨会(ISCAS 2026)上,华为公司董事、半导体业务部总裁何庭波发表题为《半导体新路径探索与实践》的主旨演讲,正式发布 "韬(τ)定律"。这是中国企业首次在全球半导体领域提出指导产业发展的全新原则。
核心思想——时间缩微:传统摩尔定律遵循"几何缩微"——不断缩小晶体管的物理尺寸。韬定律提出以 "时间缩微"替代"几何缩微",目标是通过系统性降低时间常数 τ(信号在电路中传播的耗时),持续压缩信号传播时延,从而实现晶体管密度和系统性能的同步提升。韬定律构建了贯穿器件、电路、芯片到系统层面的多层级协同优化体系。何庭波解释,摩尔定律的本质也是"压缩时间",几何缩微只是手段——韬定律直接将"缩短 τ"确立为终极目标,完成了从"结果导向"到"目标导向"的范式转换。
创新技术——逻辑折叠:韬定律的关键实现技术是 逻辑折叠(logic folding)——将芯片电路"竖起来",通过 3D 堆叠和高密度互连来突破平面晶体管的物理极限。这直接要求高深宽比(>60:1)的硅通孔刻蚀和精密薄膜沉积工艺。北方华创、中微公司、拓荆科技等国产设备厂商在刻蚀和薄膜沉积领域已有积累,韬定律的推广可能直接带动国产先进封装产业链的爆发。
已量产成果:华为基于韬定律在过去六年中已成功设计并量产了 381 款芯片。2026 年秋季即将发布的麒麟 2026 手机芯片将成为逻辑折叠技术的首次成功实施,大幅提升相关性能指标。何庭波预计,到 2031 年,基于韬定律的高端芯片晶体管密度将达到 1.4 纳米制程的同等水平。华为计划未来十年持续走向全面折叠,发展更多层的折叠技术。
行业意义:韬定律的发布是中国半导体产业从"追赶"到"提出规则"的标志性事件。在美国对华先进制程设备出口限制的背景下,韬定律提供了一条不依赖极紫外光刻(EUV)设备的替代道路——通过系统级优化和 3D 堆叠实现等效先进制程性能。这不是在现有赛道上追赶台积电和三星,而是在开辟一条新赛道。受此消息影响,A 股华为盘古概念板块全线走高,梅安森涨停、云鼎科技涨停。
https://finance.sina.com.cn/tech/discovery/2026-05-25/doc-inhzamvs3714846.shtml
https://www.eet-china.com/mp/a497902.html
https://www.eet-china.com/mp/a497509.html
https://www.reddit.com/r/China_irl/comments/1tmvrio/华为称半导体技术取得突破_预计2031年生产14纳米芯片
https://www.instagram.com/p/DYwxikzDyil
📍 论文解读
◆ Qwen-VLA:统一视觉-语言-动作的具身基础模型,LIBERO 基准达 97.9%
arXiv:2605.30280 · https://arxiv.org/abs/2605.30280
https://huggingface.co/papers/2605.30280
https://github.com/QwenLM/Qwen-VLA
研究背景:具身智能领域长期面临一个碎片化困境:操作(manipulation)、导航(navigation)、轨迹预测(trajectory prediction)等任务各自有独立的模型、数据集和评估基准。学术界习惯为每个任务训练"技能专家"(skill specialist),在特定基准上取得高分数,但这些模型无法跨任务、跨平台、跨环境泛化。视觉-语言-动作(VLA)模型试图解决这一问题,但现有方案(如 RT-2、π0)存在明显的离散化瓶颈——将连续动作信号离散化为 token,损失了高频控制精度。
核心方案:由 Qwen 团队(阿里通义千问) 主导、约 40 人研究团队开发的 Qwen-VLA,基于 Qwen3.5-4B 视觉-语言骨干网络,搭配一个 1.15B 参数的 DiT(Diffusion Transformer)流匹配动作解码器,实现了从感知、理解、推理到连续动作生成的端到端统一。Qwen-VLA 将操作、导航和轨迹预测统一为共享的"动作-轨迹预测框架"——一个模型、一次训练,在所有任务上同时评估。
技术创新:
- DiT 动作解码器:使用扩散 Transformer 架构直接生成连续动作,而非离散化 token——彻底解决了 RT-2 等方法的离散化精度损失问题,允许高频、平滑的机器人控制指令
- 具身感知提示(Embodiment-Aware Prompt Conditioning):通过机器人特定的文本描述指定当前本体类型和控制约定,无需为每种机器人训练独立的模型权重
- 异构训练数据:训练数据涵盖机器人操作轨迹、人类第一人称演示、合成仿真数据、视觉-语言-导航数据、轨迹监督数据和辅助视觉-语言数据——一个模型从跨模态、跨平台的数据中统一学习
关键指标:
- 在 LIBERO 机器人操作基准上达到 97.9% 成功率
- 在 ALOHA 双臂操作平台上,作为统一通用模型的表现 匹配或超越专门为单个任务微调的专业模型(GR00T N1.6、π0.5)
- 在跨本体泛化(从仿真到真实机器人、不同机械臂构型之间的零样本迁移)上表现出有意义的零样本性能
- 同时支持操作、导航和轨迹预测三大类任务
行业意义:Qwen-VLA 回答了具身智能领域一个根本性问题:是否需要为每个任务、每种机器人独立训练模型?答案是"不需要"。Qwen-VLA 证明,一个统一模型可以同时学会抓取杯子、规划导航路径和预测运动轨迹——关键在于将动作生成从"离散分类"改为"连续扩散"。这对于机器人基础模型的规模扩展路径具有范式意义。Qwen 团队在 CVPR 2026 上展示了这项成果,并已将模型和代码开源。
https://www.teahose.com/paper/arXiv%20Physical%20AI/Qwen-VLA
https://digg.com/ai/k41gmxv9
标签:
#AI日报#NVIDIA#N1X#Computex2026#ArmPC#VeraCPU#AgenticAI#OpenRouter#AIModelExchange#CapitalG#MiniMax#A股IPO#AH股#华为#韬定律#逻辑折叠#1.4nm#半导体#QwenVLA#具身智能#VLA#机器人#阿里AI 内参 · 每日 AI 动态跟踪
夜雨聆风