AI内参|NVIDIA闯PC芯片大战Intel,华为发半导体新定律,Vera CPU交到Anthropic手中

AI内参｜NVIDIA闯PC芯片大战Intel，华为发半导体新定律，Vera CPU交到Anthropic手中

2026-06-01 · 第 23 周

5 月 29 日，Microsoft 和 NVIDIA 在 X/Twitter 上同步发布"a new era of PC"预热消息，GPS 坐标指向台北音乐中心。6 月 1 日上午 11 时，NVIDIA CEO 黄仁勋在 Computex 2026 开幕式上正式发布了 N1X SoC——这是 NVIDIA 首款面向 Windows PC 的 Arm 架构处理器，标志着这家市值 $5.1 万亿的 GPU 巨头正式杀入 Intel、AMD 和 Qualcomm 把持的 PC CPU 市场。

🛠️ 技术生态

◆ NVIDIA N1X 正式亮相 Computex：20 核 Arm CPU + 6,144 CUDA 核心，全面冲击 PC 处理器市场

技术规格：N1X 集成了 20 个 Arm v9.2 CPU 核心（10×10 双簇设计）和 6,144 个 CUDA 核心，基于 NVIDIA Blackwell GPU 架构，支持最高 128GB LPDDR5X 统一内存。媒体估计其图形性能可达到 RTX 5070 级别，同时凭借 Arm 架构实现远低于 x86 竞争对手的功耗。N1X 被定位为直接对标 Apple M5 Pro 和 Qualcomm Snapdragon X2 Elite。

首发 OEM：Microsoft Surface 品牌和 Dell 被确认为首批出货厂商。Dell 据报有已预约的 XPS 系列 N1X 机型，计划配合 Computex 发布。Tom's Hardware 指出，N1X 使用统一内存池（CPU 与 GPU 共享 LPDDR5X），GPU 带宽约 273 GB/s——低于独立显存笔记本，但在能效上有显著优势。

软件生态挑战：业内人士此前报告称，N1X 的 Windows 适配"是一场噩梦"，涉及大量驱动程序兼容性修复。但 Computex 的正式发布表明这些问题已取得实质性进展。Tom's Guide 评论称，N1X 的成败将不取决于硬件性能——NVIDIA 在硬件上已经证明了自己——而取决于 Windows on Arm 的应用生态成熟度。同时发布低端的 N1（12 核 CPU，面向主流市场）进一步扩大了产品覆盖面。

行业意义：这是自 2020 年 Apple 推出 M1 芯片以来 PC 处理器市场最重大的格局变化。NVIDIA 加入 Arm PC 阵营，意味着 x86 体系将面临来自两个方向的冲击——Apple 在高端、NVIDIA + Microsoft 在中高端。对于 AI PC 市场，N1X 将 Blackwell GPU 直接集成在 SoC 中意味着端侧 AI 推理能力将远超当前任何 x86 竞争对手。2026 年下半年将迎来 Rubin 平台大规模出货和 N1X PC 上市的双重产品浪潮。

https://www.tomshardware.com/laptops/nvidia-and-microsoft-tease-a-new-era-of-pc-ahead-of-computex-2026-coordinated-social-media-posts-could-indicate-that-rumored-n1x-laptops-will-be-windows-on-arm-systems

https://www.tomsguide.com/computing/cpus/nvidia-n1x-cpu-everything-we-know-so-far

https://www.techtimes.com/articles/317428/20260530/nvidia-arm-laptop-chip-n1x-confirmed-computex-cuda-rtx-5070-gpu-onboard.htm

https://www.msn.com/en-us/news/insight/nvidia-and-microsoft-set-to-unveil-arm-based-n1x-pcs-at-computex

https://www.xda-developers.com/mere-days-before-computex-2026-information-on-the-nvidia-n1-chip-leaked-online

https://en.gamegpu.com/news/zhelezo/nvidia-i-microsoft-gotovyat-anons-protsessora-n1x-na-computex-2026

◆ NVIDIA Vera CPU 首度交付：88 核定制处理器专为 Agentic AI 时代设计

5 月 30 日，NVIDIA 副总裁 Ian Buck 亲自将首批 Vera CPU 系统交到了 Anthropic 旧金山 SoMa 办公室、OpenAI Mission Bay 园区、SpaceXAI Palo 办公室以及 Oracle Cloud Infrastructure 手中。这是 NVIDIA 首款定制 CPU，也是"Agentic AI 工厂"概念从公告走向生产的关键节点。

技术参数：Vera CPU 采用 88 个自定义 Olympus 核心，是 Grace CPU（72 核）的继任者。单核性能较 Grace 提升 50%。Vera 是业界首款使用 LPDDR5X 内存的数据中心 CPU，提供 1.2 TB/s 内存带宽——远超传统 DDR5 服务器内存。作为对比，当前主流服务器 CPU 的内存带宽通常在 500-700 GB/s 级别。

Agentic AI 定位：NVIDIA 明确将 Vera 定义为"Agentic AI 时代的第一颗 CPU"。Ian Buck 在交付时表示："Agentic AI 正在创造 AI 工厂中的新 CPU 时刻——当模型从'回答问题'转向'执行任务'时，Vera 就是为了让这种大规模工作持续运转而设计的。"Vera 的 88 核设计特别适合 Agent 工作负载中的长上下文检索、并行任务调度和实时推理编排——这些正是现代 AI Agent 系统的核心瓶颈。

部署计划：Oracle Cloud Infrastructure 被 NVIDIA 称为"首个在超大规模部署 Vera 的云服务商"，计划 2026 年起部署数十万颗 Vera CPU。Vera 也是 Vera Rubin NVL72 超级计算机的宿主 CPU，通过第二代 NVLink-C2C 互联连接两颗 Rubin GPU。SpaceXAI 正在评估将 Vera 用于强化学习和基于 Agent 的仿真训练。

行业意义：Vera 的交付标志着 NVIDIA 在 GPU 之外开辟了一条独立的 CPU 产品线——而且这条产品线不是用于通用计算，而是专门为 Agentic AI 优化的。在 AI 推理负载中，CPU 承担的任务编排、上下文管理和 I/O 调度正在成为瓶颈。Vera 的 88 核 + 1.2 TB/s 带宽直面这一瓶颈。Anthropic 和 OpenAI 作为首批客户，也说明了前沿模型公司对专用 CPU 基础设施的迫切需求。

https://blogs.nvidia.com/blog/vera-cpu-delivery

https://www.pcmag.com/news/nvidia-exec-hand-delivers-first-vera-cpu-systems-to-ai-heavy-hitters

https://finance.yahoo.com/sectors/technology/articles/nvidia-delivers-next-gen-vera-150358500.html

https://www.tweaktown.com/news/111686/nvidia-hand-delivers-the-first-vera-cpu-systems-to-anthropic-openai-spacexai-and-more/index.html

https://www.linkedin.com/posts/nvidia_vera-cpu-delivery-activity-7462260051433660416-pN7Q

◆ OpenRouter 完成 $113M B 轮融资：AI 模型交换枢纽估值达 $13 亿

5 月 26 日，AI 模型聚合平台 OpenRouter 宣布完成 $1.13 亿（1.13 亿美元） Series B 轮融资，估值达到 $13 亿（13 亿美元）。本轮由 Alphabet 旗下独立增长基金 CapitalG 领投，NVIDIA 的风险投资部门 NVentures、ServiceNow Ventures、MongoDB Ventures、Snowflake Ventures、Databricks Ventures 以及现有投资者 a16z 和 Menlo Ventures 参与跟投。

增长数据：OpenRouter 当前每周处理 25 万亿（25T）tokens，覆盖 400 多种 AI 模型，全球用户超过 800 万。其年化推理支出从 2024 年 10 月的 $1000 万增长到 2025 年 5 月的 $1 亿以上——半年 10 倍增长。平台已从纯文本扩展到多模态推理，支持图像、音频、语音、转录、嵌入和视频模型。

战略投资者阵容解读：本轮投资者名单几乎覆盖了整个 AI 基础设施生态——CapitalG（Alphabet/Google 云）、NVentures（NVIDIA 硬件）、ServiceNow（企业 AI 代理）、MongoDB/Snowflake/Databricks（数据基础设施）。这种"全栈"投资阵容表明，OpenRouter 将接口标准化和模型路由优化的定位被视为 AI 基础设施中的关键"中间层"。

竞争与定位：OpenRouter 的独特价值在于模型中立——它不绑定任何单一模型提供商，而是充当"AI 模型交易所"，让开发者通过一个 API 访问所有主流模型。在模型价格战（GPT-5.5 降价、DeepSeek V4-Pro 永久降价 75%）和市场碎片化的背景下，这种聚合层的价值正在快速放大。

https://openrouter.ai/announcements/series-b

https://www.businesswire.com/news/home/20260526953416/en/OpenRouter-Raises-%24113-Million-CapitalG-led-Series-B-as-Weekly-Volume-Explodes-to-25T-Tokens

https://www.kucoin.com/blog/OpenRouter-raises-113m-series-b-as-valuation-hits-billions

https://www.startuphub.ai/investment_rounds/openrouter-series-b-2026

🏢 大厂动态

◆ MiniMax 启动 A 股上市辅导："AI 大模型六小虎"加速 A+H 双平台布局

5 月 30 日，中国证监会官网披露，通用人工智能公司 MiniMax 已于 5 月 29 日与中信证券签署首次公开发行股票并上市辅导备案报告，正式启动 A 股 IPO 进程。MiniMax 将冲刺 A+H 双上市平台——该公司于 2026 年 1 月登陆港交所，从成立到 IPO 仅用时约四年半，创下全球 AI 公司最快上市纪录。

财务数据：MiniMax 2025 年全年总收入 7903.8 万美元（约 5.7 亿人民币），同比增长 158.9%，毛利率提升至 25.4%。其中超过 73% 的收入来自海外市场。经调整净亏损 2.5 亿美元，较上年大幅收窄。公司在过去两个月实现了 年化经常性收入（ARR）翻倍，翻番周期压缩至 60 天，增速对标全球 AI 公司同期最快档。

商业化里程碑：MiniMax 当前服务全球超过 100 万企业和开发者客户，较半年前增长 5 倍；全球用户规模约 3 亿。公司已从"技术公司"向"平台型 AI 基础设施服务商"转型，AI 原生产品与企业服务贡献比例各约一半。公司 M2.7 模型发布后吸引了大量用户，推动 ARR 超出此前预测。

"六小虎"会师 A 股：MiniMax 启动 A 股辅导后，"AI 大模型六小虎"中已有 两家（MiniMax 与智谱） 推进 A+H 双平台布局。智谱于 2026 年 2 月签署 A 股辅导协议，比 MiniMax 早约三个月。两者均于 2026 年 1 月在港交所上市，智谱挂牌时间早于 MiniMax 一天。MiniMax 港股首日大涨 109%，当前股价 840 港元，市值 2635 亿港元（约 340 亿美元）。MINIMAX-W 于 5 月 22 日获纳入恒生科技指数，6 月 8 日生效。

https://www.cnr.cn/newscenter/native/gd/20260530/t20260530_527641377.shtml

https://www.jfdaily.com/news/detail?id=1120552

https://www.bbtnews.com.cn/2026/0530/594830.shtml

https://finance.sina.com.cn/stock/bxjj/2026-05-30/doc-inhzswye6924234.shtml

https://c.m.163.com/news/a/KU6MFOQB0519814N.html

https://money.udn.com/money/story/5604/9535557

◆ 华为发表"韬定律"：以时间缩微替代几何缩微，2031 年达等效 1.4nm 制程

5 月 25 日，在上海举行的 IEEE 国际电路与系统研讨会（ISCAS 2026）上，华为公司董事、半导体业务部总裁何庭波发表题为《半导体新路径探索与实践》的主旨演讲，正式发布 "韬（τ）定律"。这是中国企业首次在全球半导体领域提出指导产业发展的全新原则。

核心思想——时间缩微：传统摩尔定律遵循"几何缩微"——不断缩小晶体管的物理尺寸。韬定律提出以 "时间缩微"替代"几何缩微"，目标是通过系统性降低时间常数 τ（信号在电路中传播的耗时），持续压缩信号传播时延，从而实现晶体管密度和系统性能的同步提升。韬定律构建了贯穿器件、电路、芯片到系统层面的多层级协同优化体系。何庭波解释，摩尔定律的本质也是"压缩时间"，几何缩微只是手段——韬定律直接将"缩短 τ"确立为终极目标，完成了从"结果导向"到"目标导向"的范式转换。

创新技术——逻辑折叠：韬定律的关键实现技术是 逻辑折叠（logic folding）——将芯片电路"竖起来"，通过 3D 堆叠和高密度互连来突破平面晶体管的物理极限。这直接要求高深宽比（>60:1）的硅通孔刻蚀和精密薄膜沉积工艺。北方华创、中微公司、拓荆科技等国产设备厂商在刻蚀和薄膜沉积领域已有积累，韬定律的推广可能直接带动国产先进封装产业链的爆发。

已量产成果：华为基于韬定律在过去六年中已成功设计并量产了 381 款芯片。2026 年秋季即将发布的麒麟 2026 手机芯片将成为逻辑折叠技术的首次成功实施，大幅提升相关性能指标。何庭波预计，到 2031 年，基于韬定律的高端芯片晶体管密度将达到 1.4 纳米制程的同等水平。华为计划未来十年持续走向全面折叠，发展更多层的折叠技术。

行业意义：韬定律的发布是中国半导体产业从"追赶"到"提出规则"的标志性事件。在美国对华先进制程设备出口限制的背景下，韬定律提供了一条不依赖极紫外光刻（EUV）设备的替代道路——通过系统级优化和 3D 堆叠实现等效先进制程性能。这不是在现有赛道上追赶台积电和三星，而是在开辟一条新赛道。受此消息影响，A 股华为盘古概念板块全线走高，梅安森涨停、云鼎科技涨停。

https://finance.sina.com.cn/tech/discovery/2026-05-25/doc-inhzamvs3714846.shtml

https://www.eet-china.com/mp/a497902.html

https://www.eet-china.com/mp/a497509.html

https://www.reddit.com/r/China_irl/comments/1tmvrio/华为称半导体技术取得突破_预计2031年生产14纳米芯片

https://www.instagram.com/p/DYwxikzDyil

📍 论文解读

◆ Qwen-VLA：统一视觉-语言-动作的具身基础模型，LIBERO 基准达 97.9%

arXiv:2605.30280 · https://arxiv.org/abs/2605.30280

https://huggingface.co/papers/2605.30280

https://github.com/QwenLM/Qwen-VLA

研究背景：具身智能领域长期面临一个碎片化困境：操作（manipulation）、导航（navigation）、轨迹预测（trajectory prediction）等任务各自有独立的模型、数据集和评估基准。学术界习惯为每个任务训练"技能专家"（skill specialist），在特定基准上取得高分数，但这些模型无法跨任务、跨平台、跨环境泛化。视觉-语言-动作（VLA）模型试图解决这一问题，但现有方案（如 RT-2、π0）存在明显的离散化瓶颈——将连续动作信号离散化为 token，损失了高频控制精度。

核心方案：由 Qwen 团队（阿里通义千问） 主导、约 40 人研究团队开发的 Qwen-VLA，基于 Qwen3.5-4B 视觉-语言骨干网络，搭配一个 1.15B 参数的 DiT（Diffusion Transformer）流匹配动作解码器，实现了从感知、理解、推理到连续动作生成的端到端统一。Qwen-VLA 将操作、导航和轨迹预测统一为共享的"动作-轨迹预测框架"——一个模型、一次训练，在所有任务上同时评估。

技术创新：

- DiT 动作解码器：使用扩散 Transformer 架构直接生成连续动作，而非离散化 token——彻底解决了 RT-2 等方法的离散化精度损失问题，允许高频、平滑的机器人控制指令

- 具身感知提示（Embodiment-Aware Prompt Conditioning）：通过机器人特定的文本描述指定当前本体类型和控制约定，无需为每种机器人训练独立的模型权重

- 异构训练数据：训练数据涵盖机器人操作轨迹、人类第一人称演示、合成仿真数据、视觉-语言-导航数据、轨迹监督数据和辅助视觉-语言数据——一个模型从跨模态、跨平台的数据中统一学习

关键指标：

- 在 LIBERO 机器人操作基准上达到 97.9% 成功率

- 在 ALOHA 双臂操作平台上，作为统一通用模型的表现 匹配或超越专门为单个任务微调的专业模型（GR00T N1.6、π0.5）

- 在跨本体泛化（从仿真到真实机器人、不同机械臂构型之间的零样本迁移）上表现出有意义的零样本性能

- 同时支持操作、导航和轨迹预测三大类任务

行业意义：Qwen-VLA 回答了具身智能领域一个根本性问题：是否需要为每个任务、每种机器人独立训练模型？答案是"不需要"。Qwen-VLA 证明，一个统一模型可以同时学会抓取杯子、规划导航路径和预测运动轨迹——关键在于将动作生成从"离散分类"改为"连续扩散"。这对于机器人基础模型的规模扩展路径具有范式意义。Qwen 团队在 CVPR 2026 上展示了这项成果，并已将模型和代码开源。

https://www.teahose.com/paper/arXiv%20Physical%20AI/Qwen-VLA

https://digg.com/ai/k41gmxv9

标签：

#AI日报#NVIDIA#N1X#Computex2026#ArmPC#VeraCPU#AgenticAI#OpenRouter#AIModelExchange#CapitalG#MiniMax#A股IPO#AH股#华为#韬定律#逻辑折叠#1.4nm#半导体#QwenVLA#具身智能#VLA#机器人#阿里

AI 内参 · 每日 AI 动态跟踪