AI Infra日报 | Google I/O全解析 + NVIDIA今日大考

AI Infra 日报 | 2026年5月20日

聚焦 AI 基础设施与超节点领域，每日精选 7 条核心动态

1. Google I/O 2026 首日全面复盘：Gemini 3.5 Flash + Omni + TPU 第八代，AI 全栈闭环成形

Google I/O 2026 于 5 月 19 日开幕（持续至今日），CEO Sundar Pichai 宣示进入"Agentic Gemini 时代"。首日核心发布如下：

模型侧 — 发布 Gemini 3.5 Flash（即时可用），定位"前沿智能+行动执行"的新一代模型。4x 更快输出、不到同类前沿模型一半的价格，已在 GDPVal 经济价值基准实现跃升。Gemini 3.5 Pro 将于下月推出。同时发布 Gemini Omni，首个"从任意输入生成任意输出模态"的全模态模型，视频输出先行上线，图片/文本随后。

Agent 侧 — Gemini Spark：首个 7×24 小时个人 AI Agent，运行于专属 Cloud VM，本周向受信测试者推送。Gemini 月活用户突破 9 亿（去年 I/O 时 4 亿），日请求量增长 7 倍；AI Mode 搜索月活超 10 亿。

基础设施侧 — Pichai 宣布 Google CapEx 从 2022 年 $310 亿→2026 年约 $1800-1900 亿（6 倍）。TPU 第八代（此前 Cloud Next 发布）再度强调：TPU 8t（训练） 裸算力 3 倍提升，首次实现跨全球多站点 100 万+ TPU 分布式训练，打造"世界最大训练集群"；TPU 8i（推理） 全环节加速，双芯片能效比均提升 2 倍。API 处理 190 亿 Token/分钟，375+ 企业客户年处理超 1 万亿 Token。

关注理由：Google I/O 2026 的深层叙事不是单个模型跑分，而是 Google 从 TPU 芯片 → Gemini 模型 → Agent 应用 → 搜索/购物变现的 全栈 AI 基础设施闭环 已经成形。$1800-1900 亿 CapEx 和百万 TPU 集群意味着光互联、液冷、高速连接器需求将进入新量级。对于中国超节点供应链而言，Google 在训练和推理两端的双重扩张，是对整个产业链景气度的最强确认信号。

2. NVIDIA Q1 FY2027 财报今晚发布：$5.3 万亿市值迎年度"最重要财报"

英伟达将于 今日盘后（北京时间 5 月 21 日凌晨） 发布 FY2027 Q1 财报。当前 NVDA 股价约 $220，市值 $5.3 万亿。华尔街一致预期：总营收 $780-790 亿，数据中心营收 >$650 亿，EPS $1.74（去年同期 $0.90，同比 +93%）。

四大变量决定后市走向：

- Blackwell 产能交付 — TrendForce 警告 Rubin 面临延期风险，Blackwell 在 2026 年占高端 GPU 出货量 70%+，实际交付节奏将指引下半年全球 AI 服务器出货预期；

- 中国市场断崖 — NVIDIA 中国区 AI 芯片市场份额已从三年前的 95% 暴跌至 8%，H200 获批但零实际交付，财报中的中国营收数据将成为国产替代叙事的关键参照；

- Q2 业绩指引 — 一致预期 Q2 营收 $860 亿，任何低于预期的指引都将触发 AI 算力需求预期的系统性重估；

- Vera CPU 变量 — 最新发布的 Vera CPU（88 核 Olympus 架构，1.2 TB/s 内存带宽）已开始出货，Agentic AI 时代的 CPU 范式迁移能否形成新收入支柱。

关注理由：英伟达业绩指引是整个 AI Infra 产业链的"定价锚"。数据中心营收增速不仅直接决定 GPU 供需格局，更将传导至光模块、液冷、连接器、服务器整机等超节点核心配套环节。今晚的财报电话会将是对"AI 算力需求是否可持续"这一终极问题的年度答卷。

3. NVIDIA Vera CPU 正式出货：Agentic AI 时代 CPU 范式迁移正在发生

NVIDIA 首款面向 Agentic AI 的定制 CPU Vera 已于近日正式出货，进入头部 AI 企业并启动量产。关键规格：88 个定制 Olympus 核心、1.2 TB/s 内存带宽，较前代 Grace CPU 性能提升 50%。

华尔街 AI 芯片资金轮动正在加速——2026 年至今，Intel 累计 +240%，AMD +112%，而 NVIDIA 仅 +15%。CNBC 指出，AI 重心正从 GPU 训练转向 CPU 推理，推动数据中心 CPU 市场翻倍增长。

关注理由：Vera CPU 出货标志着 NVIDIA 正从纯 GPU 公司向"GPU+CPU+DPU"全栈计算平台演进。在 Agentic AI 时代，CPU 不再是配角。对于中国超节点供应链而言，CPU 需求的崛起将为服务器整机和高速互连创造新的增长极，同时加剧 Advanced Packaging 和 HBM 等上游产能的争夺。

4. 谷歌联手黑石 250 亿美元组建新型 AI 云：直指英伟达生态腹地

据多家媒体报道，Google 与黑石集团（Blackstone）正联合投资约 250 亿美元，组建一种全新的 AI 云基础设施，目标直接挑战英伟达的 AI 计算生态。该合作将整合 Google 的 TPU 芯片优势与黑石的资本实力，构建差异化的 AI 算力供给体系。

这是继 Google Cloud Next 发布 TPU 第八代、I/O 2026 宣布 $1800-1900 亿 CapEx 后，Google 在 AI 基础设施领域的又一次重磅加码。

关注理由：Google+黑石 250 亿美元 AI 云合作，标志着 AI 基础设施竞争从"芯片层面"升级至"云生态层面"。Google 正以 TPU 为支点，试图打破英伟达 CUDA 生态在 AI 算力领域的垄断。这一格局对超节点产业链的启示在于：异构计算将成主流，能够兼容多芯片生态的服务器、互连、液冷等配套环节将获得最广泛的订单覆盖。

5. 摩根士丹利深度报告：英伟达 GPU 贵两倍但长线回报更高 —— 1GW 数据中心 TCO 终极对比

摩根士丹利最新研报对 1GW 级 AI 数据中心建设成本进行了系统性 TCO 对比：

- 建设成本：采用 NVIDIA Blackwell GPU 的方案比 Google TPU 或 Amazon Trainium ASIC 方案 贵约 2 倍；

- 长线回报：但考虑到 CUDA 生态成熟度、软件兼容性和转售价值，NVIDIA GPU 方案在 5-7 年周期内的 总回报率可能更高。

这份报告正在重塑全球 AI 数据中心的采购决策逻辑。与此同时，中国市场因出口管制正加速切换至国产芯片方案，形成独特的双轨投资逻辑。

关注理由：大摩的 TCO 报告是当前 AI Infra 资本配置决策的核心参考框架。对于中国超节点供应链而言，"贵但好"的 NVIDIA 方案在中国不可行，而 TPU/Trainium 路线在国内也缺乏直接对标，这意味着华为昇腾、百度昆仑芯等国产方案正站在一个独特的"定价窗口"——既没有 NVIDIA 的生态溢价，也没有 TPU 的排他性限制。

6. 三大运营商齐上线 Token 套餐 + 弘信电子昇腾 384 超节点落地无锡：算力进入"智能计费"时代

5 月 17 日（世界电信日），中国电信、中国移动、中国联通 同步上线 AI Token 套餐，用户可通过手机话费支付算力费用，跨平台使用 AI 算力——算力正像"话费包月"一样被商品化。

同期，弘信电子 联手无锡高新区打造的 江苏省内首个华为昇腾 384 超节点算力集群 正式签约落地，并以该集群为首期基础设施，建设大规模 "Token 工厂"——算力从"租卡"模式升级为"按 Token 智能计费"模式。弘信电子因该项目股价连续三日涨停。

关注理由：运营商 Token 套餐 + 昇腾超节点 Token 工厂，标志着中国 AI 算力基础设施正从"资源型"向"服务型"跃迁。算力的商品化和计费化将极大降低 AI 使用门槛，从而引爆推理算力需求——这正是超节点放量最核心的长期驱动力。弘信电子的 Token 工厂模式，为全国范围内的昇腾超节点商业化提供了可复制的样板。

7. 国产 AI 芯片市占率破 60%，英伟达中国份额断崖至 8%：超节点供应链国产替代确定性强化

据 IDC 及多家机构数据，国产 AI 加速卡在中国市场份额已 首次突破 60%，而 NVIDIA 中国区 AI 芯片份额从三年前的 95% 断崖式跌至 8%。核心驱动力：

- 华为昇腾 950PR 量产，384 超节点部署超 500 套，950 超节点下半年放量在即；

- 寒武纪 Q1 2026：营收 28.85 亿（+160%），净利润 10.13 亿（+185%），首次实现扣非净利润质的飞跃；

- 百度昆仑芯 P800：天池 256 超节点已点亮，6 月上市，已适配文心/DeepSeek/GLM/MiniMax 全系列主流模型；

- 摩尔线程、沐曦等 国产 GPU 厂商 Q1 集体交出营收翻倍以上的成绩单。

关注理由：NVIDIA 中国份额从 95%→8% 的断崖式变化，是当前 AI 芯片地缘格局最直接的量化证据。对于中国超节点供应链而言，这意味着连接器、液冷、光模块、服务器整机等配套环节的"锚定客户"正从英伟达生态不可逆地转向国产芯片生态，供应链确定性大幅强化。今晚 NVIDIA 财报中的中国区营收数据，将是这一趋势的最新注脚。

编辑：观天下 | 2026年5月20日

明日预告：NVIDIA Q1 FY2027 财报深度全面解读 + Google I/O 2026 闭幕总结