AI Infra 日报 | 2026年5月20日
聚焦 AI 基础设施与超节点领域,每日精选 7 条核心动态
1. Google I/O 2026 首日全面复盘:Gemini 3.5 Flash + Omni + TPU 第八代,AI 全栈闭环成形
Google I/O 2026 于 5 月 19 日开幕(持续至今日),CEO Sundar Pichai 宣示进入"Agentic Gemini 时代"。首日核心发布如下:
模型侧 — 发布 Gemini 3.5 Flash(即时可用),定位"前沿智能+行动执行"的新一代模型。4x 更快输出、不到同类前沿模型一半的价格,已在 GDPVal 经济价值基准实现跃升。Gemini 3.5 Pro 将于下月推出。同时发布 Gemini Omni,首个"从任意输入生成任意输出模态"的全模态模型,视频输出先行上线,图片/文本随后。
Agent 侧 — Gemini Spark:首个 7×24 小时个人 AI Agent,运行于专属 Cloud VM,本周向受信测试者推送。Gemini 月活用户突破 9 亿(去年 I/O 时 4 亿),日请求量增长 7 倍;AI Mode 搜索月活超 10 亿。
基础设施侧 — Pichai 宣布 Google CapEx 从 2022 年 $310 亿→2026 年约 $1800-1900 亿(6 倍)。TPU 第八代(此前 Cloud Next 发布)再度强调:TPU 8t(训练) 裸算力 3 倍提升,首次实现跨全球多站点 100 万+ TPU 分布式训练,打造"世界最大训练集群";TPU 8i(推理) 全环节加速,双芯片能效比均提升 2 倍。API 处理 190 亿 Token/分钟,375+ 企业客户年处理超 1 万亿 Token。
关注理由:Google I/O 2026 的深层叙事不是单个模型跑分,而是 Google 从 TPU 芯片 → Gemini 模型 → Agent 应用 → 搜索/购物变现的 全栈 AI 基础设施闭环 已经成形。$1800-1900 亿 CapEx 和百万 TPU 集群意味着光互联、液冷、高速连接器需求将进入新量级。对于中国超节点供应链而言,Google 在训练和推理两端的双重扩张,是对整个产业链景气度的最强确认信号。
2. NVIDIA Q1 FY2027 财报今晚发布:$5.3 万亿市值迎年度"最重要财报"
英伟达将于 今日盘后(北京时间 5 月 21 日凌晨) 发布 FY2027 Q1 财报。当前 NVDA 股价约 $220,市值 $5.3 万亿。华尔街一致预期:总营收 $780-790 亿,数据中心营收 >$650 亿,EPS $1.74(去年同期 $0.90,同比 +93%)。
四大变量决定后市走向:
- Blackwell 产能交付 — TrendForce 警告 Rubin 面临延期风险,Blackwell 在 2026 年占高端 GPU 出货量 70%+,实际交付节奏将指引下半年全球 AI 服务器出货预期;
- 中国市场断崖 — NVIDIA 中国区 AI 芯片市场份额已从三年前的 95% 暴跌至 8%,H200 获批但零实际交付,财报中的中国营收数据将成为国产替代叙事的关键参照;
- Q2 业绩指引 — 一致预期 Q2 营收 $860 亿,任何低于预期的指引都将触发 AI 算力需求预期的系统性重估;
- Vera CPU 变量 — 最新发布的 Vera CPU(88 核 Olympus 架构,1.2 TB/s 内存带宽)已开始出货,Agentic AI 时代的 CPU 范式迁移能否形成新收入支柱。
关注理由:英伟达业绩指引是整个 AI Infra 产业链的"定价锚"。数据中心营收增速不仅直接决定 GPU 供需格局,更将传导至光模块、液冷、连接器、服务器整机等超节点核心配套环节。今晚的财报电话会将是对"AI 算力需求是否可持续"这一终极问题的年度答卷。
3. NVIDIA Vera CPU 正式出货:Agentic AI 时代 CPU 范式迁移正在发生
NVIDIA 首款面向 Agentic AI 的定制 CPU Vera 已于近日正式出货,进入头部 AI 企业并启动量产。关键规格:88 个定制 Olympus 核心、1.2 TB/s 内存带宽,较前代 Grace CPU 性能提升 50%。
华尔街 AI 芯片资金轮动正在加速——2026 年至今,Intel 累计 +240%,AMD +112%,而 NVIDIA 仅 +15%。CNBC 指出,AI 重心正从 GPU 训练转向 CPU 推理,推动数据中心 CPU 市场翻倍增长。
关注理由:Vera CPU 出货标志着 NVIDIA 正从纯 GPU 公司向"GPU+CPU+DPU"全栈计算平台演进。在 Agentic AI 时代,CPU 不再是配角。对于中国超节点供应链而言,CPU 需求的崛起将为服务器整机和高速互连创造新的增长极,同时加剧 Advanced Packaging 和 HBM 等上游产能的争夺。
4. 谷歌联手黑石 250 亿美元组建新型 AI 云:直指英伟达生态腹地
据多家媒体报道,Google 与黑石集团(Blackstone)正联合投资约 250 亿美元,组建一种全新的 AI 云基础设施,目标直接挑战英伟达的 AI 计算生态。该合作将整合 Google 的 TPU 芯片优势与黑石的资本实力,构建差异化的 AI 算力供给体系。
这是继 Google Cloud Next 发布 TPU 第八代、I/O 2026 宣布 $1800-1900 亿 CapEx 后,Google 在 AI 基础设施领域的又一次重磅加码。
关注理由:Google+黑石 250 亿美元 AI 云合作,标志着 AI 基础设施竞争从"芯片层面"升级至"云生态层面"。Google 正以 TPU 为支点,试图打破英伟达 CUDA 生态在 AI 算力领域的垄断。这一格局对超节点产业链的启示在于:异构计算将成主流,能够兼容多芯片生态的服务器、互连、液冷等配套环节将获得最广泛的订单覆盖。
5. 摩根士丹利深度报告:英伟达 GPU 贵两倍但长线回报更高 —— 1GW 数据中心 TCO 终极对比
摩根士丹利最新研报对 1GW 级 AI 数据中心建设成本进行了系统性 TCO 对比:
- 建设成本:采用 NVIDIA Blackwell GPU 的方案比 Google TPU 或 Amazon Trainium ASIC 方案 贵约 2 倍;
- 长线回报:但考虑到 CUDA 生态成熟度、软件兼容性和转售价值,NVIDIA GPU 方案在 5-7 年周期内的 总回报率可能更高。
这份报告正在重塑全球 AI 数据中心的采购决策逻辑。与此同时,中国市场因出口管制正加速切换至国产芯片方案,形成独特的双轨投资逻辑。
关注理由:大摩的 TCO 报告是当前 AI Infra 资本配置决策的核心参考框架。对于中国超节点供应链而言,"贵但好"的 NVIDIA 方案在中国不可行,而 TPU/Trainium 路线在国内也缺乏直接对标,这意味着华为昇腾、百度昆仑芯等国产方案正站在一个独特的"定价窗口"——既没有 NVIDIA 的生态溢价,也没有 TPU 的排他性限制。
6. 三大运营商齐上线 Token 套餐 + 弘信电子昇腾 384 超节点落地无锡:算力进入"智能计费"时代
5 月 17 日(世界电信日),中国电信、中国移动、中国联通 同步上线 AI Token 套餐,用户可通过手机话费支付算力费用,跨平台使用 AI 算力——算力正像"话费包月"一样被商品化。
同期,弘信电子 联手无锡高新区打造的 江苏省内首个华为昇腾 384 超节点算力集群 正式签约落地,并以该集群为首期基础设施,建设大规模 "Token 工厂"——算力从"租卡"模式升级为"按 Token 智能计费"模式。弘信电子因该项目股价连续三日涨停。
关注理由:运营商 Token 套餐 + 昇腾超节点 Token 工厂,标志着中国 AI 算力基础设施正从"资源型"向"服务型"跃迁。算力的商品化和计费化将极大降低 AI 使用门槛,从而引爆推理算力需求——这正是超节点放量最核心的长期驱动力。弘信电子的 Token 工厂模式,为全国范围内的昇腾超节点商业化提供了可复制的样板。
7. 国产 AI 芯片市占率破 60%,英伟达中国份额断崖至 8%:超节点供应链国产替代确定性强化
据 IDC 及多家机构数据,国产 AI 加速卡在中国市场份额已 首次突破 60%,而 NVIDIA 中国区 AI 芯片份额从三年前的 95% 断崖式跌至 8%。核心驱动力:
- 华为昇腾 950PR 量产,384 超节点部署超 500 套,950 超节点下半年放量在即;
- 寒武纪 Q1 2026:营收 28.85 亿(+160%),净利润 10.13 亿(+185%),首次实现扣非净利润质的飞跃;
- 百度昆仑芯 P800:天池 256 超节点已点亮,6 月上市,已适配文心/DeepSeek/GLM/MiniMax 全系列主流模型;
- 摩尔线程、沐曦等 国产 GPU 厂商 Q1 集体交出营收翻倍以上的成绩单。
关注理由:NVIDIA 中国份额从 95%→8% 的断崖式变化,是当前 AI 芯片地缘格局最直接的量化证据。对于中国超节点供应链而言,这意味着连接器、液冷、光模块、服务器整机等配套环节的"锚定客户"正从英伟达生态不可逆地转向国产芯片生态,供应链确定性大幅强化。今晚 NVIDIA 财报中的中国区营收数据,将是这一趋势的最新注脚。
编辑:观天下 | 2026年5月20日
明日预告:NVIDIA Q1 FY2027 财报深度全面解读 + Google I/O 2026 闭幕总结
夜雨聆风