报告日期:2026年5月25日
你有没有过这种感觉——每次看到AI概念股暴涨的新闻冲进去,结果刚上车就发现风已经吹到别处了?
过去两年,这种"追风焦虑"在AI投资圈里反复上演。
但如果你认真拆解黄仁勋过去18个月的每一次GTC主题演讲、财报电话会和闭门峰会发言,会发现一条极其清晰的暗线——他其实一直在提前告诉你,AI基建的下一站会停在哪里。
2026年5月,黄仁勋在财报会上扔下一句被很多人低估的判断:
"AI工厂的建设是人类历史上规模最大的基础设施扩张,并且正以惊人的速度加速推进。"
这句话的关键词不是"最大",而是"加速"。
第一层:当计算力不再是最稀缺的东西
2024年到2025年,整个市场都在疯狂追逐GPU。
但黄仁勋很早就开始反复强调一个被忽视的事实:GPU本身的算力增长,正在被一个更隐蔽的瓶颈卡住——内存带宽。
他在2026年5月财报会上说得非常直白:
"就算供应链每年翻四倍,未来十年也不够AI用。Blackwell和Vera Rubin的性能瓶颈,越来越取决于HBM带宽与供应。"
翻译一下:GPU再强,数据喂不进去,等于废铁。
这就是为什么美光的定价逻辑正在发生根本性变化
| 维度 | 过去认知 | 现在现实 |
|---|---|---|
| 存储芯片 | 典型周期品——涨价时追,跌价时跑 | HBM成为AI系统不可替代的核心部件 |
| 供需格局 | 周期波动 | 2026年全年HBM产能已被预订一空,仅能满足客户需求的50%-66% |
| 定价模型 | 周期商品 | AI结构性瓶颈资产 |
数据印证:美光数据中心营收单季同比增长超3倍,毛利率从1%跃升至76%。这不是存储周期反转,这是定价模型的范式转移。
HBM市场格局
| 公司 | 市场份额 |
|---|---|
| SK海力士 | ~53% |
| 三星 | ~40% |
| 美光 | ~7% |
Vera Rubin架构将搭载HBM4内存,带宽从Blackwell的8TB/s直接跳升至13TB/s。
这一层的核心逻辑:当所有人都盯着算力时,算力的瓶颈才是真正的价值洼地。
第二层:百万张GPU为什么跑不出百万张的威力?
如果你以为买够了GPU就万事大吉,那说明你还没见过十万卡集群的真实效率。
AI集群进入十万卡级别后,一个反直觉的现象出现了:真正限制效率的,不是单卡性能,而是GPU之间的数据流动速度。
黄仁勋在GTC 2025上发布硅光子共封装光学(CPO)技术时,给出的数据令人震惊——这项技术可减少数据中心光模块功耗90%,同时支持百万GPU级互联。
他还补了一句关键判断:
"我们希望将以太网的水平提升至Infiniband级别。NVLink解决的是Scale-Up(柜内互联),真正大规模AI集群最终拼的是Scale-Out(柜外组网)。"
AI数据中心支出结构变化
| 维度 | 2023年 | 2026年 |
|---|---|---|
| 网络设备支出占比 | 15% | 30% |
| 1.6T光模块市场规模 | - | 2025年50亿→2027年200亿美元(CAGR 100%) |
"AI数据流动收费站"
| 公司 | 核心产品 | 逻辑 |
|---|---|---|
| Arista | 高吞吐交换机 | 数据中心交换机收入同比+85% |
| Marvell | 1.6T光芯片 | 掌控GPU对话通道 |
| Credo | 高速SerDes芯片 | 数据传输核心部件 |
AI越大,以太网和光通信的地位反而越强。
第三层:CPU在AI时代被边缘化?完全搞反了
2026年初,一个令市场措手不及的转折出现了。
当所有人都在讨论GPU时,黄仁勋在2026年2月25日的财报会上突然抛出一个全新叙事:
"代理AI(Agentic AI)已达到拐点,算力直接转化为收入。推理现在等于我们客户的收入。正在生成的token数量呈指数级增长,每一个token都被货币化,直接转化为收入。"
为什么CPU突然变得重要?
在训练时代,GPU是绝对主角,CPU确实像个负责搬砖的配角。但进入Agentic AI时代后:
| 场景 | 需求特点 |
|---|---|
| AI智能体完成一个任务 | 不是一张GPU暴力计算,而是成百上千次的小规模推理 |
| 任务特点 | 大量工具调用 + 复杂的任务编排 |
| 谁来协调? | CPU |
黄仁勋进一步解释:
"Agentic AI、Inference、Orchestration都需要大量CPU调度。Vera CPU不是替代GPU,而是互补——GPU负责思考、推理、生成Token,CPU负责智能体调度、工具调用、控制逻辑。"
最新数据
| 指标 | 数据 |
|---|---|
| 全球每周Token使用量(2026年1月) | ~6万亿 |
| 全球每周Token使用量(2026年5月) | 28万亿 |
| 增幅 | 350% |
Arm估计其AI相关总可寻址市场将从2026年的5350亿美元扩大到2031年的超过1.5万亿美元。
最反直觉的启示:当所有人都在追逐"更聪明的AI"时,真正稀缺的可能是"更会调度AI的CPU"。
第四层:AI离开云端,进入你身边的每一个角落
黄仁勋在CES 2026上做出了一个极具野心的预言:
"未来AI会进入运营商网络、边缘节点、基站、机器人、工厂、汽车。AI不会永远只待在云里。物理AI的ChatGPT时刻已经临近。"
这场迁移有三个方向:
方向一:AI-RAN——你的5G基站,可能会变成AI节点
| 进展 | 内容 |
|---|---|
| 英伟达向诺基亚投资 | 10亿美元 |
| 合作方 | T-Mobile、诺基亚 |
| 市场预测 | AI-RAN市场规模到2030年累计超过2000亿美元 |
方向二:Edge AI——你的手机、汽车、智能家居,正在变成AI终端
| 指标 | 数据 |
|---|---|
| Jetson Thor边缘计算平台 | AI性能比前代提升10倍 |
| 2026年出货智能手机 | 90%将支持端侧AI |
方向三:Physical AI——机器人不是炒概念,是炒工业自动化
| 参与厂商 | 内容 |
|---|---|
| ABB、FANUC、安川电机、KUKA | 全面集成NVIDIA Omniverse和Isaac平台 |
| 市场预测 | 工业自动化市场2025年2000亿→2030年5000亿美元 |
投资行军地图:站在2026年中,向前看
| 下沉层级 | 时间窗口 | 核心瓶颈 | 重新定价逻辑 | 代表性标的 |
|---|---|---|---|---|
| 计算层 | 2024-2025 | HBM带宽 | 存储:周期品→AI结构性资产 | $MU, SK海力士 |
| 传输层 | 2026上半年 | 数据互联速度 | 光通信:配件→集群核心瓶颈 | $ANET, $MRVL, $CRDO |
| 调度层 | 2026 Q1-Q2 | CPU调度效率 | CPU:边缘→推理基础设施核心 | $ARM, $QCOM |
| 物理层 | 2026下半年-2027 | 真实世界连接 | 基站/工厂/机器人→AI节点 | $NOK, $ABB |
风险提示
| 风险类型 | 具体内容 |
|---|---|
| 供应链瓶颈 | HBM仅能满足50%-66%需求,CoWoS封装产能持续紧张 |
| 估值回调 | 科技巨头2026年AI资本支出冲向8000亿美元,若应用落地不及预期 |
| 竞争格局 | AMD、英特尔、谷歌加速推出自研AI芯片 |
| 政策风险 | 中国市场出口管制政策变化 |
尾声
黄仁勋在2026年5月SCSP智库访谈中说过一句话,值得每个AI投资者铭记:
"计算范式已从检索式计算走向生成式计算,我们才刚刚进入AI无处不在、无所不能的良性循环。"
"良性循环"这个词,才是整个AI基建叙事的内核。它意味着每一层的建设,都会催生下一层的需求。
对于投资者而言,问题从来不是"AI有没有未来",而是"AI基建的下一站在哪里"。
老黄每一次开口,都在提前告诉你答案。
风险提示:本文基于截至2026年5月的公开信息撰写,不构成投资建议。市场有风险,投资需谨慎。
夜雨聆风