一、起点:AI 需求是真实的
在讨论任何 AI 相关投资之前,先堵住一个最常见的反驳:AI 是不是泡沫?
2024 年底这个问题没有确定答案,大量资金在堵一个未兑现的故事。2026 年的数据已经给出答复。
AI 模型公司的收入在真实放量:
Anthropic 年化收入(annualized run rate)从 2025 年 1 月的 10 亿美元爆发到 2026 年 4 月的 300 亿美元,15 个月 30 倍。年化口径 = 当月收入 × 12,会放大爆发期增速,但即使按实际确认收入同比也是 5-10 倍量级 OpenAI 年化约 250 亿美元 微软 AI 业务年化 370 亿美元,同比 +123%
大厂云业务的 AI 驱动也在兑现:
Google Cloud +63%、Azure +39%、AWS +28%
大厂资本开支不减反增:
四大厂(Google、Amazon、Microsoft、Meta)2026 年 capex 合计 7250 亿美元,同比 +77% Google 明确表示 2027 年 capex 还会"显著增长"
这三组数据合在一起说明:下游需求是真实的、在加速的,上游基础设施投入是确定的。这是所有后续判断的起点。
唯一需要保留的质疑:PwC 2026 CEO 调查显示,56% 的企业说 AI 没带来收入或成本改善,只有 12% 两者都兑现了。这意味着短期 1-2 年大厂 capex 确定性极高,但中期(2027 年之后)如果企业端 ROI 持续不兑现,可能压制大厂支出增速。这是这篇文章所有乐观推导的时间边界。
二、Agentic AI 改变了硬件需求结构
AI 需求真实只是前提。真正能解释 2026 年市场热点切换的,是 Agentic AI 带来的硬件结构变化。
一台 AI 服务器的核心结构
抛开复杂的工艺名词,一台 AI 服务器的算力部分由两套"芯片 + 工作台"组成:
- GPU + HBM
:AI 计算的"发动机"和它的专属高速内存,通过台积电 CoWoS 封装粘在一起 - CPU + DDR5
:服务器的"总指挥"和它的通用内存,通过主板组装
两套组合各自有独立的产品链和瓶颈,但最终汇聚在同一批公司身上——DRAM 三大厂(海力士、美光、三星)既生产 HBM 又生产 DDR5。存储是唯一一条同时受益于两条产品链的赛道。
每台服务器里,CPU 和 GPU 的数量配比是有规律的——这个比例就是这一轮投资逻辑的核心变量。
旧时代:AI = GPU,CPU 被市场抛弃
2023-2024 年的 AI 形态以 ChatGPT 4.0 为代表:用户问一个问题 → GPU 推理 → 返回答案。这是一次性的、单轮的交互。
在这种范式下:
CPU 只做最基础的请求接收和文字预处理 99% 的算力消耗在 GPU 上 一台 AI 服务器配 2 颗 CPU + 8-16 颗 GPU,CPU:GPU = 1:8
市场认知顺势固化:AI = GPU = 英伟达。Intel 因为没赶上 AI 浪潮,2022-2024 年股价从 70 美元跌到 20 美元附近,被认为"被时代抛弃"。AMD 虽然有 EPYC 服务器 CPU,但市场也只把它当成"次要的边缘故事"。
新时代:AI = Agentic,CPU 重新成为主角
进入 2025-2026 年,AI 形态发生了根本变化。最典型的就是 Agent——AI 不再只回答问题,而是自主完成多步骤任务:让它订机票,它会查航班、对比价格、调用支付接口、写确认邮件;让它写代码,它会读文件、调试、运行测试、修改、再运行。
每完成一步,AI 都要在"思考"和"执行"之间切换:
GPU 思考 → CPU 执行(调工具/查数据)→ GPU 检查 → CPU 再执行 → ……
一个复杂任务可能循环十几二十轮。GPU 只在"思考"环节工作,CPU 在每一轮"执行"环节都要干活——调用 API、操作文件、协调多个子任务。Agent 越复杂,CPU 的工作量相对 GPU 增加得越多。
2026 年的硬件比例随之改变:
AMD CEO Lisa Su 在 Q1 电话会上说:CPU:GPU 比例会从传统 4-5:1 压缩到 1:1 Intel 在 Q1 财报中表态更激进:在 agentic 场景下可能达到 1:1 Intel 已经实际行动——把消费芯片产线转产 Xeon 服务器 CPU
市场也快速修正了之前的错误定价:Intel 年内涨 200%+,AMD 翻倍。这不是"基本面突然变好",而是市场意识到——CPU 从来没被 AI 抛弃,只是上一个范式不需要那么多 CPU。
三个硬件变化对应三个投资方向
理清了这套硬件结构,AI 算力的投资逻辑就清晰了:
| GPU | ||
| CPU | ||
| 存储 |
接下来逐条分析:每条主线基本面如何,市场已定价多少,剩余空间还有多少。
三、GPU 主线:基本面极强,定价已充分
英伟达是整个 AI 叙事的主角。2024-2025 年股价涨幅以倍计。但涨这么多之后,还有多少空间?要回答这个问题,需要把它拆成三个子问题:量、价、当前股价反映了多少。
量:有天花板,且天花板可见
GPU 出货量受台积电 CoWoS 封装产能硬约束:
2024 年底月产能约 3.5 万片 2026 年底扩至 13-15 万片(约 4 倍) 英伟达锁定其中一半以上
这意味着 GPU 出货量的上限是确定的——不是"需求有多少就能出多少",而是"产能扩多快就出多少"。2026-2027 年 CoWoS 产能增速约 40-50%/年,这就是 GPU 出货量增速的天花板。
价:单价已极高,继续抬升空间有限
B200 单价 $40,000,成本 $6,400,毛利率结构极强 HBM 占 B200 物料成本的 45%——GPU 的价值越来越由存储驱动 下一代 Rubin 架构预计单价更高,但客户对单卡 $5-6 万的接受度尚未验证 AMD MI 系列加速器开始蚕食份额(Meta 6GW 多年部署订单),长期对英伟达定价权构成压力
GPU 不像存储那样有"价格翻倍"的弹性——$40,000 的东西再涨 50% 就是 $60,000,买方会更认真地评估替代方案。
股价反映了多少
英伟达年初至今只涨 15%,跑输纳斯达克 Forward PE 约 30-35 倍,对应 FY2027 净利润约 1000-1100 亿美元的预期 这个预期要求数据中心收入继续保持 50%+ 同比增速——可以做到,但已经没有"超预期"的余量
市场在交易什么: 基本面无可挑剔,但确定性已被定价完毕。2026 年 GPU 板块进入"超预期才能涨"的阶段——英伟达 forward PE 30-35 倍意味着市场已经把未来两年的高增长 price in,剩余超额收益空间有限。
结论:GPU 主线是过去两年的机会。2026 年的角色是"持续验证"而非"进攻",不适合在当前位置重仓新建。除非 Rubin 代际出现超预期催化(如良率远超预期导致产能释放加速),否则难有大的超额收益。
四、CPU 主线:还有多少没兑现?
CPU 是 2026 年最亮眼的板块——Intel 年内 +200%+、AMD 一年涨 320%。驱动力就是前面说的 Agentic AI 带来 CPU:GPU 比例的结构性变化。
量还能涨多少?
当前基数(2026):
AMD 官方指引:全球服务器 CPU 年出货约 3000 万颗 AMD 预测 2028 年达 4400 万颗
增长靠什么驱动?两个独立的力:
驱动力 1:AI 服务器占比扩大
2026 年全球服务器出货约 1700 万台(DIGITIMES、TrendForce),其中 AI 服务器 270 万台,占比约 16%。AI 服务器需求高度集中在北美四大 CSP(微软、Google、AWS、Meta,约占 60-65%)、二线 GPU 云服务商(CoreWeave、Oracle Cloud 等)和新兴的主权云部署(沙特、日本、法国、印度等政府/国资项目)。AI 服务器同比 +28%,远高于通用服务器低个位数增速,占比每年提升 3-5 个百分点。更多的服务器 = 更多的 CPU。
驱动力 2:每台 AI 服务器需要更多 CPU
前面讲过,Agentic AI 把 CPU:GPU 比例从 1:8 推向 1:1。一台传统 AI 服务器配 2 颗 CPU + 8-16 颗 GPU;Agentic 场景下可能需要 4-8 颗 CPU 配同样数量的 GPU。单台 CPU 用量翻 2-4 倍。
两者叠加的推导:
驱动力 1 让服务器总台数增长(CAGR 约 5-8%) 驱动力 2 让每台 AI 服务器的 CPU 颗数增加(从 2 颗 → 4-8 颗) 合在一起,2030 年服务器 CPU 出货量可能达到 5000 万颗左右 量的空间:5 年约 +65%(CAGR 约 10-12%) 交叉验证:AMD 自己预测 2028 年 4400 万颗,按同一增速外推到 2030 年约 5000-5500 万颗,吻合
量有增长但不算爆炸——CPU 毕竟是成熟产品,升级周期长。真正的弹性在价格端。
议价能力有多强?
CPU 板块这一轮和过去最大的不同,是供给端真的紧了。三个直接证据:
1. Intel 转产 Xeon,服务器 CPU 产能 sold out
Intel 2026 年服务器 CPU 产能基本售罄,并已经把消费芯片产线实际转产 Xeon——这是真金白银的行动,不是口头承诺。Lenovo 数据中心销售主管在 GTC 上确认"开始看到部分 Intel CPU 配置短缺,包括高端 Xeon",HP、Dell、Asus 也都报告供需缺口扩大。
2. 服务器涨幅是消费的 2 倍——AI 拉高 Xeon 是真实的
| 服务器 Xeon | |||
| 服务器 Xeon(计划再涨) | |||
| 消费 Core / Core Ultra |
服务器涨幅是消费的两倍,意味着 Xeon 的涨价不能用"通胀"或"成本上升"来解释——是 AI 需求的结构性溢价。Intel 最新财报也承认:营收增长主要来自 ASP 提升,出货量反而下滑。"量跌价涨"是典型卖方市场信号。
(对比 2023 年去库存低谷期,那时候是"量升价跌"——Intel 降价守份额、AMD 降价抢份额的买方市场。从买方市场切到卖方市场,是这一轮和过去最不一样的地方。)
3. 高端 AI Xeon 单价是普通 Xeon 的 2-3 倍
AI 服务器用的 Xeon 高配、EPYC Turin 比普通服务器 CPU 贵 2-3 倍。随着 AI 服务器占比从 16% 继续提升,行业整体 ASP 还会被产品结构变化进一步拉高——这是叠加在第 2 点"主动涨价"之上的额外结构性力量。
量价叠加效应(行业 TAM 构成):
CPU 板块的收入增长来自两个力量相乘:
| 合计(行业 TAM 增长) | 约 2.5-2.6 倍 |
AMD 官方指引 2025 年 TAM 260 亿 → 2030 年 1200 亿(4.6 倍)比这个推算更乐观,差距来自 AMD 假设自身份额从 28% → 40%+。但 AMD 和 ARM(预测 1000 亿)都是"扩张方",需要打高数字支持估值故事;独立第三方 The Next Platform 的预测(600 亿,CAGR 18%)反而和我们最接近。Intel 作为龙头没有给出公开 TAM 预测——业绩好但口径保守。AMD 个股逻辑和份额博弈见另一篇单独讨论。
当前股价反映了多少?
股价表现:
Intel 年内 +200%+(股价从 20 美元附近 → 60+ 美元) AMD 一年 +320%(股价约 420 美元) 两家都创出历史新高
市场隐含预期:
Intel 和 AMD 当前的市值和估值,大致已经把未来 2-3 年的 TAM 扩张(即从 260 亿涨到约 600 亿的那段)反映进去。也就是说:
如果 2030 年 TAM 真的能到 1200 亿美元,从今天算还有约翻倍空间 但这需要 4-5 年时间兑现 年化回报率约 15-18%
关键风险:
短期任何一个季度"兑现不及预期"都会触发回调。Intel Q1 2026 财报虽然超预期,但已经开始进入"逐季验证"模式——以后每一次不及预期都会被放大。
综合:CPU 主线的真实图景
| 量 | |
| 价 | |
| TAM 兑现度 | |
| 短期进场风险 |
**一句话总结:CPU 主线的长期空间是真实的,但短期涨幅已经透支了大部分预期。最好的买点不是现在,而是下一次 10-15% 的回调
五、存储主线:两端受益 + 价格弹性 + 估值剪刀差
存储是唯一一条同时受益于 GPU 链和 CPU 链的赛道。
量的结构:双轮驱动,体量差异大
存储需求来自两端:
- HBM(来自 GPU 链)
:单位利润极高,但总容量相对小。2026 年全球 HBM 出货约 3200 PB - DDR5(来自 CPU 链)
:单位利润低,但总体量是 HBM 的约 10 倍。2026 年服务器 DDR5 出货约 30 EB
两者的关系不是"谁更重要",而是利润结构互补:HBM 贡献利润率,DDR5 贡献营收基数。对存储厂商来说,GPU 链给毛利率,CPU 链给收入规模——这就是"双轮驱动"的实际含义。
更关键的是,HBM 产能扩张会挤压 DDR5 产能(同一条 DRAM 产线的产能分配是零和的),导致 DDR5 也出现供给紧张和涨价。两端互相强化,而非互相替代。
价格弹性:单季度涨幅创历史
量的增长之外,存储还有价格弹性:
DRAM 合约价 Q1 2026 环比 +90-95%(创现代内存市场单季度涨幅纪录) TrendForce 预计 Q2 再涨 58-63% 32GB DDR5 模组从 149 美元跳到 239 美元 高端 DDR5 模组现货价是危机前的 3-5 倍
美光 Q2 FY2026 营收 239 亿美元、同比 +196%,毛利率飙至 75%,下季度指引毛利率 81%。海力士 Q1 营业利润率 72%。这种利润弹性是 GPU 和 CPU 都做不到的——GPU 单价已经很贵(涨不了多少),CPU 是成熟大宗商品,只有存储在上行周期能出现"营收翻倍、利润率从 30% 跳到 75%"这种极端运营杠杆。
2026-2028 的利润是否锁定?
回答这个问题需要过三关:
第一关:HBM 能不能快速扩产?
不能。HBM 扩产有三个物理瓶颈:
TSV(硅通孔)堆叠良率:8-16 层 DRAM die 堆叠,层数越多良率越低,不是砸钱就能解决的工艺问题 CoWoS 封装产能:台积电独家,从 3.5 万片/月扩到 13-15 万片/月已经是极限速度 洁净室建设周期:从投资到产能释放需要 2-3 年
美光管理层明确说:行业产能约束预计持续到至少 2028 年下半年,新产能才能有意义地缓解。海力士说得更直接:"客户未来三年的 HBM 供应请求已经远远超过我们的生产能力"(HBM 销售负责人 Ki Tae Kim 原话)。
第二关:需求能不能跑掉?(替代性 + 合约锁定)
HBM 有没有替代品?短期没有。 CXL 等新型内存方案至少 3-5 年才可能成熟,且定位不同 合约结构多强?3-5 年长协 + 预付款 + 价格下限——美光 HBM4 签了行业首个 5 年长约。微软/谷歌与海力士签三年长约引入价格下限,三星与微软谈判预付款超 100 亿,英伟达与海力士签 7490 亿美元长期 HBM 承诺 大厂会毁约吗?不会。 毁约 = 拿不到 HBM = 拿不到 GPU = AI 业务停摆。对微软、Google 来说,HBM 合约金额相对它们的 AI 收入是小数
第三关:三大厂会不会互相打价格战?
这是和 2018 年最关键的区别。2018 年三家疯狂扩产抢份额,产能一上来就打价格战,利润从顶部腰斩。这一轮:
海力士明确说采取"以盈利为核心的优化策略",不为量牺牲价格 美光 capex 250 亿+,但强调是"有纪律地扩产" 三家都在用长协锁利润,而不是用现货抢份额
三关都过了。结论:2026-2028 三年的利润高度可见。
那为什么不是"必赚"?
利润确定 ≠ 股价确定。风险不在基本面,而在以下几个层面:
风险 1:利润好,但"比预期好多少"才决定股价方向
美光 Q3 指引 335 亿美元。如果实际出来 330 亿——利润依然是天文数字,但低于市场预期 5 亿。这种情况下股价可能跌 10-15%。存储股的收益来源不是"利润好不好"(所有人都知道好),而是"利润比市场预期好多少"。海力士从 122 万韩元涨到 197 万韩元(+61%),已经把未来几个季度的"好"提前 price in 了一部分。
风险 2:宏观杀估值
如果 2027 年美联储加息或出现流动性收紧,所有高估值资产一起被压缩。海力士利润可以完全不变,PE 从 9 压到 6,股价跌 33%。基本面对,股价照样亏钱。
风险 3:涨了 10 倍之后的正常回撤
海力士这一轮已经涨约 10 倍。半导体股在上升趋势中 20-30% 的回调是常态(不需要任何基本面变化,纯粹是获利了结 + 仓位调整)。这不是"崩盘",但如果你在高点买入,需要承受这个波动。
风险 4:利润增速放缓的拐点
利润不会永远加速。从环比 +75% 变成环比 +20% 的那个季度,股价会提前 1-2 个季度反应。你不知道具体是哪个季度,市场也不知道——所以一旦合约价环比涨幅开始收窄(比如从 +60% 收窄到 +30%),股价可能先跌 20% 再确认方向。
存储主线的真实图景
基本面判断:三条主线里确定性最高
2026-2028 利润锁定(扩产瓶颈 + 合约锁定 + 无替代品 + 供给纪律) 利润还在逐季加速(美光 Q2 营收 239 亿 → Q3 指引 335 亿) 运营杠杆最大(毛利率从 30% 跳到 75-81%,这种弹性 GPU 和 CPU 都做不到)
股价判断:确定性已经被定价了一大部分
涨幅已经巨大(美光一年 7 倍、海力士财报后 +61%) 余收益来源 = "利润比预期更好" 或 "高利润持续时间比预期更长" 风险来源 = 宏观杀估值、利润增速拐点、正常技术性回调
一句话总结:存储是"基本面最确定但股价波动可能最大"的板块。买入的逻辑不是"便宜",而是"利润还在加速且加速期比市场定价的更长"。核心跟踪指标是 DRAM 合约价环比涨幅——只要这个数字还在扩大或维持高位,趋势就没结束。
六、三种风险偏好的选择
保守型投资人(优先稳定,厌恶回撤):
- 推荐:分散配置 GPU + 存储
理由:两者确定性最高,GPU 是趋势龙头,存储是"两端受益 + 长合约保护" 做法:各占 40-50%,剩余观望 不推荐单押 CPU:短期波动可能更大
平衡型投资人(愿承担中等风险博更高回报):
- 推荐:CPU 等回调 + 存储持有
理由:CPU 长期空间最大但入场时机不好,等 10-15% 回调能显著改善风险收益比 做法:当前持有存储观察位,设定 CPU 回调后的加仓价位 注意:CPU 板块轮动节奏和存储不完全同步,可以互相对冲
进取型投资人(能承担高波动,追求超额收益):
- 推荐:下游的上游——封装设备 + 高端 DDR5 模组
理由:下游三条主线都已定价,但钱往上游流的传导还没走完 风险:流动性和研究门槛都高,需要跟踪 book-to-bill 等行业指标
进取型方向里,封装上游需要分清两层瓶颈——对应两批不同的受益公司:
瓶颈一:HBM 堆叠
在海力士/美光/三星工厂内完成:把 8-16 层 DRAM die 用 TSV(硅通孔)堆叠起来,通过 TCB(热压键合)或 Hybrid Bonding 连接 受益设备供应商:ASMPT(TCB 龙头)、BESI(Hybrid Bonding 龙头)
瓶颈二:CoWoS 集成
在台积电工厂内完成:把堆好的 HBM 成品和 GPU die 一起装到一块硅中介层上 受益材料供应商:ABF 载板(Ibiden、Unimicron)、硅中介层、CMP 抛光液
两层瓶颈必须同步扩产整条链才能放量——HBM 造出来也要靠 CoWoS 才能装到 GPU 旁边。台积电 CoWoS 月产能从 2024 年底的 3.5 万片扩到 2026 年底的 13-15 万片(4 倍),HBM 堆叠产能同步扩张,两批设备供应商都在受益。
检测环节也值得关注:HBM 层数越多良率越低,Camtek(HBM 光学检测)、Advantest(HBM 测试设备)的需求会随之爆发。
七、核心跟踪信号
每条主线一个核心指标,只要这个指标方向没变,趋势就没结束:
- GPU
:台积电 CoWoS 月产能数据(产能增速 = GPU 出货增速天花板) - CPU
:服务器 CPU ASP 环比变化(只要还在涨,卖方市场就没结束) - 存储
:DRAM 合约价环比涨幅(只要维持高位,利润加速就没见顶)
反向信号(出现任何一个都需要重新评估):
四大厂 capex 指引下修 DRAM 合约价环比转负 三大存储厂中任何一家开始激进扩产抢份额
夜雨聆风