AI半导体产业链分析中篇-利润去哪了?

引言：

上篇我们搞清楚了AI Capex的钱流向哪六层——从应用层到设备层，每一层都有人在分这块蛋糕。但六层里，谁拿走了最多的利润？谁只是过了一道手？谁看起来很忙、实际上赚的是辛苦钱？这篇聚焦产业链L4-L6层（芯片设计→芯片制造→芯片设备），用三步分析框架回答一个核心问题：AI产业链的增量利润，到底流向了哪里？

AI加速器市场格局

在上篇的订单流分析中，以L4芯片设计层的几家公司为例，可以看到不同的芯片上下游合作方差异较大，因此在分析产业链公司时，得先考虑芯片终端市场格局。

AI加速器的终端厂牌主要包括传统芯片厂商和ASIC(根据需求定制)，前者有Nvidia GPU、AMD MI，后者有Google TPU、Amazon Trainium。 AI加速器的使用场景包括训练和推理，其中训练环节由于反向传播和更新权重，对与开发环境和调试工具、大规模GPU通信的要求更高。因此分为两个场景、四个厂牌分别看待。

2026年，各芯片厂牌的预计市场份额

如下图（收入总额只考虑了美股Big5 Hyperscaler 2026年AI Capex Guidance）。

2027-2028年，各芯片厂牌的市场份额预测

虽然上述四家芯片厂商，都宣称具备训练+推理能力。但是Google TPU和Amazon Trainium均和自家云服务生态绑定，且目前在训练场景， CUDA的软件生态和NVLink的系统级壁垒仍然是最强的，且不捆绑云服务。因此在预测未来市场份额时，ASIC对于Nvidia的替代强度，推理和训练场景不一样。

熊市假设（ASIC进展缓慢+推理市场增长慢）： Nvidia守住份额，但前期AI Capex可能被证明ROIC低，导致订单向设备和制造层传导压力。

牛市假设（ASIC生态成熟 + 推理需求旺盛）： Nvidia市占率下滑，利润率受损，但绝对收入增长。其他ASIC厂商发展迅猛。

注意：上述分析更多的意义是定性而非定量，数字仅供参考不必深究。巴菲特说过： “模糊的正确胜过精确的错误”。

本文主题

首先要回答的一个问题：在一条产业链中，不是所有环节都能等比例受益的。增量需求带来的利润最终会集中在哪个环节？也就是回答**“哪里最赚钱” 以及 “能否持续赚钱”**？

要搞懂这个问题需要系统化的思维方式进行拆解，我把它分为了三步：

绘制价值链, 找到“收税王”。

分析供需瓶颈，判断超额收益窗口。

思考未来，利润会如何迁移。

本文主旨

首先要回答的一个问题：在一条产业链中，不是所有环节都能等比例受益的。增量需求带来的利润最终会集中在哪个环节？也就是回答“哪里最赚钱” 以及 “能否持续赚钱”？

Step 1：绘制价值链的利润分布图

这部分我想计算一个关键指标：每1美元终端AI芯片收入在各环节的利润分配。

做法是，用公司的订单流关系和各公司财报中的收入和毛利润数据，结合行业拆解报告，构建一张完整的利润分配瀑布图，看看利润的集中情况。

图：Nvidia GPU（以H100为例）的利润分配瀑布图

→ 核心结论：Nvidia 独占全链 84% 的利润，其余所有制造和设备环节合计仅分得 16%。这不是垄断定价，而是 CUDA 生态锁定带来的结构性溢价。

图： Google TPU的利润分配瀑布图

→ 核心结论：自研 ASIC 模式下，设计溢价消失，TSMC 成为外部供应链中利润最大的受益方（约占 40-45%），但整体采购成本比 Nvidia GPU 低约 80%。

图： AMD (以MI 300x为例)的利润分配瀑布图

→ 核心结论：AMD 毛利率 52%、利润集中度 61%，虽也是设计层主导，但与 Nvidia 的差距显著——定价权来自”比 Nvidia 便宜”而非”不可替代”。

核心发现：

一、两种商业模式下的利润分配结构

模式	代表产品	终端售价(ASP)	设计层利润占比	制造层利润占比	设备层利润占比
外售GPU（Nvidia）	H100	~$30,000	84% （Nvidia独占）	~10%	~6%
外售GPU（AMD）	MI300X	~$12,500	61% （AMD）	~26%	~13%
自研ASIC（Google）	TPU	~$6,000	15-18%（Broadcom服务费）	40-45% （TSMC）	12-15%

模式

代表产品

终端售价(ASP)

设计层利润占比

制造层利润占比

设备层利润占比

外售GPU（Nvidia）

H100

~$30,000

84%

（Nvidia独占）

~10%

~6%

外售GPU（AMD）

MI300X

~$12,500

61%

（AMD）

~26%

~13%

自研ASIC（Google）

TPU

~$6,000

15-18%（Broadcom服务费）

40-45%

（TSMC）

12-15%

二、各环节”收税能力”三档分类

档位	公司	毛利率	定价权来源	核心风险
第一档：强力收税者	Nvidia	73%	CUDA生态锁定，软件护城河	推理端ASIC持续侵蚀
	Broadcom（ASIC设计）	65%	ASIC设计不可绕过的枢纽	客户集中（Google占比过大）
	KLA	60%	检测recipe与制程深度绑定，转换成本极高	周期性，但服务收入~35%提供缓冲
	ASML【特殊】	52%	EUV全球唯一供应商，single point of failure	毛利率受制于光刻机本身制造成本；目标2030年升至56-60%
第二档：有壁垒但受限	TSMC（代工）	55%	先进制程≤7nm份额>80%	年均CapEx $32B+，重资产压低ROIC
	SK Hynix（HBM）	55%	当前HBM市占>50%，良率领先	底层仍是DRAM工艺，Samsung追赶窗口12-24个月
	AMD	52%	“比Nvidia便宜但性能接近”的替代选项	定价权受制于Nvidia，Nvidia降价则空间被压缩
第三档：做加工者	Lam/AMAT/TEL	44-47%	设备寡头，有技术壁垒	三者间可部分替代，任一消失6-12个月内可填补
	TSMC CoWoS（封装）	42%	当前供不应求带来暂时定价权	产能扩张+Intel EMIB潜在替代，中期毛利率承压
	Samsung/Micron（存储）	42-45%	HBM暂时溢价	本质仍是周期性产品，commodity DRAM周期底部可跌至<20%
	Amkor/基板供应商	18-20%	无	客户转单容易，几乎零定价权

第一档的共同特征：定价权不依赖供需缺口，来自”替你做你做不了的事”——Nvidia的CUDA、Broadcom的ASIC设计、KLA的检测recipe、ASML的EUV光刻。

第三档的共同特征：客户付钱是因为需要这道工序，不是因为只有你能做。即使在AI超级周期中，毛利率也没有显著提升。

Step 2：分析供给弹性——瓶颈在哪里，能持续多久

为什么要分析供需平衡和预测时间线？因为对于制造业来说，生产供给是有物理层面的约束，正常情形下，根据需求排产从而使得利润率维持在一个稳定的状态，当供需平衡被打破，而公司产品是产业链绕不过的一环，且即使竞争对手也无法补足的，就能通过“涨价”获取超额利润。超额利润 = 供需缺口 × 持续时间。

如何判断”短期瓶颈”和”结构性瓶颈”的核心步骤。方法是分析每个环节的产能扩张时间线和扩产所需的前置约束。关键方法：对每个瓶颈环节，画一条”现有产能 + 已宣布扩产产能”的时间线，叠加”需求预测”曲线。两条曲线的交叉点就是瓶颈缓解的时间点。交叉点越远，瓶颈越持久，该环节的超额利润窗口越长。还需要考虑扩产的前置约束链，因为瓶颈是串联的，最慢的一环决定整体节奏。

第一步：识别供需瓶颈在哪里

沿着 L4→L5→L6 的订单流，逐环节检查”当前需求是否超过供给”，筛选出存在实质性供需缺口的环节：

L4 芯片设计层——不存在产能瓶颈。芯片设计是智力密集型而非资本密集型，Nvidia/AMD/Broadcom/Marvell 的设计产出不受物理产能限制。它们的出货瓶颈来自下游制造，而非自身设计能力。排除。

L5 晶圆代工（TSMC 先进制程）——存在紧张但非硬缺口。TSMC N2/N3 产能 2026 年满载售罄，但 TSMC 有明确扩产路径且历史上一直能按期交付。需要分析。

L5 先进封装（TSMC CoWoS）——存在明确供需缺口。2024-2025 年是全链最紧的瓶颈，需求约为产能的 2 倍。需要分析。

L5 HBM 存储——存在严重供需缺口。三大厂商 2026 年产能全部售罄，Micron 只能满足 55-60% 客户需求。需要分析。

L6 ASML EUV 光刻——当前不是最紧绷的约束点，但是全链中最不可替代的节点，交期已拉长至 12-18 个月。需要分析。

L6 其他设备（Lam/AMAT/TEL/KLA）——不存在产能瓶颈。多供应商格局，交期 6-12 个月，彼此间可部分替代。排除。

筛选结果：四个瓶颈环节需要逐一分析——CoWoS 封装、HBM 存储、先进制程代工、ASML EUV。

第二步：分析需求/产能与超额利润窗口

瓶颈一：TSMC CoWoS 先进封装

瓶颈二：HBM 高带宽存储

瓶颈三：TSMC 先进制程 (N2/N3)

瓶颈四：ASML EUV 光刻

第三步：瓶颈程度排序（超额利润 = 供需缺口 × 时间）：

排序	环节	当前缺口率	潜在竞争格局影响	交叉点	超额利润窗口
1	HBM 存储	~40%（Micron 仅满足 55-60% 客户需求；GS 预测 2026DRAM 缺口 4.9%）	Samsung HBM4 良率追赶中（已签 AMD MOU），2027H1 可能通过 Nvidia 验证 → SK Hynix 份额从 53% 降至 45-48%。但三家合计总产能不变，竞争只重分份额不缩短整体瓶颈。Nvidia 刻意培育二供进一步加速份额迁移	2028H1 （不因竞争提前——新 fab 是唯一增量来源）	整体瓶颈：~24 个月。但 SK Hynix 的领先者溢价窗口更短——约 12-15 个月（到 2027Q1-Q2，Samsung 追赶开始侵蚀定价权）
2	ASML EUV	交期 12-18月；backlog €380 亿+；年增仅 +5-8 台 vs 需求增速 +12-15 台	无竞争者。中国自研 EUV 原型机（Reuters 2025 年报道）预计 2028-2030 才能产出芯片，且精度/产能与 ASML 差距巨大。5 年内无实质性竞争威胁	无交叉点（缺口持续扩大）	永久性定价权。ASML 目标 2030 年毛利率 56-60%（vs 当前 51-53%），竞争格局支持这一目标
3	CoWoS 先进封装	~15-20%（产能快速爬坡中，2024H2 峰值曾达 ~50%）	Intel EMIB 正在分流 ASIC 需求（Google TPUv9 计划 2027 试用 EMIB，Marvell/MediaTek 评估中）→ CoWoS 总需求线下移约 5-10%。但高端 CoWoS-L（Nvidia/AMD 需要的）不受 EMIB 影响——EMIB 只能替代 CoWoS-S 级别的 ASIC 封装。Samsung I-Cube 产能和良率远不及 TSMC，暂不构成实质分流	2026Q4-2027Q1 （比修正前提前 1-2 个季度，因 EMIB 分流 ASIC 封装需求）	整体 CoWoS：~9-12 个月）。高端 CoWoS-L：~15 个月（不受 EMIB 影响，仍由 TSMC 独占）
4	TSMC 先进制程 (N2/N3)	~0-5%（N2/N3 满载售罄，但无硬短缺）	Samsung N2 月产能仅 21K vs TSMC 100K，追赶窗口 3-5 年；Intel 18A 存在良率不确定性。TSMC 先进制程竞争格局将长期由 TSMC 主导。	2026Q2-Q3（N3 扩产如期交付，缺口缓解）	~6-9 个月（短期瓶颈，非结构性；超额利润来源是定价权而非供需缺口，长期稳定）

Step 3：追踪利润迁移方向——利润在向哪个环节转移？

Step 1 告诉我们”当下利润集中在哪里”，Step 2 告诉我们”短期窗口内谁能拿到超额利润”，但这两步都是静态快照。而产业链的真正风险和机会，往往藏在利润的流动方向里——今天的”收税王”可能五年后变成”做加工的”，而今天的”加工者”也可能凭借一次工艺突破跃升为新的瓶颈节点。

产业链中的利润分配不是静态的，它在持续迁移。我们没有办法精确预测迁移终点，但可以通过一些可观测信号来判断迁移的方向和速度，从而提前布局在即将承接利润的环节，避开即将失去定价权的环节。

本部分尝试用两个核心信号 + 三张财务趋势图（毛利率、CapEx/收入比、ROE），交叉验证当前产业链的利润迁移方向。

信号一：定价权的转移——谁在涨价而客户无法拒绝？

判断逻辑：当某个环节开始涨价，而下游客户无力谈判、只能接受时，说明该环节的议价地位在强化，利润正在向它流入。反之，一个环节如果长期无法转嫁成本上涨，说明它在产业链中的地位正在弱化。

当前最典型的例子是 HBM。SK Hynix 的 HBM3E 在 2024-2025 年连续涨价，且涨幅远高于其底层 DRAM 晶圆的成本上升幅度——超出部分，本质上就是从下游客户 Nvidia “截留”下来的利润。Nvidia 之所以能承受这次涨价，是因为它可以把 HBM 成本转嫁给终端客户（云厂商）——H100/H200 的售价在同期也提升了 15-20%。

但这条转嫁链条不是无限的。一旦云厂商（Meta、Microsoft、Google、AWS）开始对 GPU 单价敏感，挤压就会向上传导——先压缩 Nvidia 的毛利率，再反过来压缩 HBM 的涨价空间。这是为什么要密切关注Hyperscaler 的 AI CapEx/收入比——这是整条产业链定价权传导的终点和真正的压力源。

另一个反向例子是 Amkor 等基板供应商。在 AI 超级周期中，其毛利率几乎没有提升，维持在 18-20%。这说明即使身处”风口”，缺乏不可替代性的环节依然赚不到超额利润，客户不会”自愿”给它加价

信号二：CapEx 强度的变化——谁在”花钱保位置”，谁在”轻装收税”？

判断逻辑：如果一个环节必须持续大幅加码资本开支才能维持既有市场地位（TSMC 每年 CapEx 超 300 亿美元、SK Hynix 每年 150 亿美元+），而另一个环节用极低的资本投入就能赚取高利润（Nvidia 作为 Fabless 公司，CapEx/收入比常年低于 5%），那么长期来看，利润必然会向轻资产环节集中。

原因很简单：重资产环节即使毛利率不低，高额折旧和持续再投资会吃掉大量自由现金流，真正的股东回报率（ROIC、ROE）被压低；而轻资产环节的每一分毛利都能更高比例地转化为现金流。

做法：构建一张”毛利率 + CapEx/收入比 + ROE”的三维比较表，覆盖全产业链上 10+ 家核心公司，按季度持续更新，通过三个维度的趋势变化交叉验证利润流向。具体的判断规则：

毛利率上升 + CapEx 强度下降 + ROE 提高→ 利润正在向这个环节集中（理想的”收税王”画像）

毛利率稳定但 CapEx 强度持续上升 + ROE 下降→ 这个环节在”花钱保位置”，长期股东回报率可能不如表面利润率看起来那么好

毛利率下降 + CapEx 强度上升→ 最危险的信号，利润正在流出该环节

下面逐项来看产业链主要公司的三维画像。

分析1: 毛利率趋势— 谁在扩张利润

图：各公司季度毛利率趋势，2020-2025

→ 核心观察： Nvidia 的毛利率从 AI 周期前的 60% 左右飙升至 75%+，且领先身位持续扩大；Broadcom、KLA 的毛利率稳步抬升；TSMC 从 50% 左右稳步提升至 55%+，但绝对值仍比设计层低 15-20 个百分点；而设备厂商（Lam/AMAT/TEL）、存储厂商（Samsung/Micron 在 HBM 之外）毛利率几乎没有受益于 AI 周期。

这张图的核心信号是：AI 增量需求并没有等比例地抬高所有环节的毛利率，而是高度集中地流向了定价权强的少数公司。这印证了 Step 1 中的”收税王”框架——能涨价的环节才是真正的赢家。

分析2: CapEx/收入比趋势—谁在烧钱，谁在收钱？

图： CapEx/收入比季度趋势

→ 核心观察： Fabless 设计公司（Nvidia、AMD、Broadcom）的 CapEx/收入比常年低于 5%，AI 周期中甚至有所下降（因为收入爆发而 CapEx 没同步增加）；TSMC 的 CapEx/收入比长期在 40-45%，SK Hynix 在 30-35%，ASML 在 5-8%（设备厂本身也是相对轻资产）。

值得警惕的趋势：TSMC 的 CapEx 绝对值在 2024-2025 年继续攀升（年均 320 亿美元+），但其毛利率提升速度并没有等比例加快。这意味着，尽管 TSMC 在先进制程和 CoWoS 上近乎垄断，它依然要用巨额资本开支”保位置”，而不是像 Nvidia 那样坐着收税。这也解释了为什么 TSMC 被归入 Step 1 中的”第二档”，而不是”第一档”。

相对地，ASML 是设备环节中的异类：CapEx/收入比常年低于 8%，却拥有全链最强的不可替代性——这是为什么它在新的分档中被单独列出。

分析3: ROE趋势

图：各公司 ROE 季度趋势

→ 核心观察： Nvidia 的 ROE 在 AI 周期内出现断层式飙升，从 30% 左右跃升到 100%+；Broadcom 的 ROE 也显著抬升；而 TSMC 的 ROE 虽有提升（从 25% 到 30% 左右），幅度远小于设计层公司；SK Hynix 的 ROE 波动较大（受存储周期影响），HBM 只带来了一个阶段性窗口，还没有彻底改写它的周期性特征。

ROE 是毛利率和 CapEx 强度的综合结果。它印证了上面两张图的观察——毛利率高且 CapEx 强度低的公司（Nvidia、Broadcom），才是产业链中真正为股东创造超额回报的”利润池”。

分析4：综合对比

→ 核心结论：

右上角象限（高毛利率 + 低 CapEx 强度 + 高 ROE）：Nvidia、Broadcom、KLA——这是产业链中最优质的利润池，也是定性上的”强力收税者”被定量数据反复验证的结果。

中部象限（中毛利率 + 高 CapEx 强度 + 中等 ROE）：TSMC、ASML、SK Hynix——它们有定价权，但为了维持地位必须持续重投入，股东回报被稀释。

左下角象限（低毛利率 + 中等 CapEx 强度 + 低 ROE）：Lam/AMAT/TEL、Amkor、Samsung（存储业务）——纯加工者，AI 周期对它们的实质改善有限。

结语：三个框架，找到你的答案

回到开篇的问题：AI 产业链的增量利润，最终流向了哪里？

三步分析给出了清晰的答案：

期看供需缺口（Step 2）——HBM 和 CoWoS 是当前最紧的瓶颈，SK Hynix 和 TSMC 正在收割这一轮的缺口红利，但窗口有限（12-24 个月）。

中长期看定价权（Step 1 + Step 3）——真正能持续赚钱的，是那些不依靠供需缺口，而靠”技术 / 生态不可替代”建立定价权的环节：Nvidia（CUDA）、Broadcom（ASIC 设计服务）、ASML（EUV 独家）、KLA（检测 recipe）。三维财务数据验证了它们作为”利润聚集地”的事实。

迁移方向上最值得警惕的趋势有两个：

推理市场崛起 + ASIC 渗透，可能逐步从 Nvidia 处转移一部分利润到 Broadcom 和 TSMC——前者承接 ASIC 设计服务费，后者承接 ASIC 制造。这意味着 Broadcom 在未来 2-3 年内可能是最受益的”位置切换者”。

Hyperscaler 的 AI CapEx ROIC 压力是整条产业链的最终风向标。一旦云厂商开始觉得”AI 投入的回报不够”，压力会从终端一路反向传导：先压 Nvidia，再压 HBM 和 CoWoS，最后压制造和设备端。监控 Hyperscaler 的 AI 收入/CapEx 比值，是整条产业链最重要的领先指标。

投资的终极逻辑只有一句话：买定价权，不买产能。产能可以扩张，定价权是稀缺的。

名词解释：

HBM（High Bandwidth Memory，高带宽内存，通过将多层 DRAM 芯片垂直堆叠并直连 GPU，大幅提升数据传输速度）

CoWoS（Chip on Wafer on Substrate，台积电的旗舰先进封装技术，将 GPU 芯片与 HBM 封装在同一基板上）

EMIB（Embedded Multi-die Interconnect Bridge，Intel 的嵌入式多晶圆互连桥接技术，是 CoWoS 的潜在竞争方案）

ROIC（Return on Invested Capital，投入资本回报率，衡量企业利用资本产生利润的效率）

免责声明

本文所有内容仅供信息参考与学习交流，不构成任何投资建议或投资邀约。文中涉及的个股、行业分析、市场预测及数据均来源于公开资料。

股市有风险，投资需谨慎。任何投资决策均应基于您自身的独立判断、风险承受能力及财务状况。

引言：