乐于分享
好东西不私藏

AI半导体产业链分析中篇-利润去哪了?

AI半导体产业链分析中篇-利润去哪了?

引言:

上篇我们搞清楚了AI Capex的钱流向哪六层——从应用层到设备层,每一层都有人在分这块蛋糕。但六层里,谁拿走了最多的利润?谁只是过了一道手?谁看起来很忙、实际上赚的是辛苦钱?这篇聚焦产业链L4-L6层(芯片设计→芯片制造→芯片设备),用三步分析框架回答一个核心问题:AI产业链的增量利润,到底流向了哪里?

AI加速器市场格局

在上篇的订单流分析中,以L4芯片设计层的几家公司为例,可以看到不同的芯片上下游合作方差异较大, 因此在分析产业链公司时, 得先考虑芯片终端市场格局。
AI加速器的终端厂牌主要包括传统芯片厂商和ASIC(根据需求定制),前者有Nvidia GPU、AMD MI, 后者有Google TPU、Amazon Trainium。  AI加速器的使用场景包括训练和推理, 其中训练环节由于反向传播和更新权重,对与开发环境和调试工具、大规模GPU通信的要求更高。 因此分为两个场景、四个厂牌分别看待。

2026年, 各芯片厂牌的预计市场份额

如下图(收入总额只考虑了美股Big5 Hyperscaler 2026年AI Capex Guidance)。

2027-2028年, 各芯片厂牌的市场份额预测

虽然上述四家芯片厂商,都宣称具备训练+推理能力。 但是Google TPU和Amazon Trainium均和自家云服务生态绑定, 且目前在训练场景, CUDA的软件生态和NVLink的系统级壁垒仍然是最强的, 且不捆绑云服务。 因此在预测未来市场份额时,ASIC对于Nvidia的替代强度,推理和训练场景不一样。
熊市假设(ASIC进展缓慢+推理市场增长慢): Nvidia守住份额,但前期AI Capex可能被证明ROIC低, 导致订单向设备和制造层传导压力。
牛市假设(ASIC生态成熟 + 推理需求旺盛): Nvidia市占率下滑,利润率受损,但绝对收入增长。 其他ASIC厂商发展迅猛。
注意: 上述分析更多的意义是定性而非定量,数字仅供参考不必深究。 巴菲特说过: “模糊的正确胜过精确的错误”。

本文主题

首先要回答的一个问题: 在一条产业链中,不是所有环节都能等比例受益的。增量需求带来的利润最终会集中在哪个环节?也就是回答**“哪里最赚钱” 以及 “能否持续赚钱”**?
要搞懂这个问题需要系统化的思维方式进行拆解,我把它分为了三步:
绘制价值链, 找到“收税王”。
分析供需瓶颈,判断超额收益窗口。
思考未来,利润会如何迁移。

本文主旨

首先要回答的一个问题: 在一条产业链中,不是所有环节都能等比例受益的。增量需求带来的利润最终会集中在哪个环节?也就是回答“哪里最赚钱” 以及 “能否持续赚钱”?

Step 1:绘制价值链的利润分布图

这部分我想计算一个关键指标:每1美元终端AI芯片收入在各环节的利润分配
做法是,用公司的订单流关系和各公司财报中的收入和毛利润数据,结合行业拆解报告,构建一张完整的利润分配瀑布图,看看利润的集中情况。
图:Nvidia GPU(以H100为例)的利润分配瀑布图
→ 核心结论:Nvidia 独占全链 84% 的利润,其余所有制造和设备环节合计仅分得 16%。这不是垄断定价,而是 CUDA 生态锁定带来的结构性溢价。
图: Google TPU的利润分配瀑布图
→ 核心结论:自研 ASIC 模式下,设计溢价消失,TSMC 成为外部供应链中利润最大的受益方(约占 40-45%),但整体采购成本比 Nvidia GPU 低约 80%。
图: AMD (以MI 300x为例)的利润分配瀑布图
→ 核心结论:AMD 毛利率 52%、利润集中度 61%,虽也是设计层主导,但与 Nvidia 的差距显著——定价权来自”比 Nvidia 便宜”而非”不可替代”。
核心发现:

一、两种商业模式下的利润分配结构

模式
代表产品
终端售价(ASP)
设计层利润占比
制造层利润占比
设备层利润占比
外售GPU(Nvidia)
H100
~$30,000
84%

(Nvidia独占)
~10%
~6%
外售GPU(AMD)
MI300X
~$12,500
61%

(AMD)
~26%
~13%
自研ASIC(Google)
TPU
~$6,000
15-18%(Broadcom服务费)
40-45%

(TSMC)
12-15%

二、各环节”收税能力”三档分类

档位
公司
毛利率
定价权来源
核心风险
第一档:强力收税者
Nvidia
73%
CUDA生态锁定,软件护城河
推理端ASIC持续侵蚀
Broadcom(ASIC设计)
65%
ASIC设计不可绕过的枢纽
客户集中(Google占比过大)
KLA
60%
检测recipe与制程深度绑定,转换成本极高
周期性,但服务收入~35%提供缓冲
ASML【特殊】
52%
EUV全球唯一供应商,single point of failure
毛利率受制于光刻机本身制造成本;目标2030年升至56-60%
第二档:有壁垒但受限
TSMC(代工)
55%
先进制程≤7nm份额>80%
年均CapEx $32B+,重资产压低ROIC
SK Hynix(HBM)
55%
当前HBM市占>50%,良率领先
底层仍是DRAM工艺,Samsung追赶窗口12-24个月
AMD
52%
“比Nvidia便宜但性能接近”的替代选项
定价权受制于Nvidia,Nvidia降价则空间被压缩
第三档:做加工者
Lam/AMAT/TEL
44-47%
设备寡头,有技术壁垒
三者间可部分替代,任一消失6-12个月内可填补
TSMC CoWoS(封装)
42%
当前供不应求带来暂时定价权
产能扩张+Intel EMIB潜在替代,中期毛利率承压
Samsung/Micron(存储)
42-45%
HBM暂时溢价
本质仍是周期性产品,commodity DRAM周期底部可跌至<20%
Amkor/基板供应商
18-20%
客户转单容易,几乎零定价权
第一档的共同特征:定价权不依赖供需缺口,来自”替你做你做不了的事”——Nvidia的CUDA、Broadcom的ASIC设计、KLA的检测recipe、ASML的EUV光刻。
第三档的共同特征:客户付钱是因为需要这道工序,不是因为只有你能做。即使在AI超级周期中,毛利率也没有显著提升。

Step 2:分析供给弹性——瓶颈在哪里,能持续多久

为什么要分析供需平衡和预测时间线?因为对于制造业来说,生产供给是有物理层面的约束,正常情形下,根据需求排产从而使得利润率维持在一个稳定的状态,当供需平衡被打破,而公司产品是产业链绕不过的一环, 且即使竞争对手也无法补足的,就能通过“涨价”获取超额利润。 超额利润 = 供需缺口 × 持续时间。
如何判断”短期瓶颈”和”结构性瓶颈”的核心步骤。方法是分析每个环节的产能扩张时间线扩产所需的前置约束关键方法:对每个瓶颈环节,画一条”现有产能 + 已宣布扩产产能”的时间线,叠加”需求预测”曲线。两条曲线的交叉点就是瓶颈缓解的时间点。交叉点越远,瓶颈越持久,该环节的超额利润窗口越长。  还需要考虑扩产的前置约束链,因为瓶颈是串联的,最慢的一环决定整体节奏。

第一步:识别供需瓶颈在哪里

沿着 L4→L5→L6 的订单流,逐环节检查”当前需求是否超过供给”,筛选出存在实质性供需缺口的环节:
L4 芯片设计层——不存在产能瓶颈。芯片设计是智力密集型而非资本密集型,Nvidia/AMD/Broadcom/Marvell 的设计产出不受物理产能限制。它们的出货瓶颈来自下游制造,而非自身设计能力。排除。
L5 晶圆代工(TSMC 先进制程)——存在紧张但非硬缺口。TSMC N2/N3 产能 2026 年满载售罄,但 TSMC 有明确扩产路径且历史上一直能按期交付。需要分析。
L5 先进封装(TSMC CoWoS)——存在明确供需缺口。2024-2025 年是全链最紧的瓶颈,需求约为产能的 2 倍。需要分析。
L5 HBM 存储——存在严重供需缺口。三大厂商 2026 年产能全部售罄,Micron 只能满足 55-60% 客户需求。需要分析。
L6 ASML EUV 光刻——当前不是最紧绷的约束点,但是全链中最不可替代的节点,交期已拉长至 12-18 个月。需要分析。
L6 其他设备(Lam/AMAT/TEL/KLA)——不存在产能瓶颈。多供应商格局,交期 6-12 个月,彼此间可部分替代。排除。
筛选结果:四个瓶颈环节需要逐一分析——CoWoS 封装、HBM 存储、先进制程代工、ASML EUV。

第二步:分析需求/产能与超额利润窗口

瓶颈一:TSMC CoWoS 先进封装
瓶颈二:HBM 高带宽存储
瓶颈三:TSMC 先进制程 (N2/N3)
瓶颈四:ASML EUV 光刻

第三步: 瓶颈程度排序(超额利润 = 供需缺口 × 时间):

排序
环节
当前缺口率
潜在竞争格局影响
交叉点
超额利润窗口
1 HBM 存储
~40%(Micron 仅满足 55-60% 客户需求;GS 预测 2026DRAM 缺口 4.9%)
Samsung HBM4 良率追赶中(已签 AMD MOU),2027H1 可能通过 Nvidia 验证 → SK Hynix 份额从 53% 降至 45-48%。但三家合计总产能不变,竞争只重分份额不缩短整体瓶颈。Nvidia 刻意培育二供进一步加速份额迁移
2028H1

(不因竞争提前——新 fab 是唯一增量来源)
整体瓶颈:~24 个月

。但 SK Hynix 的领先者溢价窗口更短——约 12-15 个月(到 2027Q1-Q2,Samsung 追赶开始侵蚀定价权)
2 ASML EUV
交期 12-18月;backlog €380 亿+;年增仅 +5-8 台 vs 需求增速 +12-15 台
无竞争者

。中国自研 EUV 原型机(Reuters 2025 年报道)预计 2028-2030 才能产出芯片,且精度/产能与 ASML 差距巨大。5 年内无实质性竞争威胁
无交叉点

(缺口持续扩大)
永久性定价权

。ASML 目标 2030 年毛利率 56-60%(vs 当前 51-53%),竞争格局支持这一目标
3 CoWoS 先进封装
~15-20%(产能快速爬坡中,2024H2 峰值曾达 ~50%)
Intel EMIB 正在分流 ASIC 需求(Google TPUv9 计划 2027 试用 EMIB,Marvell/MediaTek 评估中)→ CoWoS 总需求线下移约 5-10%。但高端 CoWoS-L(Nvidia/AMD 需要的)不受 EMIB 影响——EMIB 只能替代 CoWoS-S 级别的 ASIC 封装。Samsung I-Cube 产能和良率远不及 TSMC,暂不构成实质分流
2026Q4-2027Q1

(比修正前提前 1-2 个季度,因 EMIB 分流 ASIC 封装需求)
整体 CoWoS:~9-12 个月

)。高端 CoWoS-L:~15 个月(不受 EMIB 影响,仍由 TSMC 独占)
4
TSMC 先进制程 (N2/N3)
~0-5%(N2/N3 满载售罄,但无硬短缺)
Samsung N2 月产能仅 21K vs TSMC 100K,追赶窗口 3-5 年;Intel 18A 存在良率不确定性。TSMC 先进制程竞争格局将长期由 TSMC 主导。
2026Q2-Q3(N3 扩产如期交付,缺口缓解)
~6-9 个月(短期瓶颈,非结构性;超额利润来源是定价权而非供需缺口,长期稳定)

Step 3:追踪利润迁移方向——利润在向哪个环节转移?

Step 1 告诉我们”当下利润集中在哪里”,Step 2 告诉我们”短期窗口内谁能拿到超额利润”,但这两步都是静态快照。而产业链的真正风险和机会,往往藏在利润的流动方向里——今天的”收税王”可能五年后变成”做加工的”,而今天的”加工者”也可能凭借一次工艺突破跃升为新的瓶颈节点。
产业链中的利润分配不是静态的,它在持续迁移。我们没有办法精确预测迁移终点,但可以通过一些可观测信号来判断迁移的方向和速度,从而提前布局在即将承接利润的环节,避开即将失去定价权的环节。
本部分尝试用两个核心信号 + 三张财务趋势图(毛利率、CapEx/收入比、ROE),交叉验证当前产业链的利润迁移方向。
信号一:定价权的转移——谁在涨价而客户无法拒绝?
判断逻辑:当某个环节开始涨价,而下游客户无力谈判、只能接受时,说明该环节的议价地位在强化,利润正在向它流入。反之,一个环节如果长期无法转嫁成本上涨,说明它在产业链中的地位正在弱化。
当前最典型的例子是 HBM。SK Hynix 的 HBM3E 在 2024-2025 年连续涨价,且涨幅远高于其底层 DRAM 晶圆的成本上升幅度——超出部分,本质上就是从下游客户 Nvidia “截留”下来的利润。Nvidia 之所以能承受这次涨价,是因为它可以把 HBM 成本转嫁给终端客户(云厂商)——H100/H200 的售价在同期也提升了 15-20%。
但这条转嫁链条不是无限的。一旦云厂商(Meta、Microsoft、Google、AWS)开始对 GPU 单价敏感,挤压就会向上传导——先压缩 Nvidia 的毛利率,再反过来压缩 HBM 的涨价空间。这是为什么要密切关注Hyperscaler 的 AI CapEx/收入比——这是整条产业链定价权传导的终点和真正的压力源。
另一个反向例子是 Amkor 等基板供应商。在 AI 超级周期中,其毛利率几乎没有提升,维持在 18-20%。这说明即使身处”风口”,缺乏不可替代性的环节依然赚不到超额利润,客户不会”自愿”给它加价
信号二:CapEx 强度的变化——谁在”花钱保位置”,谁在”轻装收税”?
判断逻辑:如果一个环节必须持续大幅加码资本开支才能维持既有市场地位(TSMC 每年 CapEx 超 300 亿美元、SK Hynix 每年 150 亿美元+),而另一个环节用极低的资本投入就能赚取高利润(Nvidia 作为 Fabless 公司,CapEx/收入比常年低于 5%),那么长期来看,利润必然会向轻资产环节集中
原因很简单:重资产环节即使毛利率不低,高额折旧和持续再投资会吃掉大量自由现金流,真正的股东回报率(ROIC、ROE)被压低;而轻资产环节的每一分毛利都能更高比例地转化为现金流。
做法:构建一张”毛利率 + CapEx/收入比 + ROE”的三维比较表,覆盖全产业链上 10+ 家核心公司,按季度持续更新,通过三个维度的趋势变化交叉验证利润流向。具体的判断规则:
毛利率上升 + CapEx 强度下降 + ROE 提高→ 利润正在向这个环节集中(理想的”收税王”画像)
毛利率稳定但 CapEx 强度持续上升 + ROE 下降→ 这个环节在”花钱保位置”,长期股东回报率可能不如表面利润率看起来那么好
毛利率下降 + CapEx 强度上升→ 最危险的信号,利润正在流出该环节
下面逐项来看产业链主要公司的三维画像。
分析1: 毛利率趋势— 谁在扩张利润
图:各公司季度毛利率趋势,2020-2025

→ 核心观察: Nvidia 的毛利率从 AI 周期前的 60% 左右飙升至 75%+,且领先身位持续扩大;Broadcom、KLA 的毛利率稳步抬升;TSMC 从 50% 左右稳步提升至 55%+,但绝对值仍比设计层低 15-20 个百分点;而设备厂商(Lam/AMAT/TEL)、存储厂商(Samsung/Micron 在 HBM 之外)毛利率几乎没有受益于 AI 周期。

这张图的核心信号是:AI 增量需求并没有等比例地抬高所有环节的毛利率,而是高度集中地流向了定价权强的少数公司。这印证了 Step 1 中的”收税王”框架——能涨价的环节才是真正的赢家。
分析2: CapEx/收入比趋势—谁在烧钱,谁在收钱?
图: CapEx/收入比季度趋势

→ 核心观察: Fabless 设计公司(Nvidia、AMD、Broadcom)的 CapEx/收入比常年低于 5%,AI 周期中甚至有所下降(因为收入爆发而 CapEx 没同步增加);TSMC 的 CapEx/收入比长期在 40-45%,SK Hynix 在 30-35%,ASML 在 5-8%(设备厂本身也是相对轻资产)。

值得警惕的趋势:TSMC 的 CapEx 绝对值在 2024-2025 年继续攀升(年均 320 亿美元+),但其毛利率提升速度并没有等比例加快。这意味着,尽管 TSMC 在先进制程和 CoWoS 上近乎垄断,它依然要用巨额资本开支”保位置”,而不是像 Nvidia 那样坐着收税。这也解释了为什么 TSMC 被归入 Step 1 中的”第二档”,而不是”第一档”。
相对地,ASML 是设备环节中的异类:CapEx/收入比常年低于 8%,却拥有全链最强的不可替代性——这是为什么它在新的分档中被单独列出。
分析3: ROE趋势
图:各公司 ROE 季度趋势

→ 核心观察: Nvidia 的 ROE 在 AI 周期内出现断层式飙升,从 30% 左右跃升到 100%+;Broadcom 的 ROE 也显著抬升;而 TSMC 的 ROE 虽有提升(从 25% 到 30% 左右),幅度远小于设计层公司;SK Hynix 的 ROE 波动较大(受存储周期影响),HBM 只带来了一个阶段性窗口,还没有彻底改写它的周期性特征。

ROE 是毛利率和 CapEx 强度的综合结果。它印证了上面两张图的观察——毛利率高且 CapEx 强度低的公司(Nvidia、Broadcom),才是产业链中真正为股东创造超额回报的”利润池”。
分析4:综合对比
→ 核心结论:
右上角象限(高毛利率 + 低 CapEx 强度 + 高 ROE):Nvidia、Broadcom、KLA——这是产业链中最优质的利润池,也是定性上的”强力收税者”被定量数据反复验证的结果。
中部象限(中毛利率 + 高 CapEx 强度 + 中等 ROE):TSMC、ASML、SK Hynix——它们有定价权,但为了维持地位必须持续重投入,股东回报被稀释。
左下角象限(低毛利率 + 中等 CapEx 强度 + 低 ROE):Lam/AMAT/TEL、Amkor、Samsung(存储业务)——纯加工者,AI 周期对它们的实质改善有限。

结语:三个框架,找到你的答案

回到开篇的问题:AI 产业链的增量利润,最终流向了哪里?
三步分析给出了清晰的答案:
期看供需缺口(Step 2)——HBM 和 CoWoS 是当前最紧的瓶颈,SK Hynix 和 TSMC 正在收割这一轮的缺口红利,但窗口有限(12-24 个月)。
中长期看定价权(Step 1 + Step 3)——真正能持续赚钱的,是那些不依靠供需缺口,而靠”技术 / 生态不可替代”建立定价权的环节:Nvidia(CUDA)、Broadcom(ASIC 设计服务)、ASML(EUV 独家)、KLA(检测 recipe)。三维财务数据验证了它们作为”利润聚集地”的事实。
迁移方向上最值得警惕的趋势有两个:
推理市场崛起 + ASIC 渗透,可能逐步从 Nvidia 处转移一部分利润到 Broadcom 和 TSMC——前者承接 ASIC 设计服务费,后者承接 ASIC 制造。这意味着 Broadcom 在未来 2-3 年内可能是最受益的”位置切换者”。
Hyperscaler 的 AI CapEx ROIC 压力是整条产业链的最终风向标。一旦云厂商开始觉得”AI 投入的回报不够”,压力会从终端一路反向传导:先压 Nvidia,再压 HBM 和 CoWoS,最后压制造和设备端。监控 Hyperscaler 的 AI 收入/CapEx 比值,是整条产业链最重要的领先指标。
投资的终极逻辑只有一句话:买定价权,不买产能。产能可以扩张,定价权是稀缺的。

名词解释:

  • HBM(High Bandwidth Memory,高带宽内存,通过将多层 DRAM 芯片垂直堆叠并直连 GPU,大幅提升数据传输速度)
  • CoWoS(Chip on Wafer on Substrate,台积电的旗舰先进封装技术,将 GPU 芯片与 HBM 封装在同一基板上)
  • EMIB(Embedded Multi-die Interconnect Bridge,Intel 的嵌入式多晶圆互连桥接技术,是 CoWoS 的潜在竞争方案)
  • ROIC(Return on Invested Capital,投入资本回报率,衡量企业利用资本产生利润的效率)

免责声明

本文所有内容仅供信息参考与学习交流,不构成任何投资建议或投资邀约。文中涉及的个股、行业分析、市场预测及数据均来源于公开资料。
股市有风险,投资需谨慎。任何投资决策均应基于您自身的独立判断、风险承受能力及财务状况。