HBM:韩国的AI内存霸权与即将到来的瓦解——从＂卡脖子＂到＂拆壁垒＂,一场关于带宽、定价权与技术路线的产业战争

核心结论

这不是一个关于地缘政治断供的故事。这是一个关于工艺、产能与定价权的纯商业现实。

AI算力的"燃油"——HBM（高带宽内存），其尖端制造工艺与核心产能，长期被韩国厂商（SK海力士、三星）掌控，形成了一道事实上的**"韩国阀"**：

配额制：稀缺产能意味着不是想买就能买

年为单位认证：HBM通过英伟达等GPU厂商认证周期长达1-2年，替换成本极高

30-40% BOM占比：HBM+先进封装占一张AI加速卡物料成本的最高四成，"架构税"由此而来

英伟达、微软、谷歌、Meta……所有AI巨头，无一不在为此付费。

但这道阀门正在松动。美光入局、光互连成熟、CXL内存池崛起、存内计算探索——技术绕行路径已清晰可见。

本文基于原文核心论点，换用新视角与语言，并补充更多数据与论据。

一、HBM是什么？为什么它成了AI的瓶颈？

1.1 从配角到主角：带宽叙事逆转

2018年英伟达发布Tesla V100，搭载HBM2，带宽达到900 GB/s。那一刻，业界第一次意识到：内存带宽可以比算力本身更值钱。

这背后是冯·诺依曼架构数十年的"内存墙"困境：

年份 CPU性能提升倍数内存带宽提升倍数
1970→2020 ~100万倍 ~1000倍

算力跑得太快，内存跟不上了。HBM通过3D堆叠、硅通孔（TSV）和极致封装，将带宽一次性提升近一个数量级——代价是成本与复杂度也飙升数倍。

1.2 HBM技术演进时间线

年份标准关键突破代表产品
2016 HBM2 4层堆叠，TSV量产 Nvidia Tesla P100
2018 HBM2 4-Hi堆叠，带宽900 GB/s Nvidia Tesla V100
2022 HBM3 12层堆叠，819 GB/s/栈 Nvidia H100 (Hopper)
2024 HBM3E 12层，>1.2 TB/s总带宽 Nvidia H200, H100升级
2026→ HBM3E+ 预计12层以上，工艺持续优化 B200, Rubin平台

数据来源：JEDEC标准文档（JESD238，2022年1月）、英伟达GTC发布会、SK海力士产品路线图。

二、"韩国阀"是如何形成的？

2.1 三条技术路线的淘汰赛（2019-2021）

SK海力士：押注MR-MUF（大规模回流模塑底部填充）

工程判断："最可能稳定量产"的方案，而非理论最优

用塑封材料的一致性，对抗热压工艺中的翘曲变量

工艺宽容度更高，良率更容易爬坡

三星：押注TC-NCF（热压非导电膜）

认为散热优势会在长期比赛中胜出

但工艺窗口更窄，材料均匀性要求苛刻

12层堆叠时热压均匀性控制困难，良率迟迟不达标

美光：战略观望后转向HBM3E

2020年判断：功耗会比峰值带宽更早成为天花板

选择跳过HBM3主战场，直接集中资源于基于1β制程的HBM3E

结果：SK海力士凭借MR-MUF的工艺稳定性，率先拿下12层堆叠量产能力。2022年6月HBM3量产，与英伟达Hopper架构（H100）批量交付节奏精准衔接。供应链齿轮从此咬死。

2.2 独家供应商的地位如何兑现

H100是AI大模型训练的引爆点。

2022年3月英伟达发布Hopper架构H100，HBM3成为标配。大模型军备竞赛正式点燃。

而SK海力士是彼时唯一的HBM3供应商。

财务表现最能说明问题：

2022年Q4起，SK海力士开始将HBM营收作为独立指标在财报电话会中披露

彼时公司整体仍处存储下行周期，但HBM业务线被分析师单独测算，增速指向三位数

2023-2024年，HBM业务占SK海力士总营收比例显著提升

据TrendForce等机构估算，2023年SK海力士在HBM3市场的份额约70-80%（为英伟达主要供应商），三星约10-15%（主要通过AMD MI300X等非英伟达平台），美光则凭借2024年的HBM3E认证获得剩余份额。

2.3 产能瓶颈：物理世界的约束

一座月产5万片（等效12英寸晶圆）HBM的先进工厂，从动工到量产需要18-24个月。关键的TSV刻蚀与封装设备交期更长达一年以上。

短缺不是炒作，是资本开支节奏与物理扩建周期的算术结果。

反映在市场端：搭载80GB HBM3的H100 GPU，渠道报价一度突破3万美元。而据多个第三方拆解分析（HPC Systems、TechInsights等），HBM及相关先进封装（CoWoS）占整卡BOM的30%-40%，是最大的单成本项。

这就是"架构税"的物质基础。

三、"三足鼎立"格局如何形成（2023-2025）

3.1 美光的破局

2023年Q4，美光HBM3E样品在英伟达实验室的能效测试中表现突出。2024年2月，美光官方宣布HBM3E量产，并通过英伟达认证，进入H200 GPU供应链。

美光CEO桑杰·梅赫罗特拉（Sanjay Mehrotra）在财报电话会中明确传递信号：我们押注的是下一个需求曲线，而非当前的市场格局。

美光能效优势来自其1β制程工艺，在功耗测试中优于三星初期样品。这让美光在云厂商（微软、谷歌）中获得了"第二供应商"席位。

3.2 三星的追赶

三星的12层HBM3E在2024年下半年至2025年初逐步通过英伟达验证，重新进入核心供应商名单。

其垂直整合模式（IDM）提供了独特优势：从DRAM晶圆、逻辑芯片到代工制造与先进封装，全链条可控，在响应高度定制化需求时具备敏捷性。

3.3 2024年格局数据

厂商 HBM3E状态英伟达平台供应份额估算
SK海力士率先量产，持续领先约50%-70%（B200等新平台）
三星 2024-2025年逐步通过验证约10%-20%，回升中
美光 2024年Q1通过认证约15%-25%

数据来源：TrendForce、Counterpoint Research等分析机构报告（2024）。

四、解构的信号：HBM"卡脖子"地位的终点

4.1 封装边界融化：光互连（CPO/COUPE）

台积电已明确：共封装光学（CPO）技术将于2026年进入量产阶段。该技术允许通过光纤将HBM堆叠放置在距离GPU数厘米的位置，单封装内可集成多达8个HBM堆叠，有效容量提升至当前约2倍。

这首先解决的是"封装海岸线"（package substrate routing limits）的物理限制——并非替代HBM，而是让HBM在更优的架构下发挥更大作用。

4.2 内存层级重构：CXL内存池

主流云厂商的推理架构正在向分层演进：

热层：HBM（最低延迟，最高带宽）

温层：CXL内存池（容量大，延迟可接受）

冷层：DDR5/CXL DRAM

学术测试数据显示，CXL内存池可将单服务器有效容量提升4-8倍，延迟增加约10-15%，但对吞吐优先的推理任务已可接受。

HBM从"唯一的答案"开始退守为"最快的那一层"。

4.3 存内计算（HBM-PIM）

SK海力士与三星均在ISSCC（国际固态电路大会）持续发布HBM-PIM（存内计算）研究成果。在向量搜索、特定矩阵运算等场景中，将计算下推至内存侧可获得10-100倍能效提升。

但挑战同样巨大：通用编程模型与工具链的成熟，仍是漫长的工程。

4.4 供应链"再地理化"

地缘政治加速了产能多极化：

SK海力士：美国印第安纳州先进封装厂，宣布投资约38.7亿美元，目标2028年前后形成2.5D/3D封装量产能力

美光：纽约工厂受益于《芯片与科学法案》（CHIPS Act）补贴加速建设

三星：在得克萨斯州已有晶圆厂布局

产能从"韩国制造+中国台湾封装"的单一管道，向多极化网络扩散。

五、AI模型自身开始"内存节食"

算法优化正在从另一个维度缓解HBM的饥渴：

MoE（混合专家）架构：推理时只激活约10-20%的参数，大幅降低内存带宽需求

4-bit量化：可将模型体积压缩60%以上

KV Cache压缩：技术持续演进，显著降低长上下文推理的内存占用

英伟达在Vera Rubin等新架构中，已开始设计可混合搭载多家HBM的封装方案——将供应链风险从"单一节点"分散，同时增加买家的议价能力。

六、本质：过渡期租金的逻辑

HBM的崛起遵循一个经典模式：当旧架构遇到物理极限，工程团队用更复杂、更昂贵的方法为它续命。

这个过程产生的超额利润，有两个明确特征：

因需求刚性而极其丰厚 —— AI训练离不开HBM，别无他选

因技术替代必然发生而具有明确期限 —— CXL、光互连、存内计算四条曲线正在交汇

HBM征收的是"架构税"——在冯·诺依曼体系与后冯·诺依曼时代之间的峡谷上，因架起唯一一座承重足够的桥梁而获得的通行费。

租金不会一夜消失。但聪明的玩家，已经开始同时在两岸建造新的城市。

七、各方的反脆弱布局

玩家策略
SK海力士 cHBM（定制HBM）、自研CXL控制器、PIM产品线、美国封装厂——从"卖内存颗粒"转型"AI内存子系统集成商"
三星 IDM全链条控制力，高度定制化响应能力
美光能效差异化+美国本土产能，地缘安全牌
英伟达推动多源供应、投资CXL与光互连、优化算法降低带宽依赖——确保瓶颈不固定在任何一个单一环节
云厂商通过长期承购协议绑定产能、投资前沿互连技术、探索自研芯片——成为未来内存架构的定义者

八、历史韵脚：瓶颈转移的规律

计算的历史，是一部瓶颈不断转移的历史：

年代瓶颈绕过方式
1950-60年代计算单元（真空管→集成电路）摩尔定律
1970-80年代内存容量（DRAM密度） 3D堆叠/FinFET
1990-2000年代内存带宽（缓存层次）处理器架构
2010-2020年代数据搬运（内存墙） HBM3D堆叠
2020年代→ 内存墙（再次） CXL/光互连/存内计算

每一个时代，控制瓶颈环节的企业都获得了超额回报。而每一个时代，瓶颈都不是被正面击破的，而是被新的架构范式绕过的。

九、2028年展望：重心下沉，非王座崩塌

基于可见信号，2028年的图景并非HBM的崩塌，而是一场深刻的"重心转移"：

训练市场：HBM仍是王者，但份额在三家间动态平衡，定价权从"稀缺租金"转向"制程、良率与可靠性的综合溢价"

推理市场：HBM从"默认载体"收缩为"性能尖兵"，与CXL内存池、压缩算法共同构成分层体系

SK海力士的理想终态：成为AI内存子系统集成商，而非单纯的HBM供应商

历史不会简单重复，但总是押着相似的韵脚。

真正的反脆弱，不是幻想成为永恒的王，而是在收租的窗口期内，把利润变成通往所有可能未来的钥匙。

黄金窗口依然敞开。

附：关键跟踪指标

维度指标频率
价格与盈利 SK海力士、三星、美光HBM业务营收占比与毛利率季度财报
份额与准入三家在英伟达/AMD新平台（Rubin, MI400）中的实际供应份额供应链追踪
解构进程 CXL内存池在主要云厂商的上线规模；先进封装成本曲线；MoE/量化普及率行业动态

写作日期：2026年1月
素材来源：原文《韩国阀，卡脖子》（林恩投资笔记）、JEDEC标准文档、SK海力士/三星/美光财报、TrendForce等分析机构报告、ISSCC论文