核心结论
这不是一个关于地缘政治断供的故事。这是一个关于工艺、产能与定价权的纯商业现实。
AI算力的"燃油"——HBM(高带宽内存),其尖端制造工艺与核心产能,长期被韩国厂商(SK海力士、三星)掌控,形成了一道事实上的**"韩国阀"**:
配额制:稀缺产能意味着不是想买就能买
年为单位认证:HBM通过英伟达等GPU厂商认证周期长达1-2年,替换成本极高
30-40% BOM占比:HBM+先进封装占一张AI加速卡物料成本的最高四成,"架构税"由此而来
英伟达、微软、谷歌、Meta……所有AI巨头,无一不在为此付费。
但这道阀门正在松动。美光入局、光互连成熟、CXL内存池崛起、存内计算探索——技术绕行路径已清晰可见。
本文基于原文核心论点,换用新视角与语言,并补充更多数据与论据。
一、HBM是什么?为什么它成了AI的瓶颈?
1.1 从配角到主角:带宽叙事逆转
2018年英伟达发布Tesla V100,搭载HBM2,带宽达到900 GB/s。那一刻,业界第一次意识到:内存带宽可以比算力本身更值钱。
这背后是冯·诺依曼架构数十年的"内存墙"困境:
年份 CPU性能提升倍数 内存带宽提升倍数
1970→2020 ~100万倍 ~1000倍
算力跑得太快,内存跟不上了。HBM通过3D堆叠、硅通孔(TSV)和极致封装,将带宽一次性提升近一个数量级——代价是成本与复杂度也飙升数倍。
1.2 HBM技术演进时间线
年份 标准 关键突破 代表产品
2016 HBM2 4层堆叠,TSV量产 Nvidia Tesla P100
2018 HBM2 4-Hi堆叠,带宽900 GB/s Nvidia Tesla V100
2022 HBM3 12层堆叠,819 GB/s/栈 Nvidia H100 (Hopper)
2024 HBM3E 12层,>1.2 TB/s总带宽 Nvidia H200, H100升级
2026→ HBM3E+ 预计12层以上,工艺持续优化 B200, Rubin平台
数据来源:JEDEC标准文档(JESD238,2022年1月)、英伟达GTC发布会、SK海力士产品路线图。
二、"韩国阀"是如何形成的?
2.1 三条技术路线的淘汰赛(2019-2021)
SK海力士:押注MR-MUF(大规模回流模塑底部填充)
工程判断:"最可能稳定量产"的方案,而非理论最优
用塑封材料的一致性,对抗热压工艺中的翘曲变量
工艺宽容度更高,良率更容易爬坡
三星:押注TC-NCF(热压非导电膜)
认为散热优势会在长期比赛中胜出
但工艺窗口更窄,材料均匀性要求苛刻
12层堆叠时热压均匀性控制困难,良率迟迟不达标
美光:战略观望后转向HBM3E
2020年判断:功耗会比峰值带宽更早成为天花板
选择跳过HBM3主战场,直接集中资源于基于1β制程的HBM3E
结果:SK海力士凭借MR-MUF的工艺稳定性,率先拿下12层堆叠量产能力。2022年6月HBM3量产,与英伟达Hopper架构(H100)批量交付节奏精准衔接。供应链齿轮从此咬死。
2.2 独家供应商的地位如何兑现
H100是AI大模型训练的引爆点。
2022年3月英伟达发布Hopper架构H100,HBM3成为标配。大模型军备竞赛正式点燃。
而SK海力士是彼时唯一的HBM3供应商。
财务表现最能说明问题:
2022年Q4起,SK海力士开始将HBM营收作为独立指标在财报电话会中披露
彼时公司整体仍处存储下行周期,但HBM业务线被分析师单独测算,增速指向三位数
2023-2024年,HBM业务占SK海力士总营收比例显著提升
据TrendForce等机构估算,2023年SK海力士在HBM3市场的份额约70-80%(为英伟达主要供应商),三星约10-15%(主要通过AMD MI300X等非英伟达平台),美光则凭借2024年的HBM3E认证获得剩余份额。
2.3 产能瓶颈:物理世界的约束
一座月产5万片(等效12英寸晶圆)HBM的先进工厂,从动工到量产需要18-24个月。关键的TSV刻蚀与封装设备交期更长达一年以上。
短缺不是炒作,是资本开支节奏与物理扩建周期的算术结果。
反映在市场端:搭载80GB HBM3的H100 GPU,渠道报价一度突破3万美元。而据多个第三方拆解分析(HPC Systems、TechInsights等),HBM及相关先进封装(CoWoS)占整卡BOM的30%-40%,是最大的单成本项。
这就是"架构税"的物质基础。
三、"三足鼎立"格局如何形成(2023-2025)
3.1 美光的破局
2023年Q4,美光HBM3E样品在英伟达实验室的能效测试中表现突出。2024年2月,美光官方宣布HBM3E量产,并通过英伟达认证,进入H200 GPU供应链。
美光CEO桑杰·梅赫罗特拉(Sanjay Mehrotra)在财报电话会中明确传递信号:我们押注的是下一个需求曲线,而非当前的市场格局。
美光能效优势来自其1β制程工艺,在功耗测试中优于三星初期样品。这让美光在云厂商(微软、谷歌)中获得了"第二供应商"席位。
3.2 三星的追赶
三星的12层HBM3E在2024年下半年至2025年初逐步通过英伟达验证,重新进入核心供应商名单。
其垂直整合模式(IDM)提供了独特优势:从DRAM晶圆、逻辑芯片到代工制造与先进封装,全链条可控,在响应高度定制化需求时具备敏捷性。
3.3 2024年格局数据
厂商 HBM3E状态 英伟达平台供应份额估算
SK海力士 率先量产,持续领先 约50%-70%(B200等新平台)
三星 2024-2025年逐步通过验证 约10%-20%,回升中
美光 2024年Q1通过认证 约15%-25%
数据来源:TrendForce、Counterpoint Research等分析机构报告(2024)。
四、解构的信号:HBM"卡脖子"地位的终点
4.1 封装边界融化:光互连(CPO/COUPE)
台积电已明确:共封装光学(CPO)技术将于2026年进入量产阶段。该技术允许通过光纤将HBM堆叠放置在距离GPU数厘米的位置,单封装内可集成多达8个HBM堆叠,有效容量提升至当前约2倍。
这首先解决的是"封装海岸线"(package substrate routing limits)的物理限制——并非替代HBM,而是让HBM在更优的架构下发挥更大作用。
4.2 内存层级重构:CXL内存池
主流云厂商的推理架构正在向分层演进:
热层:HBM(最低延迟,最高带宽)
温层:CXL内存池(容量大,延迟可接受)
冷层:DDR5/CXL DRAM
学术测试数据显示,CXL内存池可将单服务器有效容量提升4-8倍,延迟增加约10-15%,但对吞吐优先的推理任务已可接受。
HBM从"唯一的答案"开始退守为"最快的那一层"。
4.3 存内计算(HBM-PIM)
SK海力士与三星均在ISSCC(国际固态电路大会)持续发布HBM-PIM(存内计算)研究成果。在向量搜索、特定矩阵运算等场景中,将计算下推至内存侧可获得10-100倍能效提升。
但挑战同样巨大:通用编程模型与工具链的成熟,仍是漫长的工程。
4.4 供应链"再地理化"
地缘政治加速了产能多极化:
SK海力士:美国印第安纳州先进封装厂,宣布投资约38.7亿美元,目标2028年前后形成2.5D/3D封装量产能力
美光:纽约工厂受益于《芯片与科学法案》(CHIPS Act)补贴加速建设
三星:在得克萨斯州已有晶圆厂布局
产能从"韩国制造+中国台湾封装"的单一管道,向多极化网络扩散。
五、AI模型自身开始"内存节食"
算法优化正在从另一个维度缓解HBM的饥渴:
MoE(混合专家)架构:推理时只激活约10-20%的参数,大幅降低内存带宽需求
4-bit量化:可将模型体积压缩60%以上
KV Cache压缩:技术持续演进,显著降低长上下文推理的内存占用
英伟达在Vera Rubin等新架构中,已开始设计可混合搭载多家HBM的封装方案——将供应链风险从"单一节点"分散,同时增加买家的议价能力。
六、本质:过渡期租金的逻辑
HBM的崛起遵循一个经典模式:当旧架构遇到物理极限,工程团队用更复杂、更昂贵的方法为它续命。
这个过程产生的超额利润,有两个明确特征:
因需求刚性而极其丰厚 —— AI训练离不开HBM,别无他选
因技术替代必然发生而具有明确期限 —— CXL、光互连、存内计算四条曲线正在交汇
HBM征收的是"架构税"——在冯·诺依曼体系与后冯·诺依曼时代之间的峡谷上,因架起唯一一座承重足够的桥梁而获得的通行费。
租金不会一夜消失。但聪明的玩家,已经开始同时在两岸建造新的城市。
七、各方的反脆弱布局
玩家 策略
SK海力士 cHBM(定制HBM)、自研CXL控制器、PIM产品线、美国封装厂——从"卖内存颗粒"转型"AI内存子系统集成商"
三星 IDM全链条控制力,高度定制化响应能力
美光 能效差异化+美国本土产能,地缘安全牌
英伟达 推动多源供应、投资CXL与光互连、优化算法降低带宽依赖——确保瓶颈不固定在任何一个单一环节
云厂商 通过长期承购协议绑定产能、投资前沿互连技术、探索自研芯片——成为未来内存架构的定义者
八、历史韵脚:瓶颈转移的规律
计算的历史,是一部瓶颈不断转移的历史:
年代 瓶颈 绕过方式
1950-60年代 计算单元(真空管→集成电路) 摩尔定律
1970-80年代 内存容量(DRAM密度) 3D堆叠/FinFET
1990-2000年代 内存带宽(缓存层次) 处理器架构
2010-2020年代 数据搬运(内存墙) HBM3D堆叠
2020年代→ 内存墙(再次) CXL/光互连/存内计算
每一个时代,控制瓶颈环节的企业都获得了超额回报。而每一个时代,瓶颈都不是被正面击破的,而是被新的架构范式绕过的。
九、2028年展望:重心下沉,非王座崩塌
基于可见信号,2028年的图景并非HBM的崩塌,而是一场深刻的"重心转移":
训练市场:HBM仍是王者,但份额在三家间动态平衡,定价权从"稀缺租金"转向"制程、良率与可靠性的综合溢价"
推理市场:HBM从"默认载体"收缩为"性能尖兵",与CXL内存池、压缩算法共同构成分层体系
SK海力士的理想终态:成为AI内存子系统集成商,而非单纯的HBM供应商
历史不会简单重复,但总是押着相似的韵脚。
真正的反脆弱,不是幻想成为永恒的王,而是在收租的窗口期内,把利润变成通往所有可能未来的钥匙。
黄金窗口依然敞开。
附:关键跟踪指标
维度 指标 频率
价格与盈利 SK海力士、三星、美光HBM业务营收占比与毛利率 季度财报
份额与准入 三家在英伟达/AMD新平台(Rubin, MI400)中的实际供应份额 供应链追踪
解构进程 CXL内存池在主要云厂商的上线规模;先进封装成本曲线;MoE/量化普及率 行业动态
写作日期:2026年1月
素材来源:原文《韩国阀,卡脖子》(林恩投资笔记)、JEDEC标准文档、SK海力士/三星/美光财报、TrendForce等分析机构报告、ISSCC论文
夜雨聆风