花几千美元买一张 AI 芯片,其实有将近三分之二的钱进了内存厂商的口袋——这不是比喻,而是 Epoch AI 刚刚发布的一份量化分析的结论。这份数据覆盖英伟达、AMD、谷歌、亚马逊四家主要 AI 芯片设计商,统计周期从 2024 年第一季度到 2025 年第四季度,结论是:HBM(高带宽内存)在 AI 芯片总成本中的占比,已经从 52% 涨到了 63%。这不只是一个供应链数字,它揭示了一个正在加速的结构性转移:AI 时代的算力价值,正在悄悄从"算"滑向"记"。
成本结构里发生了什么
Epoch AI 的分析把 AI 芯片的成本拆成四类:内存(HBM)、逻辑核心(Logic Die)、先进封装(CoWoS)、辅助组件(Auxiliary)。从 2024 年到 2025 年,这四类成本的走向完全不同:
| 持续上升 | |||
逻辑核心——也就是 GPU 的算力核心——的成本占比两年没动。但绝对值在涨:整个 AI 芯片市场的总成本支出从 2024 年约 220 亿美元增长到 2025 年约 520 亿美元。这300 亿美元的增量里,HBM 一项就贡献了约 200 亿美元,HBM 支出从 120 亿涨到 320 亿。
翻译成直白的话:AI 芯片市场扩大了一倍多,但这倍增的价值基本上都被内存厂商拿走了。
为什么内存比芯片贵得更快
理解这件事需要先知道 HBM 和普通内存之间的物理代价。
普通的 LPDDR5X 内存——也就是手机里用的那种——每比特占用的硅片面积本身并不大。HBM 要先把多层 DRAM 芯片堆叠(Stack)起来,再通过硅通孔(TSV)互联,然后和逻辑核心一起封进 CoWoS 封装里,整体工艺复杂度远超普通 DRAM。
全球 HBM 的供应商屈指可数——SK 海力士、三星、美光,这三家占据全球供应的绝大部分,且没有任何一家在短期内有意愿大幅扩产。
原因不难理解:DRAM 行业历史上每次大规模扩产都伴随着价格崩盘和公司破产,行业里的"幸存者"都把谨慎产能规划刻进了 DNA。这场 AI 驱动的需求爆发,正好撞上一批被历史教训驯化过的供应商。
超大型买家已经提前感受到了
这不是分析师的推演,已经反映在财报里了。
微软 FY2026 的资本支出指引是 1900 亿美元,其中约 250 亿美元来自组件价格上涨——这是他们在财报电话会上明确说的。Meta 把 2026 年资本支出区间上调了 100 亿美元,同样把原因归结为"更高的组件价格"。
这两家是全球最大的 AI 基础设施买家,他们的话要按字面意思理解:不是规模更大了,而是同样的东西更贵了。
Epoch AI 的预测是,2026 年 HBM 的占比还会进一步上升,因为两件事在同步发生:AI 算力需求继续高速增长,而 HBM 供给增速跟不上——三星、SK 海力士和美光三家主要供应商都已经表示他们 2026 年的 HBM 产能几乎全部卖光。
逻辑核心"价值不变"意味着什么
表格里最耐人寻味的一行,是逻辑核心维持在 13% 左右。
这似乎是个悖论:英伟达的 H200、B200、GB300 一代比一代贵,怎么会在成本结构里原地不动?答案在于,逻辑核心的绝对支出其实也在涨,只是涨幅远低于 HBM,所以占比相对缩小了。
从另一个角度看这个数字:在 AI 芯片的每一代迭代中,逻辑核心的架构复杂度在提升,但成本增速被先进制程的持续改善压制着——台积电每代节点都在把同样的芯片做得更便宜一些。内存没有这种"免费午餐":DRAM 的工艺节点改进幅度,比逻辑芯片慢得多。
结果就是:AI 芯片里,算力越来越值钱,但内存更值钱——而且这个差距在拉大。
中国视角:这条路的战略堵点
这个成本结构对中国的 AI 基础设施意味着一个具体的战略问题。
算力芯片领域,华为昇腾系列、海光 DCU、壁仞、沐曦等厂商已经有了有竞争力的逻辑核心产品。昇腾 910B/910C 在大规模推理部署中被证明是可用的。这些厂商的逻辑层,已经积累了相当的能力。
但 HBM 是另一回事。
HBM 量产技术高度依赖 EUV 光刻机,而 ASML 对中国的 EUV 出口禁令早已明确。唯一有 DRAM 量产能力的主要厂商长鑫存储(CXMT),已能做到 DDR5 LPDDR5,证明 DUV 路线可以实现可用良率——Corsair 等品牌已经在用长鑫的芯片,但 HBM 的叠层工艺和 TSV 互联对制程精度的要求更高,用 DUV 能不能闯过这道坎,还没有公开的量产案例。
这意味着:即使中国厂商把逻辑层做到最优,AI 芯片里成本占比最大的那一块,依然高度依赖海外供应链或自主体系尚未打通。训练和推理的成本,有将近三分之二的部分被一道目前还没跨过的墙挡在外面。
HBM 成本还会升多久
短期:几乎没有减轻的信号。HBM 的扩产周期极长——新 fab 建设加上良率爬坡。目前三大供应商的态度是"有多少卖多少,不想冒险超量扩产",这和行业历史上每次巨亏的经验是一致的。
中期变量有两个:第一,长鑫存储如果在 HBM 制造上取得突破,会改变供需格局;第二,模型架构本身如果出现能显著降低内存带宽需求的创新(比如 DeepSeek 的 MLA 把 KV 缓存压缩了约 93%),"内存吃掉一切"的逻辑可能会被反向打破。
这也是为什么 DeepSeek 的架构创新在 AI 基础设施圈子里被认真对待的另一个维度——它不只是推理服务更便宜了,也有可能重新绕开成本占比最高的那个组件瓶颈。
数据来源:Memory has grown to nearly two-thirds of AI chip component costs,Epoch AI,Venkat Somala 著,2026 年 5 月 21 日。数据统计口径为英伟达、AMD、谷歌、亚马逊四家芯片设计商,按季度生产量加权,涵盖 2024 Q1 至 2025 Q4。
夜雨聆风