颠覆认知!AI时代内存不再是商品?三星/美光们的周期游戏已彻底变天
免责声明
本文所转载内容,均来自于网络,并不代表本人观点、立场,本人也不为其真实性负责,只为传播网络信息为目的,如有异议请及时联系,本人将予以删除。所有信息仅供在新媒体背景下的研究观点交流,普通个人投资者有可能由于获得的信息不完整,缺乏对研究观点或报告的解读能力,可能会得出有差异的结论。
本文仅为行业分析与研究探讨,不构成任何投资建议。投资有风险,决策需谨慎,不轻信不具备专业资质的投资分析,避免对个人财产造成损失。
在半导体投资圈,有一个被奉为圭臬的真理:内存是一种商品,且带着强烈的周期性——涨价、扩产、过剩、跌价,循环往复,从未改变。
从90年代个人电脑普及,到互联网崛起、智能手机爆发,再到云时代来临,内存行业始终跳不出“供应滞后→需求激增→价格暴涨→过度扩产→供应过剩→价格崩盘”的魔咒。但当AI浪潮席卷而来,这一延续数十年的游戏规则,正在被彻底改写。
有人问:“这次不一样吗?”答案是:AI时代的内存,在形态上已发生根本性改变,但周期的本质并未消失——它只是换了一种更残酷、更隐蔽的玩法。
先回顾:内存行业的五幕循环大戏
自计算诞生以来,内存就一直是行业瓶颈——这就是冯·诺伊曼瓶颈,80年前由冯·诺依曼提出,至今仍未被解决:CPU速度极快,内存访问却相对缓慢,处理器常常陷入闲置等待数据的困境。
而内存制造的高难度(工厂成本数百亿美元)、产能决策的滞后性(18-24个月才能匹配实际需求),注定了它的周期性宿命。过去几十年,这场循环上演了五幕大戏:
-
90年代个人电脑时代:台式机普及让DRAM需求激增,供应滞后推高价格,行业大规模扩产,最终以90年代末供应过剩、价格暴跌收尾;
-
互联网时代(90年代末-2000年代初):服务器需求崛起,定价走强,但互联网泡沫破裂带走需求,2000-2001年DRAM现货价格暴跌80%;
-
智能手机时代(2007-2010年代中期):iPhone引爆移动计算热潮,需求转向低功耗DRAM和NAND闪存,NAND反复经历“繁荣-萧条”循环;
-
云/超大规模时代(2010年代中期-2020年):AWS、Azure等推动服务器需求,2016-2018年定价强劲,2019年资本支出过剩引发内存崩盘,DRAM均价近乎减半;
-
AI/加速器时代(2020年代至今):GPU和大模型驱动高带宽内存(HBM)需求爆发,2023年起价格大幅上涨,行业奋力扩产——但这一次,循环的剧本变了。
不同于石油、铜等纯商品的“产能驱动型循环”,内存循环的核心是“容量+工作负载变化”。每一次计算范式升级,不仅需要更多内存,更会改变内存的形态——DRAM让位于NAND,如今NAND又与HBM并肩作战,而AI,正是自虚拟化和云迁移以来,最大的工作负载变革者。
三大改变+一个不变:AI重构内存的底层逻辑
AI的到来,让内存行业的“游戏规则”发生了结构性变化,这三点改变,决定了它与过去的周期截然不同:
1. 内存壁凸显:每单位计算的内存需求爆炸式增长
过去的周期,靠“单位增长”驱动——更多电脑、更多手机、更多服务器,每个设备的内存需求相对稳定。但AI时代,“每单位计算的内存强度”正在结构性上升。
二十年来,硬件峰值算力每两年约提升3倍,而DRAM带宽仅提升1.6倍,互连带宽提升1.4倍,如今两者的差距已达700倍。尤其是Transformer模型的推理过程,严格受内存限制:H100的内存带宽高达3.35TB/s,但在FP16精度下,运行70B参数模型每秒仅能处理约24个令牌——哪怕算力翻倍,这个瓶颈也无法突破,唯一的解法就是更多HBM、更宽总线。
行业的应对的是:从2020年A100的80GB内存,到2027年鲁宾Ultra的1024GB,七年间增长12.8倍——而在90年代和2000年代,DRAM花了15年才为普通PC实现类似增长。每一代新GPU,不仅出货量增加,单台设备的内存容量也在翻倍增长。
2. GPU经济性逆转:内存从“组件”变成“核心产品”
过去,内存只是GPU的一个组件,内存厂商竞争压价,GPU厂商抢占利润。但现在,内存已经成为GPU的核心——在B200上,HBM占制造成本的45%,加上先进封装更是占到三分之二;据鲁宾相关假设,仅HBM就超过材料成本的一半。
这彻底改变了价格信号的传递逻辑:在云周期,内存仅占服务器物料清单的10%-15%,2019年DRAM价格减半,超大规模企业的总成本几乎不受影响;但在AI周期,若HBM价格减半,加速器利润率会显著提升,需求反应会更缓和——因为买家面临的是产能约束,而非价格约束。
3. 需求分层:AI激活全内存层级,不止HBM
很多人只关注HBM的短缺,但AI的内存需求,早已渗透到DDR5、NAND等全层级。聊天机器人的循环相对简单,但生产型代理的工作负载更为复杂——执行任务、调用模型、处理结果、组装上下文,大多数编排工作在CPU上运行,而CPU使用的是DDR5。
更关键的是,长上下文窗口和KV缓存的存在,常常让HBM容量不足,缓存会溢出到DDR5中。如今典型的AI服务器,体系级DRAM数量是HBM的3-4倍——2018年的服务器只有数百GB DRAM,而现在的AI服务器已达数TB。
过去的周期崩溃,是因为单一工作负载的内存需求见顶;而AI则是扩大需求,而非替代需求——HBM存模型、DDR5做调度、NAND存生成物,总需求远超一年前的预期。
不变的脆弱性:需求仍可能“突然蒸发”
尽管有三大结构性改变,但内存周期的核心脆弱性并未消失:需求依然建立在“未来收入预测”之上,而目前的预测,可能难以支撑当前的资本支出
(以下数据均来自机构分析,仅为行业研究参考,不构成投资预判)。
数据显示,2026年美国AI超大规模企业的资本支出将达GDP的2.2%,是2000年电信泡沫峰值的两倍;贝恩分析认为,要支撑当前的资本支出,AI行业到本十年末需实现2万亿美元年收入,而最乐观的预测仅1.2万亿美元,与OpenAI当前约130亿美元的年收入相比,差距达8000亿美元——这需要AI收入从当前水平扩大150倍。
更值得警惕的是,资本支出越来越依赖债务:2025年超大规模企业债务发行达1210亿美元,是历史平均水平的4倍,预计2026年还将发行1000亿美元,摩根士丹利和摩根大通预测未来几年科技行业AI债务发行将达1.5万亿美元。
过去的周期崩溃,是供应泛滥;而AI时代的崩溃,可能是需求崩塌——一旦AI收入不及预期,超大规模企业会削减资本支出、取消内存订单,这比供应过剩更具突发性。
市场结构剧变:寡头垄断+长期合约,周期形态已变
除了AI带来的需求端改变,内存行业的市场结构也发生了根本性变化,这进一步重塑了周期形态——不再是过去的“无序竞争”,而是“寡头主导+契约绑定”的新格局。
1. 供应端:三足鼎立,寡头垄断更趋严格
如今的内存行业,三星、SK海力士、美光三家主导了DRAM市场,HBM市场更是被这三家100%垄断(SK海力士57%、三星22%、美光21%),其它份额不足1%,且产量落后(本文提及的企业及市场份额仅为行业公开信息整理,不构成对企业的评价或背书)。
与90年代“50多个晶圆厂计划”“八家以上厂商竞争”不同,当前AI周期中,三家仅启动了约7个新DRAM晶圆厂项目。2010年代行业比特年均增长22%,2024年降至14%,2025年13%,即使包含HBM,也低于历史水平——三家都选择“保利润率而非扩产量”。
更重要的是,物理限制加剧了供应约束:DRAM密度增幅从过去每2-3年翻倍,降至2015年后的10%-15%,扩产只能靠新建晶圆厂(单厂耗资150-200亿美元,耗时5年),资本密集度倒逼行业自律。此外,台积电已深度融入价值链——SK海力士的HBM4基模由台积电制造,HBM成为“内存晶圆厂+逻辑芯片厂+CoWoS封装”的三重约束,任何一个环节都无法单独突破。
2. 需求端:长期合约取代现货,投机性消失
过去的内存周期,依赖现货定价和短期合约,供应商靠预测扩产,风险极高;而AI时代,需求被“长期合约”锁定——约90%的高级DRAM和HBM容量,在制造前就通过多年期、“要么接受要么付款”的合约确定。
比如OpenAI在2024年底与三星、SK海力士签约,每月覆盖多达90万块DRAM芯片(占全球35%-40%);英伟达到2026年的HBM长期承诺,已让SK海力士的DRAM、NAND、HBM产能售罄;谷歌、AWS、微软的定制硅长期协议,进一步锁定了产能。
这意味着,过去“扩产赌需求”的模式,变成了“签合同再扩产”——SK海力士在2025年6月底就完成了2026年全年HBM订单,提前两年预售产量。供应过剩的门槛大幅提高:过去是“需求不及预测”,现在需要“取消长期合约”,这会带来巨大的声誉和法律成本。
3. 库存缓冲耗尽:波动被进一步放大
过去的内存崩溃,常常被库存放大——周期峰值时,行业库存达20-30周,崩溃时库存积压加剧过剩;但现在,库存已降至历史低位:2023年一季度DRAM库存峰值31周,2025年四季度降至8周,日本渠道库存仅2-4周。
库存不足,在上涨周期会让需求直接传导至价格,支撑牛市;但在下跌周期,会让波动急剧放大——一旦超大规模企业削减订单,价格信号会比过去更快、更猛烈,2025年OEM“恐慌性囤货”的行为,可能会在需求转向时残酷逆转。
4. 供需双集中:绑定关系取代价格竞争
需求端,英伟达占HBM采购量的70%,而SK海力士供应了英伟达90%的HBM,两者的双边关系几乎定义了AI内存市场;供应端,三家寡头垄断,新进入者难以突破。
这种集中度,让供需双方从“交易关系”变成“绑定关系”:英伟达无法轻易替换SK海力士(资格认证需12-18个月),SK海力士也依赖英伟达的长期订单,价格竞争让位于“提前设计纳入”的竞争——一旦赢得订单,就能锁定份额直至下一次架构重置。
最终,内存周期的形态被重塑:上升阶段更长、更剧烈(供应跟不上需求),下行阶段更尖锐、更快(库存无缓冲,需求崩塌直接冲击价格)——不是没有周期,而是周期变得更极端。
终极结论:内存不再是商品,而是战略性资产
这是最颠覆认知的一点:投资者长期认为“内存是商品”,但到2025年左右,这一认知已经过时——内存不再是可随意替代的商品,而是与台积电前沿晶圆、ASML EUV扫描仪并列的“股票战略性投资配置”。
核心原因,在于“协同设计取代标准化”:
过去的HBM是JEDEC标准产品,不同厂商的产品可互换;但HBM4打破了这一规则——其基模(协调DRAM芯片堆的逻辑芯片)改由逻辑工艺制造,SK海力士用台积电12nm/3nm工艺(针对英伟达、谷歌),三星用自身4nm/2nm工艺,美光的HBM4E基模也由台积电制造,且为英伟达、AMD定制。
基模的定制化,让HBM失去了可替代性:搭载英伟达GPU的HBM,是带有英伟达定制基模、台积电制造、逻辑功能由英伟达设计的专属产品;谷歌TPU、亚马逊Trainium的HBM,也都是专属定制款——即使JEDEC名称相同,规格和资格认证也无法互通。
更关键的是,资格认证周期长达18个月——三星作为老牌内存厂商,从完成HBM3E开发到通过英伟达认证,花了整整18个月。一旦超大规模企业选定供应商,更换供应商就相当于一项12-18个月的工程项目,且存在性能风险。
价格数据也印证了这一点:过去每一代内存推出后,12-18个月内溢价会降至与上一代相当(DDR3→DDR4、DDR4→DDR5均如此);但HBM3e在2024年初推出时比HBM3贵30%,随后24个月溢价反而上升,2026年合同价格甚至被上调近20%——这与商品“新一代降价、老一代贬值”的规律完全相反。
即便未来供应赶上,这种“非商品属性”也不会改变:定制基模无法互换、CoWoS封装仍受台积电垄断、资格认证周期不变,供应过剩只会导致“特定厂商的产能闲置”,而非“产品可替代”。
投资者启示:别再把三星/美光当“大宗商品厂商”
对于投资者而言,最大的误区,就是仍将SK海力士、三星、美光当作“周期性大宗商品生产商”——它们现在更接近台积电,而非石油巨头(本文仅为行业企业属性对比分析,不构成任何投资建议或企业价值判断)。
它们的定价权是结构性的(来自定制化、绑定关系),而非周期性的;利润率反映的是“整合溢价”,而非“比特成本”;周期依然存在,但形态更极端,触发因素从“供应过剩”转向“需求失望”。
过去“DRAM涨、DRAM跌,均值回归”的估值框架,已经不再适用于当前的AI内存市场。未来,真正的核心竞争力,在于“与头部超大规模企业的绑定能力”“定制化基模设计能力”,以及“与台积电等价值链核心企业的合作深度”。
AI没有终结内存周期,但它彻底改变了周期的玩法。内存不再是“涨涨跌跌的商品”,而是AI时代的“战略命脉”——看懂这一点,才能读懂未来半导体行业的投资逻辑。
本文仅为行业研究探讨,不构成任何投资决策依据。
万水千山总是情,打赏一元行不行?
夜雨聆风