2024年初到2025年底,全球AI芯片总组件支出从220亿美元飙升至520亿美元。涨了一倍多。但最顶尖的“计算大脑”——主逻辑裸片,成本占比始终停留在13%至14%。
真正掏空科技巨头口袋的,是负责“记忆”的仓库——内存。高带宽内存(HBM)在AI芯片组件中的成本占比,从52%一路攀升至63%。300亿美元增量里,HBM一项贡献了约200亿美元。
大众只看到算力狂欢,却不知道算力竞赛已经变成了一场“物理肉搏战”。今天聊聊,为什么“记忆”成了刺客,以及这背后的产业重构。
一、内存墙:算得再快,喂不饱也白搭
CPU时代,所有架构设计都在追求“单兵作战能力”。你可以把CPU想象成一位绝顶聪明的顶级学者,手边塞满了各种“私人书架”(缓存)。AI大模型不需要复杂的逻辑判断,它要的是简单粗暴的“暴力算术矩阵”。GPU和TPU不再是单打独斗的学者,而是数万名同时做加减乘除的流水线工人。
这群工人算得实在太快了。过去20年,硬件峰值计算能力飙升了60,000倍,但内存容量仅仅提升了100倍,互连带宽只提升了30倍。搬运原材料(数据)的通道彻底瘫痪。这就是“内存墙”。
通道不够宽怎么办?行业祭出了技术难度极高、成本也极高的解法:高带宽内存(HBM)。把DRAM存储芯片像盖摩天大楼一样垂直堆叠起来,在微观层面上打穿无数孔洞,与计算核心直接相连,实现超宽的数据通道。但这玩意儿,大量消耗底层晶圆产能。生产1GB的HBM,需要吃掉相当于普通DRAM三倍以上的晶圆产能。
二、利润分化:HBM毛利率70%,普通内存20%-30%
当底层晶圆变成零和博弈,整个产业链的资金流向彻底变了。普通商品内存毛利率常年在20%到30%区间,而HBM的毛利率达到70%以上。
面对这种利润差异,存储三巨头的动作果断而激进。美光运营了29年的消费级品牌“英睿达”即将终结,把所有产能转向AI和企业级数据中心市场。韩国双雄更是大幅受益。2026年第一季度,靠着全数售罄的HBM订单,SK海力士实现了72%的营业利润率。三星电子的半导体部门同样以70%以上的利润率,贡献了全公司94%的利润。
三、现实代价:廉价手机正在消失
晶圆都被抽走去造AI用的HBM了,普通手机用的标准内存面临断崖式缺货。短短一年间,老一代的LPDDR4价格大幅上涨了250%,LPDDR5也上涨了220%。手机的物料成本里,内存占比从原本的15%左右,一路飙升到最高50%。
结果就是,低端智能机在商业上已难以为继。分析师指出,低于100美元的智能手机已经“永久性不再经济”。占据非洲近半壁江山的手机品牌传音,2025年净利润暴跌54%,被迫砍掉40%的出货目标。在印度,100美元以下的手机市场在2026年一季度同比萎缩了59%。
硅谷扇动了一下名为AI的翅膀,亚非拉低价位市场用户的数字接入门槛,大幅抬高了。
四、下半场:封装瓶颈与两条破局路
内存吃掉了AI芯片63%的成本,但这还不是唯一的门槛。再贵的芯片,也必须通过台积电的CoWoS等先进封装工艺,精密地缝合在基板上。这道工序目前是真正的“物理卡脖子”环节。台积电CEO魏哲家直言,CoWoS产能到2026年已完全售罄。英伟达甚至提前包揽了超过60%的产能。
随着行业从“模型训练”走向“AI代理”推理,“内存墙”的压力成倍放大。行业分化出两条路:
第一条,英伟达的“暴力加码”。新一代Rubin架构,单颗GPU塞进了3360亿个晶体管,首发搭载容量高达288GB的HBM4内存,带宽达到惊人的22 TB/s。英伟达的目标是用极高的内存带宽,把推理成本打下来。
第二条,初创公司的“从架构底层破局”。既然逻辑计算本身只占13%的成本,那只要能尽量绕开昂贵的HBM,就能重塑整个算力市场的利益分配。2026年,初创公司MatX拿到了5亿美元B轮融资,设计了一款利用SRAM超低延迟特性来搞定长文本推理的专用芯片。
而在终端租赁市场,算力正在褪去神秘的光环。曾经一卡难求的H100,小时租赁底价已被打到1.38美元/小时。算力大宗商品化的时代,加速到来。
五、金句时间
“计算能力飙升60,000倍,内存容量仅提升100倍。内存墙,不是‘可能’,是‘必然’。”
“HBM毛利率70%,普通内存20%。利润差,决定了产能流向。产能流向,决定了你的手机还能不能卖100美元以下。”
“传音净利润暴跌54%,不是手机不好卖,是内存买不起。硅谷的AI梦,亚非拉的人在买单。”
“台积电CoWoS产能2026年已售罄。不是‘芯片贵’,是‘封装更贵’。物理卡脖子,比技术卡脖子更难解。”
“英伟达Rubin堆晶体管,MatX绕开HBM。两条路,都指向同一个目标:把推理成本打下来。”
“H100租赁价跌到1.38美元/小时。算力大宗商品化,不是‘未来’,是‘现在’。”
写在最后
HBM吃掉AI芯片63%的成本。不是“算力不贵”,是“内存更贵”。算力狂欢,内存买单。廉价手机消失,亚非拉用户被“涨价”。初创公司绕开HBM,英伟达堆HBM。两条路,都在跑。
算力大宗商品化,稀缺的不再是“计算”,而是“存储”和“封装”。看懂这张被内存主导的账单,才算摸清AI芯片产业的底牌。
夜雨聆风