提到存储芯片,很多人首先想到的是固态硬盘(SSD)里的NAND闪存,或者是手机电脑里的内存(DRAM)。但近年来,随着ChatGPT等大模型的爆发,一种专门为AI训练和推理服务的“AI存储芯片”逐渐走进大众视野。
那么,AI存储芯片究竟是什么?它在工艺上与普通存储芯片有哪些本质区别?我们国家的国产化进程又走到了哪一步?

一、AI存储芯片工艺简介
先澄清一个概念:AI存储芯片并不是一种全新的存储介质,而是一类针对AI计算场景进行特殊优化的存储解决方案。目前最具代表性的就是HBM(高带宽存储器)。
HBM的核心特点,是把多个DRAM芯片像盖楼一样垂直堆叠起来,再通过一种叫“硅通孔”(TSV)的技术,在芯片内部打通数千个微小垂直通道,让数据可以上下穿行。然后,这栋“存储大楼”紧贴着AI处理器(如GPU)放置,通过超高速互联接口直接与处理器交换数据。
与传统内存相比,HBM的带宽(数据传输速率)提升了数倍甚至数十倍。以HBM3E为例,其带宽可超过1TB/s,相当于每秒传输几十部蓝光电影的数据量。正是这种超高带宽,才喂得饱英伟达H100、昇腾910这类高性能AI芯片的“胃口”。
除了HBM,AI场景下还包括存算一体芯片(在存储器内部直接做计算)和近存计算等新型架构,但目前最成熟、量产规模最大的,非HBM莫属。

二、它与普通存储芯片工艺的区别
普通存储芯片(如DDR4/DDR5内存、3D NAND闪存)和AI存储芯片(以HBM为例)的工艺差异,远不止“快一点”那么简单。主要体现在四个维度:
1. 2D平面 vs 3D堆叠
普通DRAM芯片是平面铺开的,一个芯片就是一个裸片。而HBM的核心工艺是3D堆叠——把4层、8层甚至12层DRAM裸片垂直叠在一起,层与层之间用TSV微孔和微凸点(micro-bump)连接。
这意味着,制造HBM需要解决超薄晶圆处理、高精度对准(上下孔偏移不能超过几十纳米)、散热等一系列难题。打个比方:普通存储芯片像平房,HBM像摩天大楼,盖楼的难度完全不是一个量级。
2. 封装环节的天壤之别
普通存储芯片出厂后,通常是独立封装成内存条或闪存颗粒,然后插在主板上,与CPU/GPU之间有较长距离。而HBM走的是先进封装路线——它通过2.5D封装(如硅中介层)或3D封装,直接与AI处理器“贴”在一起,物理距离极短。
这种“紧耦合”带来了巨大挑战:不同芯片的热膨胀系数不同,反复通断电会产生热应力,可能导致焊点断裂。此外,HBM与逻辑芯片(如GPU)的制造工艺不同(一个是存储工艺节点,一个是逻辑工艺节点),要把它们集成在一个封装体内,对封装厂的异构集成能力要求极高。
3. 测试难度指数级上升
普通存储芯片测试相对成熟,测试机台在芯片底面扎针即可。但HBM堆叠后,中间层的芯片无法直接接触测试,必须在堆叠前就对每层裸片做预烧测试(确保没有早期失效),堆叠后再做最终测试。而且因为引脚数巨大(几千个连接点),测试速度也慢得多,成本自然水涨船高。
4. 功耗与散热设计的差异
普通DRAM功耗不高,自然散热基本够用。但HBM堆叠后,单位面积发热量急剧增加——12层DRAM叠在一起,中间层的热量很难散出。因此在工艺上,HBM需要引入导热填充材料、硅片上的散热通路设计等额外措施,工艺复杂性再次提升。
简单总结:普通存储芯片比拼的是制程微缩和成本控制,而AI存储芯片比拼的是堆叠层数、TSV良率和先进封装整合能力。两者虽有技术同源,但已走向完全不同的工艺路线。

三、AI存储芯片与普通存储芯片的国产化
普通存储芯片:已实现从0到1的突破
在普通存储领域,国产化近年来取得重要进展:
· NAND闪存:长江存储成功研发128层、232层3D NAND,Xtacking架构独树一帜,已进入主流SSD市场。
· DRAM:长鑫存储(CXMT)量产19nm及17nm DRAM,DDR4/LPDDR4系列产品在消费电子和服务器中逐步替代进口。
但客观讲,在良率、性能和产能上,与国际巨头(三星、SK海力士、美光、铠侠等)仍有差距,尤其是在最先进的DDR5和LPDDR5X领域,还需追赶1-2代。
AI存储芯片(HBM):追赶中的硬仗
HBM的情况更为特殊。目前全球95%以上的HBM市场被SK海力士和三星占据,美光紧随其后。这三家巨头从HBM第一代就开始深耕,积累了数千项TSV和堆叠相关专利。
国内方面:
· DRAM龙头长鑫存储正在积极布局HBM相关技术,已有专利公开,部分产品进入小规模验证阶段,但尚未大规模量产。
· 封装环节的追赶相对乐观:通富微电、长电科技等先进封装企业已具备TSV和2.5D/3D封装能力,可以为国产HBM提供后道支撑。
· 设备与材料仍被“卡脖子”:TSV深孔刻蚀设备、高精度键合设备、临时键合胶、导电填充材料等,相当比例依赖进口。
目前国内HBM产业链的状态可以概括为:设计有突破、封装可配套、材料设备待突围、量产尚需时日。
国产化的独特挑战
AI存储芯片国产化还面临一个额外困境:缺乏“练兵”的AI处理器。HBM需要和AI芯片(GPU/NPU)协同设计、联合优化。如果国内没有足够强大的AI芯片来定义需求和测试性能,HBM的迭代就会变慢。这是一个“鸡生蛋蛋生鸡”的问题:AI芯片弱,HBM难有市场牵引;HBM跟不上,AI芯片也就无法发挥全性能。

写在最后
AI存储芯片和普通存储芯片,虽同属存储家族,但在工艺上已分道扬镳。普通芯片追求“小而密”,AI芯片追求“高而宽”,并通过先进封装与处理器深度融合。
国产化方面,普通存储已迈入正向循环,正从“能用”走向“好用”;而AI存储芯片的国产化更像一场马拉松——我们有先进封装的长板,也有DRAM底层积累不足、材料设备受制于人的短板。好消息是,AI浪潮催生了庞大而确定的需求,而中国拥有全球最大的AI应用市场和最完整的电子制造产业链。
只要坚持投入,给产业链的协同创新一点时间,在AI存储芯片这个赛道上,国产力量的脚步声,已经越来越近了。
夜雨聆风