过去两年,市场谈 AI 半导体,最容易想到的是 GPU、HBM、CoWoS、光模块。但如果把这些技术放在一起看,会发现它们并不是孤立的赛道,而是在解决同一个核心问题:计算越来越快,但数据搬运越来越难。这可能是未来 5—10 年 AI 硬件投资最重要的一条主线。
一、为什么 AI 半导体不只是“算力”问题?
GPU 之所以强,是因为 AI 计算主要是矩阵运算,天然适合并行。简单理解,GPU 不是一个人在算,而是成千上万个“小工人”同时算。过去靠三件事不断提升算力:第一,堆更多晶体管。第二,增加 Tensor Core、Matrix Core 这类专用计算单元。第三,降低计算精度,比如从 FP32 到 FP16,再到 FP8、FP4。浮点数越低,每个数字占用的存储和带宽越少,同样的 GPU 可以一次处理更多数据。所以 FP8、FP4 不是简单的“偷工减料”,而是 AI 模型经过算法、量化和硬件协同优化后的结果。但是问题来了:算力增长太快,数据供给跟不上。这就是所谓的 Memory Wall,内存墙。GPU 像一个越来越快的工厂,但仓库、道路、电梯、物流系统跟不上,工人就会等材料。所以 AI 半导体真正的长期主线,正在从“谁的计算更快”,变成“谁能让数据更快、更近、更低功耗地流动”。
二、存储:HBM 是明确主线,但仍有周期属性
HBM 是这一轮 AI 最确定的受益环节之一。原因很简单:大模型需要大量参数和激活数据,普通 DDR 带宽不够,必须靠 HBM。所以海力士、美光、三星成为核心玩家。但需要注意的是,HBM 虽然比普通 DRAM 更高端,但本质仍然属于存储产业。存储有一个天然特点:供不应求时价格暴涨,扩产释放后价格回落。所以 HBM 的投资逻辑很清晰,但也不能忽视周期性。它不是没有壁垒,而是它的壁垒更多来自产能、良率、客户认证和代际领先;一旦供给追上,估值逻辑就会变化。因此,HBM 是 AI 硬件里最明确、最容易涨价、也最容易被周期扰动的环节。
三、封装:本质上是更内层的“连接”
过去我们把封装理解成芯片制造的后道工序,重要但不性感。但 AI 时代,封装已经从配角变成主角。因为当制程继续缩小越来越难,性能提升越来越依赖先进封装。可以把先进封装理解成一种“更短距离、更高密度的数据连接”。