这周芯片行业相当热闹,很多事情都有些出乎预料。
一个是 AMD 单日暴涨 18%,费城半导体指数继续新高,全球资本还在疯狂押注 AI 算力。
另一个是黄仁勋确认:英伟达中国业务基本停滞,市场份额接近归零。 而同一天,A 股寒武纪等国产芯片个股集体创历史新高。一边是美国 AI 芯片继续狂飙,一边是中国市场开始重新定价国产替代。
并且,市场最强的,已经不只是 GPU 公司。存储、光模块、先进封装、电源管理,甚至液冷方向,都在持续升温。
先是三星电子市值一度突破 1 万亿美元,AI 带动下,韩国半导体板块持续上涨。与此同时,SK 海力士继续扩大 HBM 投资,美光则表示 HBM 产能已经提前多年被客户预订。另一边,JEDEC 正在推进新一代 MRDIMM 标准,三星、SK 海力士、美光都在加速布局服务器高带宽内存。
再往下游看,关于 CoWoS、HBM 封装、2.5D/3D 封装的话题明显增多,台积电先进封装产能持续紧张。海外市场关于硅光、CPO、高速光模块的讨论也在持续升温。如果只是单看其中某一条消息,其实都不算新鲜。但当这些事情同时发生时,一个非常重要的趋势开始变得越来越清晰:
AI 正在把整个半导体行业,从“单一GPU 竞争”,推向“全产业链基础设施竞争”。
先聊 AMD 的 18%。
Zen 6、Blackwell、英特尔的下一代——CPU的价值正在被不断强化。AMD 能持续迭代、股价创新高,不只是因为 AI 需求好。是因为它的验证和量产工程体系撑得住这个节奏。
英特尔同样暴涨了,但是除了工程本身,还有就是代工苹果芯片的事情引爆了预期。过去几年大家聊英特尔,核心印象都是:制程落后、AI 慢了、被 AMD 和英伟达压着打。
但芯片行业有个很现实的事情:体系这种东西,一旦建立起来,很难彻底消失。尤其先进制造。真正难的从来不只是“做出一颗芯片”。而是:长期稳定量产、跨代工艺迁移、良率控制、供应链协同、软件工具链、全球客户验证体系,这些东西全是几十年工程积累。
再说国产芯片暴涨。
国产 AI 芯片这几年进步很快,寒武纪推理芯片占比超 80%,华为昇腾 950PR 年出货 75 万颗,DeepSeek V4 已经全栈适配。设计和量产在快速追赶。
英伟达的护城河不只是芯片设计,更是 CUDA 生态和一套跑了十几年的验证体系。几千个客户的应用场景,几十万种软件配置组合,每一版驱动更新都要跑回归。这套东西是靠时间和海量场景堆出来的,不是靠几个测试用例能追平的。
寒武纪的暴涨反映的是市场预期,但后面依然有一张巨大的待验证矩阵——不同电压、不同温度、不同负载、不同互联拓扑。每一项都得过。这条路走得通,但要时间。
HBM 产能卖光了。
SK 海力士 2026 年 HBM 产能基本售罄,美光订单被提前锁定。JEDEC 在推第二代 MRDIMM 标准。
现在数据直接成了 AI 芯片的第一约束。不是 GPU 算不动,是数据喂不进去。HBM 解决 GPU 侧的数据吞吐,MRDIMM 解决 CPU 侧的大容量高带宽。AI 正在把整个服务器内存体系全部升了一遍级。模型还在变大,推理还在涨,这个趋势不是短周期。
这周海力士和三星因为巨额奖金还霸榜了微博热搜,如果海力士今年真的能如预期一样1万亿利润,这真是前所未见了。
连接可能要比算力贵了。
英伟达持续强化 NVLink、NVSwitch,Blackwell 越来越强调集群协同。几万颗 GPU 一起工作,卡脖子的变成了带宽、延迟、互联功耗。
于是 800G、1.6T、3.2T光模块、硅光、CPO、高速交换芯片——光通信的重要性正在接近算力本身,整个产业链重新定价。
但大规模互联之后,corner case 会指数级爆炸——几万条链路,某一条间歇性抖动,定位可能要很久。越来越复杂的互联,这个痛苦我能理解。
先进封装成了第二晶圆厂。
CoWoS、HBM 封装、2.5D/3D 封装的讨论明显变多。先进制程越来越贵,而且毕竟光刻最大尺寸限制在那,所以行业在开始考虑 Chiplet、HBM 堆叠、3D 封装——过去是把晶体管做小,现在是把芯片拼起来。
但多 die 之间的 cache coherency、信号完整性、跨 die 功耗耦合——每一项都是难题,不仅是芯片拼起来了,复杂度也拼一起了。限制 AI GPU 出货的,可能不仅是 GPU 本身,也是 CoWoS 和 HBM 封装产能。
供电成了第一物理约束。
高压供电、液冷、散热、电源管理芯片——AI 已经把数据中心从计算设备变成了高能耗工业设施。
不仅是芯片卖没了,电力重工业设施也都缺货了,发电厂的燃气轮机也是卖断了货,这个大家可能都没有意识到,资源也是最终的决定因素。
ARM 在数据中心快速扩张。
未来数据中心大概这样分工:GPU 训练,ARM CPU 调度,DPU 管数据流,HBM 管内存,光模块管互连。
七条消息串起来,能感觉到一些新的趋势。过去半导体行业的核心壁垒,是先进制程。谁能把晶体管做得更小,谁就掌握产业主导权。但 AI 出现之后,一个新的壁垒开始出现:系统级工程能力。
因为现在决定 AI 芯片上限的,已经不只是单颗芯片性能。而是几万颗芯片能不能稳定运行,软件生态能不能持续迭代,互联、供电、散热能不能长期协同,系统在真实数据中心里能不能几年不出问题。
这背后拼的,不只是架构。是验证体系、软件栈和长期工程积累。这次deepseek v4能在HW上运行,很大程度就是依靠整体设计的超节点,多机柜算力协同,才能稳定运行如此大的模型。
AMD 、英特尔的暴涨,本质上是市场在给成熟工程体系定价。 而国产芯片真正要追上的,也不只是算力。是时间。因为很多东西,真的只能靠几年几年的场景和 bug 堆出来。
互联网时代传输的是信息。AI 时代传输的是算力。而未来 AI 行业最贵的东西,可能不是 GPU。是协同和稳定性。
夜雨聆风