
在AI浪潮席卷全球的当下,市场普遍将目光聚焦于GPU巨头英伟达(NVIDIA),认为其是最大赢家。然而,这种认知已显片面。AI时代的胜负手远不止于单一GPU,而是整个异构计算(Heterogeneous Computing)生态的全面爆发。HBM内存、CPU、ASIC定制芯片、互联技术乃至服务器主板和PCB,都将从中分得巨大蛋糕。AI智能体的兴起,正推动推理任务的打散与重构,让传统CPU重新成为调度中心,整个硬件比例和架构格局都将发生深刻变化。
HBM已超越GPU的“隐形王者”
GPU虽是AI训练与推理的核心算力引擎,但其性能瓶颈早已从计算单元转向内存带宽。高带宽内存HBM正成为AI基础设施中最紧俏的资源。HBM3E/HBM4等产品因能提供海量带宽和容量,已被广泛用于GPU和定制ASIC中。分析显示,AI服务器用ASIC对HBM的需求到2028年将增长35倍,HBM供应紧张局面可能持续到2026年后。
三星、SK海力士、Micron等内存厂商在HBM领域的布局,已使其成为AI供应链中利润最丰厚的环节之一。相比GPU的周期性波动,HBM的“卖方市场”属性更强——几乎所有先进AI芯片都离不开它。可以说,没有足够的HBM,就没有高效的AI大模型部署。HBM的赢家地位,已远超单纯的GPU讨论范畴。
如果说AI芯片领域有哪个环节的稀缺性已经超越了GPU本身,答案只能是HBM高带宽内存。
AI大模型对带宽的需求是指数级的,传统DRAM的“水管”太细,根本无法满足数据洪流的吞吐。HBM通过3D堆叠技术,在极小的物理空间内实现了恐怖的数据传输速率。如今的现状是,买H100卡,瓶颈不在GPU核心,而在HBM的产能。
英伟达的每一代旗舰芯片,都是对HBM产能的极限锁仓。SK海力士、三星和美光的HBM产能早已被抢购一空,订单排到几年后。这揭示了一个残酷又迷人的商业逻辑:当全世界都在挖金子时,卖铲子的人发财;当全世界都在造GPU时,卖HBM的厂商成了“卖铲人的铲人”。HBM厂商所占据的产业链价值,甚至比某些GPU设计厂商更具不可替代性,它们是AI时代第一个确认的超级赢家。
CPU重回牌桌,ASIC开疆拓土
市场的目光短浅之处在于,总是把数据中心简单理解为“插满GPU的机架”。但真正支撑起万卡、十万卡集群的,是一套精密的异构计算架构。GPU管预填充,专用芯片做解码,CPU负责调度——这套混合推理的逻辑,正在重塑芯片的权力格局。
这其中,英伟达的最新动作极具信号意义。当我们还在讨论它的B200 GPU时,它的Vera Rubin 平台已经揭开了下一个战场。作为这套平台的大脑,代号为 Zion 6 plus 的工业级CPU,并非只是配角。这颗采用18A先进工艺、拥有288个能效核和576MB巨量缓存的服务器CPU,展现了一个清晰的趋势:
CPU正在重新成为AI推理的调度中心
在AI智能体时代,推理任务被打散成无数微小、并发、逻辑复杂的子任务。这不再是GPU“大力出奇迹”的领域,而是极度依赖逻辑处理与任务调度的CPU主战场。当AI从简单的“文字接龙”进入复杂的“任务执行”时,CPU与GPU的比例将从此前普遍存在的8:1,极剧回归甚至反转为1:1或1:2。 这意味着,CPU的用量和价值量将迎来一轮暴力拉升。
与此同时,ASIC和ASIC定制芯片正在从侧翼突袭。通用GPU为了普适性,在特定场景下存在大量的算力冗余和能耗浪费。而像博通、迈威尔这样的厂商,正联手谷歌、亚马逊等云巨头,通过定制化ASIC,针对Transformer架构进行极致优化。如果说GPU是万能瑞士军刀,那ASIC就是手术室里的精密激光刀。 在推理成本必须打到地板价的未来,专用芯片的渗透率将不可逆转地提升,它们会成为那个闷声发大财的赢家。
连接的价值,外壳的价值
当英伟达做出 Vera Rubin 这样的超级机架服务器时,数据在芯片间的流动成了生命线。迈威尔所扮演的角色,便是让机架内部的计算结果,进行纵向与横向的高速互联。这种系统级互连技术,是决定一个集群到底是“一麻袋土豆”还是一台“超级计算机”的关键。网络和互连的价值,在百万卡集群时代被无限放大。
单机性能提升有限,AI规模化部署依赖机架级乃至集群级互联。Marvell(迈威尔) 等公司在高速互联领域扮演关键角色,提供纵向(rack内)和横向(跨rack)的低延迟、高带宽解决方案。NVIDIA的NVLink等技术虽强势,但生态中仍有空间给Marvell等提供补充,尤其在自定义ASIC和服务器集成中。
一台完整的Vera Rubin(或类似)机器,包含GPU、CPU、HBM、ASIC、PCB板、电源、冷却以及Dell、Supermicro等OEM的服务器零件——所有这些环节都将受益于AI资本开支的爆发。供应链上下游“一荣俱荣”。
更进一步,我们甚至不能忽视物理层面的构筑者。一台 Vera Rubin 200 机器里面所有的东西,都是赢家,包括看似技术含量不高的 PCB板,以及负责做架构主机的戴尔的零件。当整个AI基础设施的复杂程度指数级上升,系统集成的门槛和溢价能力也随之暴涨。那些能够帮助客户把冷却、供电、互连和结构件完美组装起来的厂商,同样在啃食价值链上最确定的蛋糕。
AI时代没有单一赢家,而是一场生态协同的盛宴。GPU仍是核心,但HBM、CPU、ASIC、互联以及整个服务器链条,都在分享红利。企业与投资者应放宽视野,布局全链条而非押注单一品类。未来,胜者将是那些能高效整合异构资源的玩家——无论是芯片设计者、系统集成商,还是供应链伙伴。
唯有理解“1+1>2”的异构之美,方能在AI浪潮中立于不败之地
夜雨聆风