当前时间: 2026-04-26 19:26:19
更新时间: 2026-04-26
分类:软件教程
评论(0)
国内AI算力超节点方向及产业链生态
前两天写了中科曙光的超节点产业链(中科曙光发布超节点,及相关产业链整理),周五deepseek V4带火了华为的超节点方案,本次就把这几个算力单元放在一起,看看国内的产业链生态情况。
在传统服务器架构中,一个“节点 (Node)”通常指单个物理服务器,在超节点架构中,把成百上千个计算单元通过高速互联技术紧密耦合,协同工作,对外表现为一个巨大的、统一的算力实体。就像一支高度协同的“计算军团”,它的“个体”不是单个士兵,而是整个军团本身。这个“军团”的规模非常惊人,例如:华为最新一代的 Atlas 950 SuperPoD 最多可集成 8192张昇腾AI加速卡;Atlas 960 SuperPoD 更将这个数字提升到 15488张。中科曙光发布的 scaleX640 超节点,则在单机柜内集成了 640张AI加速卡。
华为选择了全光互联方案作为数据的高速公路,一个384卡的超节点总带宽就能达269TB/s。好处是速度快、损耗低,能把更多芯片连在一起。代价是功耗和成本较高,光模块故障率也相对更高,华为是在用更高的前期投入,换取互联性能的绝对领先。华为超节点内部通信单跳时延仅200纳秒。这能让384张加速卡像一台超级计算机一样协同工作,训练效率可达单卡性能的90%,非常适合通信密集的大模型训练任务。华为的资金投入主要为:更高昂的光模块成本、从芯片到软件平台的研发成本,以及前期开拓生态的成本,不过华为称其内存池化技术能将显存扩展成本降低60%。
中科曙光在一个机柜里塞进640张卡,靠超高物理密度把数据传输路径缩短,再搭配自研的ScaleFabric网络技术,同时用上浸没式相变液冷技术,最终把PUE值做到了极致的1.04。它是从全局出发,通过更高效、更低成本的方式来控制算力消耗。曙光单机柜的算力密度是传统集群的20倍,由16个这样的超节点组成的万卡集群,总算力超过了5 EFLOPS。其自研网络可实现小于1微秒的延迟,虽然节点内延迟参数逊于华为,但通过极高的物理密度,使其在需要大规模并行计算的任务中能爆发出巨大的集群算力优势。曙光则走开放架构路线,其scaleX640在硬件层面支持多品牌加速卡,软件层面兼容主流AI生态。这意味着企业不必被锁定在单一供应商,可以选择性价比更高的组件,从而大大降低硬件采购成本和软件迁移、适配的隐性成本,用产业联盟的方式共同分摊研发压力。
国产超节点方案选择了一种极致的系统工程思路,用数量换质量,用带宽换时间,通过在一个超节点内集成数倍于对手的芯片,两种方案在集群总算力和总带宽这两个宏观指标上实现了对英伟达同代产品的超越。在能效方面,中科曙光的PUE 1.04非常亮眼,这不仅降低了电力成本,也为更密集的算力部署提供了物理基础。
阿里云自研的磐久系列单机柜可支持128个计算芯片,更强的迭代版本计划将支持256甚至512个XPU的更大规模互连;字节跳动基于开放架构的基础设施,推出了融合高密度液冷整机柜的大禹超节点,其“星脉2.0”网络架构支持高达1.6万个计算节点的互联;上海“光跃”方案,中兴通讯、曦智、壁仞联合的128卡光互连超节点,基于硅光OCS光交换芯片实现秒级拓扑重构和低延迟数据交换,技术自主性极高;其余如腾讯、百度等互联网大厂,虽未在公开信息中明确以“自研超节点硬件”品牌示人,但均已明确采用超节点设计的新一代服务器和英伟达进行赛跑。
烽火通信,旗下子公司长江计算是昇腾超节点服务器的重要合作伙伴,并已中标中国移动AI超节点集采项目;
中科曙光,发布了全球首个单机柜640卡超节点scaleX640,其万卡超集群已完成400多款主流大模型的适配;
华勤技术,智能硬件ODM龙头,为阿里云磐久AI服务器提供整机设计与制造服务;
海光信息,国产高端处理器龙头,其DCU(深度计算处理器)已宣布完成对DeepSeek V4模型的适配;
寒武纪,国产AI芯片独角兽,其思元系列AI芯片已完成对DeepSeek V4模型的“Day 0”适配;
澜起科技,全球领先的内存接口芯片供应商,为超节点服务器提供高速内存互联解决方案;
芯原股份,半导体IP授权和一站式芯片定制服务龙头,受益于AI芯片设计需求增长;
英维克,数据中心温控龙头,为超节点高密度算力集群提供精密温控节能解决方案;
高澜股份,电力电子装置用纯水冷却设备供应商,其液冷产品可应用于高功耗的AI服务器;
盛科通信,以太网交换芯片设计企业,其产品是超节点内部高速数据交换的核心部件;
博创科技,光模块和光器件供应商,受益于超节点内部光互连方案带来的高带宽需求;
华丰科技,高速背板连接器供应商,其产品是超节点机柜内部信号传输的关键环节;
浪潮信息,国产服务器龙头,其发布的“元脑SD200”服务器是国内典型的64卡中型超节点方案;
紫光股份,旗下新华三发布有UniPod S8000(64卡)等超节点产品;
中兴通讯,公司联合合作伙伴共同推出了国内首个光互连光交换GPU超节点“光跃”128卡商用版;
沐曦股份:推出业界首创的3D Mesh互连耀龙S8000 G2超节点,实现了64张GPU高速互连,并深度参与编撰权威白皮书。