乐于分享
好东西不私藏

AI 算力的 “咽喉”:Switch 芯片全球格局与国产替代全景

AI 算力的 “咽喉”:Switch 芯片全球格局与国产替代全景

什么是Scale-Up和Scale-Out ?弄清楚这一点,能很好的帮助阅读文章。

Scale-Up :是把单个机柜或服务器内部的 GPU、算力与带宽直接拉满,靠内部高速互连让单机性能更强,追求低延迟、高速度

Scale-Out: 是把大量服务器或机柜通过网络连成大规模集群,靠增加节点数量扩展总算力,适合超大模型训练。简单说,一个是把单机做到极致,一个是用大量服务器和机柜组成庞大算力系统。

 芯科技圈 挖掘到东吴证券Switch 芯片研究框架(一):GPU-GPU 互 连,从 Scale-Up 到 Scale-Out 的格局如何?》下面把学习到的干货与老铁们一起共享,共同成长进步!

更多详细内容欢迎各位朋友微信扫码加入芯科技圈知识星球获取完整报告详读,可能每位行业人士阅读教材的理解程度都是不同的!

一、全球主流 Switch 芯片厂商格局

1.1 Scale-Up:机柜内 GPU 紧耦合互连核心芯片

NVSwitch:私有协议 Scale-Up 绝对主导NVSwitch 是 NVIDIA 专属GPU 直连交换芯片。

历经6代Pascal→Volta→Ampere→Hopper→Blackwell→Rubin 六代演进,Blackwell 平台单芯片双向带宽达1.8TB/s,是当前业界带宽最高、部署最成熟的 Scale-Up 私有方案单机柜最大支持 72 颗 B200 GPU 全互联。

博通 SUE:以太网开放 Scale-Up 标准破局者博通以90% 市占率掌控数据中心交换市场,推出SUE 开放规范,免费开放生态,试图将 AI Scale-Up 互连标准化,对标 NVLink 封闭生态;Tomahawk Ultra(51.2T)、Tomahawk 6(102.4T)支撑 SUE 架构,单跳可连 ≥1024 个 XPU,规模为 NVLink 方案 3 倍以上。

Astera Labs(ALAB):PCIe/UALink 双模 Scale-Up 全栈玩家ALAB 是全球唯一交换芯片 + 延长线 + 软件管理平台一体化厂商,Scorpio X 系列通过 NVIDIA Blackwell 验证;主推UALink 开放标准(AMD/AWS/ 博通 / 谷歌联合定义),200G 速率、时延<1μs、功耗降 40%,支持机柜内1024 颗加速器互联,直指 NVLink 垄断。

1.2 Scale-Out:跨机柜大规模 AI 集群互联芯片

博通:全场景覆盖的交换芯片霸主构建Tomahawk(高端)+Trident(中端)+Jericho(低端) 三大系列,Tomahawk 5(51.2T/5nm)支持 64×800G 端口,12 年带宽提升 80 倍、能耗降 90%,是 AI 集群 Leaf-Spine 骨干核心芯片。

Marvell:高端数据中心 AI 交换核心供应商收购 Innovium 补齐高端产品线,Teralynx 10(51.2T/5nm)实现500ns 超低时延、1W/100G 低功耗,支持 64×800G 端口,对标博通 Tomahawk 系列,锁定超大规模 AI 集群互联。

二、 Switch 芯片国产替代路径

2.1 独立芯片厂商:技术突破与规模落地

盛科通信:国产以太网交换芯片绝对领跑者产品覆盖100G~25.6T交换容量、100M~800G 端口速率,25.6T 高端芯片已量产,导入新华三、锐捷等主流设备商供应链,是数据中心国产替代核心标的。

数渡科技:PCIe 5.0 交换芯片国产先行者PCIe 5.0 交换芯片进入客户导入 + 小批量阶段,2025 年底有望实现批量供货,突破国产 AI 芯片互联瓶颈。

澜起科技:Retimer 向 PCIe/CXL 全互联延伸以 Retimer 为入口,布局Retimer→MXC→Switch全产品线,PCIe 6.x/CXL 3.x Retimer 送样达标,自研 SerDes,卡位 AI 底层互联

2.2 大厂自研:生态 + 整机协同突围

海光信息:开放 HSL 协议抢占 Scale-Up 生态面向全栈开放HSL CPU 互联总线,打通 CPU-GPU-Switch 全链路,构建自主算力互联底座。

华为:51.2T 交换芯片 + 灵衢协议 + 超节点全栈布局自研 51.2T 液冷交换芯片,发布灵衢 2.0 开放互联协议,Atlas 超节点支持万卡级集群,算力、带宽、规模全面领先。

中兴通讯:AI 超节点交换芯片自研落地五代交换芯片迭代,自研 AI 交换芯片支撑400GB/s~1.6TB/s GPU 间带宽,支持千卡级高效互联。

新华三:智擎 NP 芯片补齐网络处理能力智擎 660 芯片(16nm/1.2Tbps)支持 L2~L7 全层处理,覆盖核心网、数据中心高端场景。

文章篇幅有限,50页完整教材已上传到芯科技圈知识星球。欢迎扫码加入获取学习~

//—END—//

免责声明:内容基于网络公开报告,仅供学习交流。版权归原机构所有,侵权请联系删除。

原创不易,感谢大家为勤奋持续的小编打赏,您的支持是我们最大的动力!