
顶级形态

芯片级封装异构(CPU+AI 芯片 Die-to-Die 直连、硬件统一内存),代表为英伟达GB200;
主流形态
系统级 / 集群级异构(板级 PCIe/CXL 互联、软件统一调度),华为鲲鹏 + 昇腾是国产该路线的唯一全栈商用标杆。国产现状:无对标 GB200 的芯片级异构产品,但系统级异构已实现全球第二的规模化落地;追赶逻辑:短期靠集群架构补性能,中期靠 Chiplet 补封装,长期靠标准生态补壁垒。
一、国产异构计算(鲲鹏 + 昇腾)真实现状
1. 硬件架构:系统级异构成熟,无芯片级 CPU-NPU 合封
异构分工
严格遵循报告「CPU 控制面 + NPU 算力面」标准,鲲鹏 920/950 负责任务调度、数据预处理,昇腾 910/950 NPU 负责 Transformer 算子加速,纯自主指令集异构协同;
集成形态

全系为PCIe 5.0/CXL 板级互联,无鲲鹏 CPU 与昇腾 NPU 的 Chiplet 合封产品;昇腾 910C 仅实现NPU 内部双 Die 同构封装,不属于 CPU+NPU 异构;
集群突破
报告点名华为 Atlas 950 SuperPoD为国产标杆,支持 8192 卡 NPU 全互联,通过自研总线实现集群级异构协同,是国内唯一万卡规模商用的自主异构平台。
2. 软件栈:异构调度全栈自主,解决核心易用性瓶颈
实现鲲鹏 CPU + 昇腾 NPU 的算子级细粒度拆分,自动分配异构负载,资源利用率较传统架构提升 40%;
CANN Next 兼容 SIMT 编程模型,CUDA 代码迁移成本降低 70%,匹配报告「异构生态兼容」核心要求;
支持全局内存软件统一编址,替代硬件级共享内存,缓解千亿大模型内存墙问题。
3. 产业落地:规模化商用闭环,完成「可用→好用」跃迁
算力规模:千卡集群普及,万卡集群落地国家电网、头部大模型厂商,集群利用率稳定 90%+;
差异化优势:全液冷架构适配单机柜 100kW + 高密度算力,PUE≤1.1,符合报告「绿色低碳」趋势;
生态格局:国内 AI 计算节点中,鲲鹏 + 昇腾市占率超 70%,是国产异构的绝对主力。
二、与英伟达 GB200 的代际硬差距
表格

华为无任何商用 CPU-NPU Chiplet 产品,不存在对标 GB200 的 SuperChip;
CloudMatrix 超节点的高带宽仅针对NPU 间集群互联,CPU-NPU 仍受 PCIe 瓶颈限制;

国产异构的优势是自主可控 + 集群效率,而非单芯片集成能力,这是报告明确的产业定位。
三、信通院指引下的三层追赶策略
短期(2026-2027 年):放大系统级优势,集群效率抹平硬件差距
超节点架构极致优化
规模化落地 Atlas 950 SuperPoD,实现 NPU 全互联无阻塞拓扑,落地报告提出的HBD 高带宽域架构;
CXL 内存池化破局
用 CXL 3.0 实现跨节点内存共享,替代硬件统一内存,解决万亿模型内存瓶颈,这是报告重点推荐的弯道技术;
CANN 生态闭环
全面开源异构编程接口,实现 CUDA 算子 1:1 无缝兼容,降低异构开发门槛;
高密度液冷规模化
单机柜算力密度提升至 120kW,靠绿色算力形成商业化差异化优势。
中期(2028-2030 年):攻克 Chiplet 封装,实现封装级异构突破
分步突破封装技术
先量产昇腾 NPU 多 Die Chiplet(已技术验证),再攻克鲲鹏 CPU + 昇腾 NPU 合封,采用国产 2.5D 封装替代台积电 CoWoS;
自研 Die-to-Die 高速总线
对标 NVLink-C2C,实现 CPU-NPU 片内带宽≥500GB/s,消除 PCIe 瓶颈;
硬件统一内存落地
实现异构芯片物理内存共享,零拷贝数据交互,彻底抹平与 GB200 的核心技术差距。
长期(2030 年 +):定义自主标准,生态反超构建壁垒
主导异构互联标准
深化 ETH-X、ODCC 国产协议,替代 NVLink/IB 私有协议,实现全球异构硬件兼容;
原生异构架构创新
设计训推一体的自主异构芯片,针对大模型算子做架构级定制,脱离英伟达技术路径;
全产业链自主闭环
打通 HBM 内存、先进封装、光互联全链条,彻底摆脱外部供应链限制。
四、终极投研结论(可直接用于报告 / 研报)
现状定论
鲲鹏 + 昇腾是全球第二、国内第一的自主异构计算方案,系统级能力成熟,芯片级封装仍空白,无对标英伟达 GB200 的 SuperChip 产品;
差距本质
不是算力落后,是集成形态代差,英伟达走「单芯片极致集成」,华为走「集群系统级创新」,二者均符合信通院异构技术定义;
追赶核心
无需盲目追单芯片,优先抓封装 + 互联 + 生态,短期靠集群效率满足商用需求,中期靠 Chiplet 补齐硬件代差;
产业价值
鲲鹏 + 昇腾已实现自主可控的异构算力闭环,是国内大模型、智算中心的唯一兜底方案,完全匹配国家算力安全战略。
更多精彩内容进星球,仅限公众号有过付费阅读的兄弟

往期文章:
本篇只有代码,不知是善缘还是孽缘{置顶到12月31日}(全年有效)
一篇说完近期寒武纪事件和中期发展(产品结构和订单情况)
解读寒武纪2025年报及2026一季度预期(一季报预期和全年展望)
夜雨聆风