Q:2026 年国内 AI 推理算力需求呈现怎样的态势?核心驱动力是什么?
A:2026 年国内 AI 推理算力需求呈现爆发式增长态势,算力缺口相较于 2025 年持续扩大,大模型推理、搜索广告推荐垂直领域以及一体机私有云推理场景均处于供不应求的状态。核心驱动力主要来自两方面,一是海外芯片供应受限,英伟达 H20 自 2025 年起无法在国内销售,独家的 H200 仍处于审批阶段且获批数量有限,企业更倾向将其用于模型训练而非推理环节;二是国产 AI 芯片供应能力不足,2025 年国产芯片整体供货紧张,寒武纪 MLU590 性能优异但产能紧缺,华为昇腾 910B 推理效果差、910C 性价比低且出货量少,昆仑芯三代产品主要供应百度,阿里平头哥自研芯片产能有限,多重因素叠加致使 2026 年 AI 推理算力供需失衡问题进一步加剧。
Q:2026 年国内主要互联网厂商的 AI 推理芯片需求量级如何?
A:2026 年国内 AI 推理芯片的需求核心集中在字节跳动、阿里巴巴两大厂商,腾讯的采购规模则有望成为市场重要变量。其中字节跳动的推理芯片缺口约130 万张,主要用于支撑搜索广告推荐业务与部分大模型推理场景;阿里巴巴的推理芯片缺口接近100 万张,需求结构与字节跳动基本一致。腾讯在 2025 年因原计划采购英伟达 H20 受阻,相关资本开支未能有效落地,国产化替代进程相对滞后,2026 年正加速推进国产芯片替代工作,其采购量大概率能达到与阿里、字节相近的量级。相较之下,百度、美团、京东等企业的 AI 推理芯片需求量较小,难以对整体市场格局产生显著影响。
Q:腾讯 2026 年 AI 推理芯片的采购策略与供应商优先级是怎样的?
A:2026 年腾讯在 AI 推理芯片采购上,优先选择寒武纪与昆仑芯,这两家厂商已成为其核心供应商,同时腾讯也在与沐曦推进合作洽谈。昆仑芯方面,腾讯 2025 年已完成数万张芯片采购,2026 年计划采购量提升至十万张以上;寒武纪方面,双方在 2025 年底就签订了 2026 年十几万张 MLU590 的框架合同,2026 年第一、二季度均有交付计划,且目前还在洽谈 MLU580 的采购订单。由于 2023 年采购华为昇腾 910B 后实际使用体验不佳,腾讯对华为相关产品信任度较低,现阶段暂未明确华为芯片的采购计划。腾讯与沐曦的合作仍处于洽谈阶段,2026 年一季度已商谈好大几万张的框架协议,其中沐曦 C500 和 C550 的订单相对确定,C600 订单则存在较大不确定性。
Q:寒武纪能否满足腾讯对 MLU580 的采购需求?字节跳动的采购情况对其有何影响?
A:寒武纪完全具备满足腾讯 MLU580 采购需求的能力。此前字节跳动曾向寒武纪给出大几十万张 MLU580 的采购预期,寒武纪也依据该预期完成了充足的产能备货,不过字节跳动最终实际下单量未达到前期预期,直接导致寒武纪 MLU580 约一半产能出现空余。这部分空余产能预计绝大部分可供应给腾讯,即便腾讯无法完全消化,阿里巴巴也明确表达了采购意向,因此 MLU580 整体供给相对充裕。交付模式上,寒武纪会先将芯片交付给浪潮等 OEM 厂商,由厂商组装成 16 卡服务器后再交付给腾讯,该模式与寒武纪向字节跳动的交付形式一致,仅合作的 OEM 厂商存在差异。
Q:当前存储颗粒供应紧张对国产 AI 芯片交付有何影响?不同存储类型的供应状况如何?
A:当前存储颗粒供应紧张,主要对采用特定存储方案的国产 AI 芯片交付造成影响,不同存储类型的供应情况差异显著。GDDR6 方面,因三星停止对外单独销售该产品,仅为英伟达等头部显卡厂商保留产能,市场出现严重缺货,直接影响采用该存储方案的思元芯片交付;HBM3 和 HBM3e 产能紧缺,核心原因是三星、海力士等主流厂商将部分产线转向下一代 HBM4 和 HBM4e 生产,现有 HBM3 系列产量大幅下降;HBM2e 供应稳定且充裕,三星、海力士持续量产,国内长鑫存储也已实现该存储颗粒量产。因此采用 HBM2e 的寒武纪 MLU580/590、沐曦 C500/C550 交付不受存储颗粒影响,而计划采用 HBM3/HBM3e 的寒武纪 MLU690、沐曦 C600、华为昇腾 950DT,则大概率面临交付延迟的挑战。
Q:2026 年国央企的 AI 算力采购规模、市场份额及采购偏好是怎样的?
A:2026 年国央企 AI 算力采购需求将迎来显著增长,2025 年政府推出的算力补贴政策,预计在 2026 年二、三季度以算力形式落地实施,这将加速地方政府智算项目与运营商智算项目的建设进度。市场份额分配上,互联网行业 AI 算力采购占比达 50%-60%,国央企相关智算项目合计占比 30%,剩余 10%-20% 由私有云项目与小规模大模型企业构成。采购偏好方面,国央企并非完全排斥英伟达产品,在合规审批通过的前提下,可通过浪潮等供应商采购搭载 H200 或 H20 的服务器,但受芯片制裁及 H20 存在安全漏洞等因素影响,国央企出于数据安全考量,已基本转向以采购国产 AI 芯片为主。
Q:国央企智算项目中,国产 AI 芯片厂商的采购优先级如何?2026 年厂商承接意愿有何变化?
A:国央企智算项目的国产 AI 芯片采购优先级中,华为位居首位并占据市场主导地位,其次为海光;寒武纪原本应位列第三,但因产能主要优先供应字节跳动、腾讯等互联网大厂,交付能力不足,导致其在国央企市场的份额大幅下滑,其余厂商则主要依靠地方政府政策支持获取相关项目。厂商承接意愿方面,2023-2025 年国产 AI 芯片市场销路不佳,国央企智算项目是厂商重要营收来源,彼时各厂商接单意愿普遍较高;2026 年随着互联网等商用客户需求大幅放量,国产芯片厂商的业务优先级发生转变,例如沐曦将业务重心从上海智算项目调整为优先保障阿里、腾讯等互联网客户供应,仅在产能允许的情况下才会承接国央企项目,对国央企项目的承接优先级已明显降低。
Q:字节跳动在 AI 推理芯片采购方面有哪些具体动作?对市场供应格局有何影响?
A:字节跳动作为国内 AI 推理芯片需求大户,采购动作十分积极,已向华为昇腾下达约三四十万张 950PR 的采购订单,同时针对华为昇腾 910 系列芯片也在持续下单,是华为昇腾芯片放量的核心承接方。此外,字节跳动前期曾向寒武纪给出大几十万张 MLU580 的采购预期,虽最终实际下单量未达预期,致使寒武纪 MLU580 约一半产能空余,但仍占据了寒武纪的部分产能。字节跳动的大规模采购,一方面有力支撑了华为昇腾、寒武纪等厂商的产能释放,另一方面也影响了寒武纪向国央企智算项目的交付能力,间接重塑了国内 AI 推理芯片市场供应格局,也让腾讯等厂商得以承接寒武纪的空余产能。
Q:2025 年国产 AI 推理芯片的供应状况如何?为何未能缓解 2026 年的供需失衡?
A:2025 年国产 AI 推理芯片供应存在明显短板,整体供货能力无法满足市场需求,这也直接导致 2026 年 AI 推理算力供需失衡问题进一步加剧。具体来看,寒武纪 MLU590 性能表现优异但供货量严重不足;华为昇腾 910B 推理效果较差,头部互联网厂商采购意愿极低,910C 性能偏高但推理场景性价比不足,加之华为后续整合超算集群,致使该系列芯片出货量极少;昆仑芯三代产品性能尚可,但主要定向供应百度,供应链受限明显;阿里平头哥虽有自研 AI 推理芯片,但自身产能同样有限。2025 年初英伟达 H20 尚可采购,国内头部大厂上半年引入约五六十万张,一定程度上弥补了国产芯片的供应缺口,但 2026 年 H20 全面禁售、H200 获批数量有限,2025 年国产芯片遗留的供应短板未能得到补齐,最终使得 2026 年 AI 推理芯片供需失衡问题愈发严重。
Q:不同国产 AI 芯片厂商的产品定位与市场布局有何差异?
A:国内各 AI 芯片厂商的产品定位与市场布局各有侧重,形成了差异化竞争格局。华为昇腾系列中,910B 推理效果不佳、910C 性价比偏低,950PR、950DT 则定位高端市场,主要供应字节跳动等头部互联网大厂及国央企智算项目,牢牢占据国央企市场主导地位;寒武纪 MLU580、MLU590 采用 HBM2e 存储方案,交付稳定性强,核心供应字节跳动、腾讯等互联网大厂,MLU690 计划采用 HBM3 存储,瞄准下一代高端 AI 芯片市场;昆仑芯三代产品 2025 年主要供应百度,2026 年成为腾讯核心供应商,腾讯计划进一步扩大其采购规模;沐曦 C500、C550 订单落地性较强,C600 订单存在不确定性,2026 年业务重心转向互联网客户;海光则聚焦国央企智算项目,在国央企采购优先级中位列第二,市场份额保持稳定。
夜雨聆风