AI算力格局专家交流纪要

Q1：agent 业务爆发，到底给 CPU、存储带来了多大的刚性需求？底层逻辑是啥？

A：近期Agent 业务爆发彻底改写 AI 交互逻辑，催生多核 CPU + 大容量存储强刚性增量需求，也是当下算力板块核心核心变量。过往 AI 应用以模型直连对话为主，算力消耗集中在 GPU 模型推理；自 2025 年四季度至 2026 年一季度，海外开源 Agent 产品、阿里悟空、龙虾版生意管家及千万级 C 端 AI 应用全面落地，循环式 Agent 运行模式成为主流。该模式下，前端对话触发后台多专家模型联动，持续完成推理、执行、反思闭环流程，多核高核 CPU成为流程编排、任务下发的核心瓶颈，也是底层核心逻辑。算力分工明确：常规 32 核 CPU 负责数据预处理，新增多核 CPU承接 Agent 调度工作，一旦多核 CPU 算力拥堵，GPU 即便闲置也无法运转。2 月 6 日某头部 APP 因海量 Agent 请求占满 CPU，任务下发中断、GPU 集体空转，最终依靠扩容多核 CPU才恢复千万级日常请求。从任务算力消耗量化来看：简单任务单任务占用0.2 个 CPU 内核，单内核可承载 5 个任务；中等任务单任务占用1 个 CPU 内核；复杂任务单任务占用5 个 CPU 内核。规模推演层面，100 万并发用户场景下，简单任务需20 万个 CPU 核、15 万张 GPU 卡、8PB 存储，CPU 与 GPU 配比约4:1；中等任务需100 万个 CPU 核、20 万张 GPU 卡、32TB 存储。若落地至 1 亿订阅用户、按 10% 并发测算，需2000 万个 CPU 核，折算 96 核高核 CPU 约20 万颗，配套近250 万颗重卡级 GPU，日均新增数据量986TB。当前头部厂商 C 端产品均冲刺8000 万 - 1 亿日活，高核 CPU 刚需增量明确，供需缺口长期存在。

Q2：阿里云 2026 年资本开支总规模多少？芯片采购预算具体怎么分？

A：阿里云 2026 年整体资本开支严格控制在1200 亿 - 1600 亿区间，其中AI 服务器相关投入 1040 亿，专项芯片采购预算 650 亿，资金全部聚焦算力基础设施建设，各品类预算划分清晰。第一，英伟达芯片：预留190 亿 - 200 亿预算，受出口管制影响 H200 暂无法准入，预算作为后续政策松口后的备用储备。第二，智眼芯片：全年量产规划40 万颗，对应预算200 亿，同步推进 N+1、N+2 版本迭代，持续落地产能释放。第三，升腾 910 + 升腾 910B：合计采购15 万颗，预算120 亿，目前已进入量产阶段，头部企业已完成样片验收测试。第四，寒武纪芯片：采购规模小幅收缩，全年采购约4 万颗，对应预算4 亿，较前期 5 万颗的预期有所下调。第五，升腾 590/690：采购量1-2 万颗，预算接近30 亿。除此之外，OPR 等其他小众自研芯片处于起步扩容阶段，合计占用部分补充预算。区域投放维度，国内资本开支占比超 60%，重点扩建政企、金融领域专属算力节点；海外布局集中于新加坡、马来西亚、日韩、墨西哥、泰国等地区，其中新加坡周边算力集群启动新一轮扩容，完善全球化算力布局。

Q3：阿里云现在 CPU 资源供需情况怎么样？高核 CPU 涨价、交期如何？

A：阿里云 CPU 呈现低核过剩、高核紧缺的结构性分化格局，叠加 Agent 需求爆发，高核 CPU 全面涨价、交付周期大幅拉长，供需矛盾持续加剧。存量资源方面，阿里云现有200 多万台服务器，其中80% 为 32 核及以下低核 CPU，适配传统移动互联网业务，日常负载率50%-60%，高峰时段达65%，供需基本平衡；而 AI 刚需的96 核、128 核高核 CPU，存量占比仅10% 出头，完全无法匹配业务扩张需求。需求缺口量化明确：低核 CPU 年度常规替换量40 万颗；仅 C 端亿级日活战略目标，就需要新增20 万颗以上高核 CPU，保守测算下缺口持续扩大。供应链格局上，英特尔、AMD 仍是高核 CPU 核心供应商，过往采购占比超70%，2026 年小幅回落至60%，凭借性能与功耗优势维持主导地位。价格与交付端，行业统一调价，高核 CPU 全线涨价 40%-50%，无差异化议价空间；交货周期从常规周期拉长至16-18 周。供需紧张核心原因在于先进制程产能分配，台积电高端产能优先供给 AI GPU，叠加显存产能不足，进一步挤压高核 CPU 产能。国产 CPU 成为核心补充方向，海光 X86、华为鲲鹏 ARM、阿里倚天、玄铁 C950 逐步落地，2026 年国产 CPU 采购占比提升至30%-40%，逐步降低对海外芯片的依赖度。

Q4：国产 AI 芯片现在真实性能怎么样？和海外芯片差距有多大？

A：结合一线实测数据，以英伟达 H100为核心参照基准，从单机性能、软件生态、集群稳定性三大维度量化对比，升腾芯片稳居国产第一梯队，其余品类稳步追赶，国内外差距持续收窄。性能层面，各品类差异化显著：升腾 P801综合性能达到 H100 的85%，IP15 数值500+，单价13-15 万，为当前国产性能天花板；升腾常规款性能为 H100 的35%，性能介于 H20 与 A100 之间；海光芯片性能达 H100 的45%，2026 年将推出升级迭代版本；其余中小厂国产芯片性能均低于 H100 的50%，内容生成能力存在明显短板。软件生态采用百分制打分：升腾 88-89 分，生态完善度领先，算子库持续迭代优化，逐步缩小与海外芯片差距；华为 80 分，集群适配能力突出，万卡集群综合适配表现优异；海光 72 分，依托 X86 授权落地门槛低，但千卡集群稳定性不足；寒武纪 68 分，优化成本高、上线周期长，软件适配复杂度偏高。集群稳定性以无故障运行时长、年度故障率为核心指标：升腾无故障连续运行35 天，年度故障率14%；海光无故障连续运行25 天；寒武纪无故障连续运行20 天，年度故障率30%。整体来看，升腾系列已实现从 “能用” 到 “好用” 的跨越，可支撑大规模 AI 训练与推理业务；其余国产芯片仍需在生态适配、集群运维层面持续优化，逐步缩小与海外高端芯片的差距。

Q5：阿里云九超节点实际效果如何？单位 token 成本能降多少？渗透率怎么样？

A：九超节点依托自研芯片方案实现极致降本，但受限于高功耗、高成本属性，定位为战略补充而非全面替代，整体渗透率偏低，仅聚焦核心高价值算力场景。成本优化方面，九超节点全自研芯片架构对比英伟达方案，硬件综合成本降低 85%；全面量产落地后，整体单位 token 成本下降 45%。定价体系保持统一，对外商业化产品不降价，仅内部算力租赁出现价差，自研芯片算力租金显著低于英伟达芯片；内部 APP 自研业务落地后，百万 token 综合成本下降四至五成。部署与渗透率层面，2026 年九超节点目标部署1000 个，当前在手落地订单600 个，在整体推理集群中渗透率仅 15%，短期难以成为主流算力载体。核心限制因素为功耗与投入成本，九超节点单机柜峰值功耗达350kW，而常规机柜功耗仅80-100kW，高额电力成本限制大规模普及。业务定位清晰，核心承载大模型训练、高优先级推理两大核心业务，依靠大内存池化、高速互联架构提升算力效率；同时50% 超节点资源对外交付，重点服务国家电网、央企等政企大客户，剩余资源供给内部核心 AI 业务。中长期算力结构中，80% 以上常规推理任务仍依靠标准 GPU 服务器承接，九超节点作为差异化算力补充，完善高低搭配的算力布局。

Q6：4 月 18 日 AI 算力卡涨价，具体怎么涨？受影响客户怎么划分？

A：阿里云官宣4 月 18 日启动算力产品调价，实行分品类差异化涨价，客户执行 “老合同老价格” 平稳过渡规则，调价将显著拉动整体利润增长。涨价幅度分三大品类：一是通算类产品，包含 ECS、容器等通用算力，统一涨价5%；二是AI 与高性能计算实例，覆盖 GPU 卡、AI 加速卡，涨价幅度21%；三是大内存及内存密集型产品，涨价幅度最高，达到35%。利润影响量化清晰，ECS 贡献阿里云55%营收，5% 涨幅可拉动整体利润提升2.5 个百分点；PaaS 层营收占比25%-30%，叠加相关产品大幅涨价，预计带动利润增加8-9 个百分点，盈利弹性显著。客户划分采用非一刀切模式，严格遵循老客户老价格，新客户新价格原则：2025 年 4 月 18 日前签约的存量客户，合同存续期内维持原有定价，合同到期续签后自动切换新价格；例如 2025 年 6 月签约客户，需至 2026 年 6 月合同结束后才执行涨价政策，避免短期成本冲击。成本对冲层面，一方面依靠飞天系统智能调度提升算力整体利用率，摊薄固定成本；另一方面加速国产化芯片替代，降低高端海外芯片采购依赖，从供应链端对冲硬件涨价压力。

Q7：阿里云 “一星一云多芯” 怎么实现统一调度？怎么提升芯片利用率？

A：阿里云一星一云多芯异构算力架构，依靠业务隔离 + 飞天系统精细化调度两大核心手段，解决多架构、多品牌芯片兼容难题，将整体算力利用率稳定维持在65%-70%。第一，分层业务隔离。按照芯片架构、生态适配性完成集群划分，将海光、自研芯片、生态兼容芯片整合为统一集群；架构不兼容、模型适配差异较大的芯片单独分区部署，避免混合调度引发系统故障。不同芯片集群匹配专属业务场景，结合模型定制化优化，从源头降低异构调度损耗。第二，飞天系统全域算力调度。平台对底层 CPU、GPU 资源进行颗粒度拆解，拆分出 1/8 核、1/14 核等轻量化算力单元，可根据 Agent、推理、训练等不同任务量级，灵活分配碎片化算力，杜绝资源闲置浪费。同时实时监测各集群算力峰值、空闲负载，动态调配任务流量，将轻量推理、复杂训练、Agent 调度等不同需求，精准匹配至适配芯片集群。所有大模型、行业模型均提前完成多芯片适配优化，保障跨芯片调度后的运行稳定性。最终通过双层管控模式，打通异构算力壁垒，最大化盘活存量芯片资源，降低算力闲置损耗与综合运营成本，适配多芯国产化替代的长期战略。

Q8：玄铁 C950 和 X86 架构芯片对比，有价格优势吗？RISCV 架构要崛起了？

A：玄铁 C950作为阿里自研 RISCV 架构芯片已实现量产，对比主流 X86 架构芯片在硬件参数上存在一定差距，但具备自主可控、内置 NPU 等独特优势，短期无明显价格优势，RISCV 架构全面替代仍需长期迭代。硬件参数差距方面：一是主频差距，玄铁 C950 主频3.2GHz，海外头部 X86 芯片主频可达3.8-4GHz以上；二是制程受限，海外 X86 普及 5 纳米以下先进制程，玄铁受国内产能约束，仅能落地国产 N+1 成熟制程；三是缓存差距，X86 芯片三级缓存最高512 兆，玄铁 C950 仅256 兆。核心竞争优势体现在三大维度：自主可控，依托国内成熟制程生产，完全摆脱台积电及海外产能限制；内置 NPU 推理模块，可独立承载小模型推理、Agent 沙箱、矩阵计算等轻量化任务，纯 X86 芯片无配套推理能力；原生支持机密计算，单核训练基础测试顺利落地，适配政企安全算力需求。价格层面暂无公开定价差，现阶段核心价值为供应链安全，随着量产规模扩张，长期成本优势将逐步显现。行业格局来看，RISCV 架构短期难以全面崛起，核心瓶颈在于生态适配，Windows、鸿蒙操作系统、中间件、数据库等配套生态仍需持续完善。长期规划明确，未来两至三年，玄铁系列 RISCV 芯片在服务器 CPU 中占比，将从当前个位数提升至20%-25%，以渐进式替代为主，不会快速冲击 X86 主流格局。

Q9：2026 年 AI 芯片采购节奏怎么样？升腾、海光、寒武纪什么时候下单？

A：2026 年阿里云 AI 芯片采购节奏明确、分批落地，自研芯片率先放量，升腾、海光、寒武纪分季度推进测试、下单、交付，国产化采购节奏有序可控。第一，阿里自研芯片：4 月起全面启动放量交付，维持每周2-3 万片稳定供货，为上半年芯片采购核心主力，保障 C 端 AI 业务算力扩容。第二，升腾 910 系列：3 月中旬完成样片接收，现阶段测试8 台 64 卡服务器；5 月扩容至 16 台 128 卡小集群开展联网压力测试；6 月下旬启动大规模集中下单。全年15 万颗采购量拆分，上半年交付8 万颗，剩余7-8 万颗集中在下半年交付。第三，海光芯片：已有1-2 万卡存量储备，2026 年持续议价，目标将单价从6-7 万下调至4-5 万，5 月中下旬（二季度中期）下达第一波大额采购订单。第四，寒武纪芯片：进度相对滞后，4-5 月集中修复软件系统 BUG，同步保障升腾 590 产能交付；6 月底分批接收小额订单，全年采购规模有限。除此之外，平头哥自研芯片已累计规模化交付近 50 万颗，下一代产品优化升级，功耗较现有版本下降30%，算力提升至120-128TOPS，中后端算力可达240TOPS，后续迭代潜力充足。

Q10：2026 年芯片采购 70% 国产化率目标，怎么分解落地？

A：2026 年70% 芯片国产化率目标具备明确政策与业务支撑，为确定性落地目标，依靠政策引导、集采约束、需求倒逼、全环节拆解四大路径稳步推进。第一，国家政策强力引导。高端英伟达芯片进口管控持续收紧，H200 等产品审批受限，刻意留出国产芯片替代窗口期。2026-2027 年为国产算力打磨黄金周期，倒逼互联网大厂、云厂商加速国产芯片适配调试，快速提升产品成熟度。第二，央企集采硬性约束。政企、运营商、国企采购大单明确优先选用国产芯片，通过订单绑定推动海光、升腾等芯片规模化落地；超节点等核心算力项目同步捆绑国产硬件交付，在实战场景中优化稳定性。第三，业务高速增长倒逼替代。AI 算力需求持续爆发，当前日均 token 处理量接近120 万亿，年底目标200-250 万亿，四季度冲击150-200 万亿区间。海外芯片扩容见顶、进口受限，仅依靠国产芯片新增产能，才能突破算力瓶颈，保障 AI 业务持续扩张。第四，全产业链目标拆分。70% 国产化率覆盖GPU、NPU、PPU、网络、存储全核心硬件，而非单一品类：GPU 端依靠升腾、阿里自研芯片承接；CPU 端落地海光、玄铁 RISCV 芯片；存储、网络等配套硬件同步推进国产替代。各环节制定分阶段落地指标，按月度、季度考核推进，循序渐进完成替代目标。整体而言，2026 年为 AI 算力行业关键转折年，Agent 引爆高核 CPU 刚需，算力涨价周期延续；国产芯片完成从 “能用” 到 “好用” 的跨越，70% 国产化率落地节奏清晰；千亿级资本开支全面聚焦算力基建，算力自主可控成为行业核心发展主线。