Q1:agent 业务爆发,到底给 CPU、存储带来了多大的刚性需求?底层逻辑是啥?
A:近期Agent 业务爆发彻底改写 AI 交互逻辑,催生多核 CPU + 大容量存储强刚性增量需求,也是当下算力板块核心核心变量。过往 AI 应用以模型直连对话为主,算力消耗集中在 GPU 模型推理;自 2025 年四季度至 2026 年一季度,海外开源 Agent 产品、阿里悟空、龙虾版生意管家及千万级 C 端 AI 应用全面落地,循环式 Agent 运行模式成为主流。该模式下,前端对话触发后台多专家模型联动,持续完成推理、执行、反思闭环流程,多核高核 CPU成为流程编排、任务下发的核心瓶颈,也是底层核心逻辑。算力分工明确:常规 32 核 CPU 负责数据预处理,新增多核 CPU承接 Agent 调度工作,一旦多核 CPU 算力拥堵,GPU 即便闲置也无法运转。2 月 6 日某头部 APP 因海量 Agent 请求占满 CPU,任务下发中断、GPU 集体空转,最终依靠扩容多核 CPU才恢复千万级日常请求。从任务算力消耗量化来看:简单任务单任务占用0.2 个 CPU 内核,单内核可承载 5 个任务;中等任务单任务占用1 个 CPU 内核;复杂任务单任务占用5 个 CPU 内核。规模推演层面,100 万并发用户场景下,简单任务需20 万个 CPU 核、15 万张 GPU 卡、8PB 存储,CPU 与 GPU 配比约4:1;中等任务需100 万个 CPU 核、20 万张 GPU 卡、32TB 存储。若落地至 1 亿订阅用户、按 10% 并发测算,需2000 万个 CPU 核,折算 96 核高核 CPU 约20 万颗,配套近250 万颗重卡级 GPU,日均新增数据量986TB。当前头部厂商 C 端产品均冲刺8000 万 - 1 亿日活,高核 CPU 刚需增量明确,供需缺口长期存在。
Q2:阿里云 2026 年资本开支总规模多少?芯片采购预算具体怎么分?
A:阿里云 2026 年整体资本开支严格控制在1200 亿 - 1600 亿区间,其中AI 服务器相关投入 1040 亿,专项芯片采购预算 650 亿,资金全部聚焦算力基础设施建设,各品类预算划分清晰。第一,英伟达芯片:预留190 亿 - 200 亿预算,受出口管制影响 H200 暂无法准入,预算作为后续政策松口后的备用储备。第二,智眼芯片:全年量产规划40 万颗,对应预算200 亿,同步推进 N+1、N+2 版本迭代,持续落地产能释放。第三,升腾 910 + 升腾 910B:合计采购15 万颗,预算120 亿,目前已进入量产阶段,头部企业已完成样片验收测试。第四,寒武纪芯片:采购规模小幅收缩,全年采购约4 万颗,对应预算4 亿,较前期 5 万颗的预期有所下调。第五,升腾 590/690:采购量1-2 万颗,预算接近30 亿。除此之外,OPR 等其他小众自研芯片处于起步扩容阶段,合计占用部分补充预算。区域投放维度,国内资本开支占比超 60%,重点扩建政企、金融领域专属算力节点;海外布局集中于新加坡、马来西亚、日韩、墨西哥、泰国等地区,其中新加坡周边算力集群启动新一轮扩容,完善全球化算力布局。
Q3:阿里云现在 CPU 资源供需情况怎么样?高核 CPU 涨价、交期如何?
A:阿里云 CPU 呈现低核过剩、高核紧缺的结构性分化格局,叠加 Agent 需求爆发,高核 CPU 全面涨价、交付周期大幅拉长,供需矛盾持续加剧。存量资源方面,阿里云现有200 多万台服务器,其中80% 为 32 核及以下低核 CPU,适配传统移动互联网业务,日常负载率50%-60%,高峰时段达65%,供需基本平衡;而 AI 刚需的96 核、128 核高核 CPU,存量占比仅10% 出头,完全无法匹配业务扩张需求。需求缺口量化明确:低核 CPU 年度常规替换量40 万颗;仅 C 端亿级日活战略目标,就需要新增20 万颗以上高核 CPU,保守测算下缺口持续扩大。供应链格局上,英特尔、AMD 仍是高核 CPU 核心供应商,过往采购占比超70%,2026 年小幅回落至60%,凭借性能与功耗优势维持主导地位。价格与交付端,行业统一调价,高核 CPU 全线涨价 40%-50%,无差异化议价空间;交货周期从常规周期拉长至16-18 周。供需紧张核心原因在于先进制程产能分配,台积电高端产能优先供给 AI GPU,叠加显存产能不足,进一步挤压高核 CPU 产能。国产 CPU 成为核心补充方向,海光 X86、华为鲲鹏 ARM、阿里倚天、玄铁 C950 逐步落地,2026 年国产 CPU 采购占比提升至30%-40%,逐步降低对海外芯片的依赖度。
Q4:国产 AI 芯片现在真实性能怎么样?和海外芯片差距有多大?
A:结合一线实测数据,以英伟达 H100为核心参照基准,从单机性能、软件生态、集群稳定性三大维度量化对比,升腾芯片稳居国产第一梯队,其余品类稳步追赶,国内外差距持续收窄。性能层面,各品类差异化显著:升腾 P801综合性能达到 H100 的85%,IP15 数值500+,单价13-15 万,为当前国产性能天花板;升腾常规款性能为 H100 的35%,性能介于 H20 与 A100 之间;海光芯片性能达 H100 的45%,2026 年将推出升级迭代版本;其余中小厂国产芯片性能均低于 H100 的50%,内容生成能力存在明显短板。软件生态采用百分制打分:升腾 88-89 分,生态完善度领先,算子库持续迭代优化,逐步缩小与海外芯片差距;华为 80 分,集群适配能力突出,万卡集群综合适配表现优异;海光 72 分,依托 X86 授权落地门槛低,但千卡集群稳定性不足;寒武纪 68 分,优化成本高、上线周期长,软件适配复杂度偏高。集群稳定性以无故障运行时长、年度故障率为核心指标:升腾无故障连续运行35 天,年度故障率14%;海光无故障连续运行25 天;寒武纪无故障连续运行20 天,年度故障率30%。整体来看,升腾系列已实现从 “能用” 到 “好用” 的跨越,可支撑大规模 AI 训练与推理业务;其余国产芯片仍需在生态适配、集群运维层面持续优化,逐步缩小与海外高端芯片的差距。
Q5:阿里云九超节点实际效果如何?单位 token 成本能降多少?渗透率怎么样?
A:九超节点依托自研芯片方案实现极致降本,但受限于高功耗、高成本属性,定位为战略补充而非全面替代,整体渗透率偏低,仅聚焦核心高价值算力场景。成本优化方面,九超节点全自研芯片架构对比英伟达方案,硬件综合成本降低 85%;全面量产落地后,整体单位 token 成本下降 45%。定价体系保持统一,对外商业化产品不降价,仅内部算力租赁出现价差,自研芯片算力租金显著低于英伟达芯片;内部 APP 自研业务落地后,百万 token 综合成本下降四至五成。部署与渗透率层面,2026 年九超节点目标部署1000 个,当前在手落地订单600 个,在整体推理集群中渗透率仅 15%,短期难以成为主流算力载体。核心限制因素为功耗与投入成本,九超节点单机柜峰值功耗达350kW,而常规机柜功耗仅80-100kW,高额电力成本限制大规模普及。业务定位清晰,核心承载大模型训练、高优先级推理两大核心业务,依靠大内存池化、高速互联架构提升算力效率;同时50% 超节点资源对外交付,重点服务国家电网、央企等政企大客户,剩余资源供给内部核心 AI 业务。中长期算力结构中,80% 以上常规推理任务仍依靠标准 GPU 服务器承接,九超节点作为差异化算力补充,完善高低搭配的算力布局。
Q6:4 月 18 日 AI 算力卡涨价,具体怎么涨?受影响客户怎么划分?
A:阿里云官宣4 月 18 日启动算力产品调价,实行分品类差异化涨价,客户执行 “老合同老价格” 平稳过渡规则,调价将显著拉动整体利润增长。涨价幅度分三大品类:一是通算类产品,包含 ECS、容器等通用算力,统一涨价5%;二是AI 与高性能计算实例,覆盖 GPU 卡、AI 加速卡,涨价幅度21%;三是大内存及内存密集型产品,涨价幅度最高,达到35%。利润影响量化清晰,ECS 贡献阿里云55%营收,5% 涨幅可拉动整体利润提升2.5 个百分点;PaaS 层营收占比25%-30%,叠加相关产品大幅涨价,预计带动利润增加8-9 个百分点,盈利弹性显著。客户划分采用非一刀切模式,严格遵循老客户老价格,新客户新价格原则:2025 年 4 月 18 日前签约的存量客户,合同存续期内维持原有定价,合同到期续签后自动切换新价格;例如 2025 年 6 月签约客户,需至 2026 年 6 月合同结束后才执行涨价政策,避免短期成本冲击。成本对冲层面,一方面依靠飞天系统智能调度提升算力整体利用率,摊薄固定成本;另一方面加速国产化芯片替代,降低高端海外芯片采购依赖,从供应链端对冲硬件涨价压力。
Q7:阿里云 “一星一云多芯” 怎么实现统一调度?怎么提升芯片利用率?
A:阿里云一星一云多芯异构算力架构,依靠业务隔离 + 飞天系统精细化调度两大核心手段,解决多架构、多品牌芯片兼容难题,将整体算力利用率稳定维持在65%-70%。第一,分层业务隔离。按照芯片架构、生态适配性完成集群划分,将海光、自研芯片、生态兼容芯片整合为统一集群;架构不兼容、模型适配差异较大的芯片单独分区部署,避免混合调度引发系统故障。不同芯片集群匹配专属业务场景,结合模型定制化优化,从源头降低异构调度损耗。第二,飞天系统全域算力调度。平台对底层 CPU、GPU 资源进行颗粒度拆解,拆分出 1/8 核、1/14 核等轻量化算力单元,可根据 Agent、推理、训练等不同任务量级,灵活分配碎片化算力,杜绝资源闲置浪费。同时实时监测各集群算力峰值、空闲负载,动态调配任务流量,将轻量推理、复杂训练、Agent 调度等不同需求,精准匹配至适配芯片集群。所有大模型、行业模型均提前完成多芯片适配优化,保障跨芯片调度后的运行稳定性。最终通过双层管控模式,打通异构算力壁垒,最大化盘活存量芯片资源,降低算力闲置损耗与综合运营成本,适配多芯国产化替代的长期战略。
Q8:玄铁 C950 和 X86 架构芯片对比,有价格优势吗?RISCV 架构要崛起了?
A:玄铁 C950作为阿里自研 RISCV 架构芯片已实现量产,对比主流 X86 架构芯片在硬件参数上存在一定差距,但具备自主可控、内置 NPU 等独特优势,短期无明显价格优势,RISCV 架构全面替代仍需长期迭代。硬件参数差距方面:一是主频差距,玄铁 C950 主频3.2GHz,海外头部 X86 芯片主频可达3.8-4GHz以上;二是制程受限,海外 X86 普及 5 纳米以下先进制程,玄铁受国内产能约束,仅能落地国产 N+1 成熟制程;三是缓存差距,X86 芯片三级缓存最高512 兆,玄铁 C950 仅256 兆。核心竞争优势体现在三大维度:自主可控,依托国内成熟制程生产,完全摆脱台积电及海外产能限制;内置 NPU 推理模块,可独立承载小模型推理、Agent 沙箱、矩阵计算等轻量化任务,纯 X86 芯片无配套推理能力;原生支持机密计算,单核训练基础测试顺利落地,适配政企安全算力需求。价格层面暂无公开定价差,现阶段核心价值为供应链安全,随着量产规模扩张,长期成本优势将逐步显现。行业格局来看,RISCV 架构短期难以全面崛起,核心瓶颈在于生态适配,Windows、鸿蒙操作系统、中间件、数据库等配套生态仍需持续完善。长期规划明确,未来两至三年,玄铁系列 RISCV 芯片在服务器 CPU 中占比,将从当前个位数提升至20%-25%,以渐进式替代为主,不会快速冲击 X86 主流格局。
Q9:2026 年 AI 芯片采购节奏怎么样?升腾、海光、寒武纪什么时候下单?
A:2026 年阿里云 AI 芯片采购节奏明确、分批落地,自研芯片率先放量,升腾、海光、寒武纪分季度推进测试、下单、交付,国产化采购节奏有序可控。第一,阿里自研芯片:4 月起全面启动放量交付,维持每周2-3 万片稳定供货,为上半年芯片采购核心主力,保障 C 端 AI 业务算力扩容。第二,升腾 910 系列:3 月中旬完成样片接收,现阶段测试8 台 64 卡服务器;5 月扩容至 16 台 128 卡小集群开展联网压力测试;6 月下旬启动大规模集中下单。全年15 万颗采购量拆分,上半年交付8 万颗,剩余7-8 万颗集中在下半年交付。第三,海光芯片:已有1-2 万卡存量储备,2026 年持续议价,目标将单价从6-7 万下调至4-5 万,5 月中下旬(二季度中期)下达第一波大额采购订单。第四,寒武纪芯片:进度相对滞后,4-5 月集中修复软件系统 BUG,同步保障升腾 590 产能交付;6 月底分批接收小额订单,全年采购规模有限。除此之外,平头哥自研芯片已累计规模化交付近 50 万颗,下一代产品优化升级,功耗较现有版本下降30%,算力提升至120-128TOPS,中后端算力可达240TOPS,后续迭代潜力充足。
Q10:2026 年芯片采购 70% 国产化率目标,怎么分解落地?
A:2026 年70% 芯片国产化率目标具备明确政策与业务支撑,为确定性落地目标,依靠政策引导、集采约束、需求倒逼、全环节拆解四大路径稳步推进。第一,国家政策强力引导。高端英伟达芯片进口管控持续收紧,H200 等产品审批受限,刻意留出国产芯片替代窗口期。2026-2027 年为国产算力打磨黄金周期,倒逼互联网大厂、云厂商加速国产芯片适配调试,快速提升产品成熟度。第二,央企集采硬性约束。政企、运营商、国企采购大单明确优先选用国产芯片,通过订单绑定推动海光、升腾等芯片规模化落地;超节点等核心算力项目同步捆绑国产硬件交付,在实战场景中优化稳定性。第三,业务高速增长倒逼替代。AI 算力需求持续爆发,当前日均 token 处理量接近120 万亿,年底目标200-250 万亿,四季度冲击150-200 万亿区间。海外芯片扩容见顶、进口受限,仅依靠国产芯片新增产能,才能突破算力瓶颈,保障 AI 业务持续扩张。第四,全产业链目标拆分。70% 国产化率覆盖GPU、NPU、PPU、网络、存储全核心硬件,而非单一品类:GPU 端依靠升腾、阿里自研芯片承接;CPU 端落地海光、玄铁 RISCV 芯片;存储、网络等配套硬件同步推进国产替代。各环节制定分阶段落地指标,按月度、季度考核推进,循序渐进完成替代目标。整体而言,2026 年为 AI 算力行业关键转折年,Agent 引爆高核 CPU 刚需,算力涨价周期延续;国产芯片完成从 “能用” 到 “好用” 的跨越,70% 国产化率落地节奏清晰;千亿级资本开支全面聚焦算力基建,算力自主可控成为行业核心发展主线。
夜雨聆风