乐于分享
好东西不私藏

机构纪要|2026AI算力格局分析

机构纪要|2026AI算力格局分析

「机构眼·调研内参」机构投研资源平台

加入社群·微信:Buddha_Research

机构音频纪要 部分转译展示

发言人 问:今年资本支出大概有多少预算分配给与芯片相关的采购?对于英伟达H200芯片的采购预算预计是多少?

发言人 答:今年整个资本支出约为1600亿,其中与芯片相关的采购预算大约是650亿左右。尽管英伟达的H200芯片目前难以采购,但随着谈判的进展,有可能会预留大约10亿到20亿之间的预算。

发言人 问:英伟达芯片能采购多少以及相关预算安排情况?

发言人 答:英伟达芯片的具体采购量不确定,预算会预留一部分,但如果采购未能顺利完成,剩余资金可能无法用于其他芯片采购。

发言人 问:台积电智能芯片的全年生产数量及对应预算大约是多少?对于950芯片的生产预算及其价格如何?

发言人 答:台积电全年生产的智能芯片数量约为四十多万个,加上存量,全年总产量大约为200亿左右,这部分的预算估计在120亿左右。950芯片目前刚开始量产,预计大厂拿到样品后,按照当前价格计算,15万颗的预算大约是120亿左右,而采购价格可能会根据大量化生产有所下调。

发言人 问:国内与国外卡占比及芯片采购策略是怎样的?

发言人 答:今年公司整体预算中,60%以上在国内进行采购,主要用于枢纽节点扩建、创新算力设备以及重点工业、政企和金融行业节点。剩余30%至40%的预算用于海外采购,重点扩展至新加坡、马来西亚、日韩以及墨西哥地区。

发言人 问:国产芯片与海外芯片以及自研芯片的采购情况如何?国产芯片性能指标及与其他芯片的对比如何?

发言人 答:国产芯片中,平头哥臻5P810E芯片在2024年已开始在台积电进行第一波量产,去年至今已生产约20万颗,并将继续在台积电进行N+1和N+2版本的生产,预计今年会有40万颗的采购需求。目前国产芯片在性能上可与A700和H100相媲美,价格大约在13到15万之间。平头哥芯片的性能略超过H20,介于H20和A100之间;海关芯片大致相当于H100的45%左右,预计今年会有新的芯片推出,其性能也将有所提升。在软件生态方面,国内芯片厂商正在努力追赶,目前整体成熟度大约在85%左右。

发言人 问:大集群使用HCCL通信协议和扩展带宽的稳定性如何?是否能够支持大规模模拟训练?

发言人 答:大集群采用的HCCL通信协议与扩展带宽之间的稳定性很高,连续运行时间无故障时间可达35天左右,年计算率接近400分之4。但受限于阿里目前700G的带宽,无法进行大规模模拟训练。华为的万卡集群性能约为75分,而海外MD授权的集群在兼容性上有优势,整体千卡集群性能评分为72分,连续运行时间为25天,迁移代价相对较高,软硬兼容性和软件复杂度也较高,基础表现评分为68分。

发言人 问:平头哥规模化交付的50万颗芯片在性能、能效和兼容性上有何规划?

发言人 答:平头哥在现有产品基础上,第二代产品预计在性能、能效和兼容性方面进行优化,沿用基础设计,重点关注功耗控制。下一代产品将实现30%的功耗降低,显存达到120-128GB,并且带宽超过1TB。当前一代产品会延续之前的规格,在算力上会有所提升,例如旗舰模型的算力将达到120plus,中控版本可做到240多plus。

发言人 问:阿里云自研AI基础设施如何帮助客户单位token成本下降?

发言人 答:阿里云自研AI基础设施通过盘久超节点等技术提升了推理和训练性能,以旗舰模型为例,与英伟达定价相比,可为客户单位token成本降低45%。公有云场景下,不同模型有不同的价格,而私有化部署则是基于客户在云端训练模型的数量进行计费,并提供相应的技术支持和服务费,结合云端大模型的使用,形成整体的费用结构。

发言人 问:近三个月百炼MAAS服务token消耗激增,公有API与私有化部署在定价模式和技术支持上有什么区别?

发言人 答:公有云按照不同的模型矩阵和批次进行定价,例如旗舰模型plus table的价格大约

在20块,最低可至2块或中间价8块。私有化部署则不同,客户选择开源模型并在云端训练微调后下载至本地安装,根据训练数据量折算成token计费。私有化部署除了支付一次性的技术服务费外,还需按使用云端大模型叠加的token费用来支付账单。

发言人 问:超节点目前渗透率是多少水平?未来渗透率有何展望?

发言人 答:超节点不会成为所有推理集群的配置标准,在整个处理机器中占比约为15%。目前有约600个订单,预计下半年增长至1000个。其中,对外交付部分占大约50-60%,主要面向国家电网等能源企业;对内使用则占整体推行的15%。

发言人 问:为什么推理机型主要使用标配服务器而非超节点?

发言人 答:推理机型使用标配服务器而非超节点,主要是因为超节点成本较高,单个机柜峰值功耗可达350千瓦,而普通机架仅需80到100千瓦。此外,超节点定位主要用于大规模训练场景,而非推理侧的核心业务。推理侧需要的是快速且经济的计算方式,因此采用大面积共享池和训练服务器。

发言人 问:4月18日起,AI算力卡上调5%到34%,CPFS智算版上调30%,将如何划分受影响客户与合同形态?

发言人 答:对于受影响的客户,合同形态将根据签约时间有所不同。老客户(即4月18日之前签约)在合同到期前将继续按照原价格执行,到期后按照新价格执行;新客户则从4月18日开始按照新价格执行。

发言人 问:AI算力卡价格上调后,对未来利润结构有何变化?

发言人 答:AI算力卡价格上涨后,收入增速将有所提升。具体来说,ECS等产品价格上涨5%,对整体收入大盘的增长贡献较小;而AI计算实例、GPU卡和大内存数据库产品涨幅较大,利润增速随之增长。对于不同客户群体,利润变化则取决于各自合同的具体情况。

发言人 问:阿里云如何实现对不同AI芯片的统一调度并降低开发成本、提升利用率?

发言人 答:阿里云通过飞天系统实现异构配置的统一调度。首先,将所有异构算力转化为标准的CPU或GPU单元进行池化,并根据业务需求动态分配给不同模型版本的机器进行推理。飞天系统会根据任务峰值或复杂程度,智能地将任务分配给最合适的GPU,确保GPU利用率保持在较高水平,如65%至70%之间。同时,通过提前适配模型和动态调度,进一步降低开发成本并提高AI芯片的有效利用率。

发言人 问:玄铁C950芯片与X86/ARM架构对标芯片相比有何优势?

发言人 答:玄铁C950作为升级版的C930,采用了RISC-V架构,相较于ARM和X86架构的芯片,在主频、制程工艺、三级缓存等方面存在一定的差距。不过,玄铁C950具备NPU推理能力,这是X86和ARM架构芯片所不具备的。尽管在三级缓存和主频上有所不足,但由于其具备NPU模块,因此在小型模型的推理方面具有一定优势。同时,该芯片采用了国产的N+自损技术,相较于ARM代际产品,在性能上具有一定差距,但总体而言,在推理能力和功能扩展性上具有一定竞争力。

发言人 问:在对标过程中,该芯片的主要强项是什么?

发言人 答:该芯片的主要强项包括依托国产先进制程的成熟技术,不受限于特定支撑,并且拥有AI双引擎加速能力,可应用于沙箱、矩阵引擎和向量引擎计算,同时支持机密计算和加密计算。此外,它在单核训练上通过了70%的测试,有望在未来进入计算中心市场,初期虽未占据高位,但随着生态适配的推进,例如操作系统(Windows、Linux、鸿蒙等)、中间件等的全面适配,将形成一定的市场壁垒。

发言人 问:下一代GPU的IP设计由谁提供?

发言人 答:下一代AI芯片的IP设计中,阿里负责前端逻辑架构和IP设计,完成后会交给能够进行后端设计的公司,包括物理布线、流片以及后续市场点提升等环节。部分IP会与国产厂商合作完成。

发言人 问:AI芯片采购上半年发单及采购情况如何?

发言人 答:上半年AI芯片采购已从四月份开始,每月保持约两三万片的节奏。样片在三月中旬拿到后,进行了服务器测试,预计到六月下旬开始正式下单,目前已有预报订单15万片。其中,升腾950690及海光芯片的采购将在六月下旬陆续下单,上半年预计做到8万片左右,剩余一半订单将在下半年交付。海关方面,去年已购买一批芯片,现调价至4万至5万人民币,并将在五月份下第一波订单。

发言人 问:目前各家CSB超节点订单规模情况如何?

发言人 答:目前华为订单量较多,达到3000万至4000万之间,配置不同售价也不同,已卖出几百台。阿里有500至600台的大单,但由于部分卡未到位,实际已接收上千台的订单,预计今年将出货上千台以上。其他厂商如曙光,目前主要是样机测试阶段,尚未实现大规模交付,因为超节点产品复杂度高,需要深度测试以确保软件兼容性、网络稳定性及整体性能。

发言人 问:2026年芯片采购国产化率70%的目标如何分解到GPU、NPU、PPU、网络与存储等关键环节?

发言人 答:对于2026年芯片采购国产化率达到70%的目标,目前国家处于一个窗口期,有意控制英伟达等国际厂商的节奏,以让国产芯片有更多市场空间。但具体到各关键环节的分解目标,未在回答中明确指出。

发言人 问:国家是如何倒逼厂家打磨国产适配资源的?

发言人 答:国家通过政策引导,比如要求申请H200但不批准,迫使厂家利用今年和明年上半年的时间窗口加速国产化产品的研发和测试。同时,在国家的大单采购中明确规定能源企业、硬伤企业应尽量购买国产产品,并要求大厂提前对这些产品进行测试以确保稳定性。

发言人 问:业务层面为何要扩容并提升算力支撑?

发言人 答:业务层面需要足够的资源来支撑从B端到C端的各种需求,不能仅依赖于现有资源卡或国产卡的供应。大厂的日均交易量庞大,扩容和提速是必须的,否则AI业务将成为自家业务推进中的瓶颈。

发言人 问:海光芯片的采购计划及技术成熟度情况如何?

发言人 答:海光芯片计划在2025年采购第一批百万级别的芯片,目前已有小批量产出。国家项目中也会有指定使用海光芯片的情况,通过大厂稳定供应间接交给国家单位。今年的采购中心化主要关注两点:一是中信产能能否跟上及价格是否合理;二是技术复杂度和产品成熟度是否随时间逐渐提升,预计第二季度五月份会收到一些大盘订单。

发言人 问:token hub事业群如何协同QWEN百炼自研芯片以提升单位token毛利与供给弹性?

发言人 答:token hub事业群将不同团队归拢到ATH事业区,按三大类进行管理:一是通义实验室(现为通用事业群)负责token生产;二是智能团队聚焦提供高效推理token和低成本token,并保证供给量。目标是今年年底实现200万亿日均,每个季度增长约30-40%,重点推进B端(如全球最大的B端企业自媒体平台,依托钉钉实现30%渗透率)和C端(如天猫产区日活跃用户数达到1亿)的应用,以及通过阿里云收入占比提升,赋能千行百业。整个团队围绕200万亿token生产,根据不同业务需求分配并消耗token,形成token导向的驱动模式,并量化OKR指标进行管理。