谁在提供最具性价比的AI训练/推理算力?
文/ 一位职业经理人的投资思考
写在前面
大模型竞赛的本质,是算力竞赛。无论是训练千亿参数的基础模型,还是运行日均万亿Token的推理应用,都离不开背后的云算力支撑。英伟达H100、B200一卡难求,云厂商纷纷加码自研芯片,中国各地争相发放“算力券”补贴中小企业……AI算力服务正在成为云计算领域竞争最激烈、增长最快的细分赛道。
本文从AI算力服务的供需格局、中美云厂商的定价与性能对比、中国“算力券”政策效果、投资视角四个维度,分析这一市场的现状与未来。
一、AI算力服务的供需格局:算力荒与算力浪费并存
2025-2026年,全球AI算力市场呈现“冰火两重天”的格局。
高端训练算力持续紧缺。英伟达H100自2023年发布以来始终供不应求,2025年发布的B200更是将单卡性能提升至H100的2-3倍,但产能爬坡缓慢,订单交付周期长达6-12个月。云厂商的算力储备成为核心竞争力——AWS、Azure、谷歌云凭借早期囤积的大量H100,在训练算力供应上占据绝对优势。中国厂商受出口管制影响,高端GPU获取受限,训练算力缺口更大。
推理算力需求爆发式增长。随着AI应用(ChatGPT、Gemini、豆包等)用户规模扩大,以及智能体(Agent)应用的普及,推理算力消耗已远超训练算力。OpenClaw等Agent工具的单会话Token消耗量可达23万以上,一个活跃用户月费用可能高达800-1500美元。推理算力对延迟和成本更敏感,为云厂商提供了差异化竞争空间。
算力浪费现象同样严重。许多企业囤积GPU用于“以防万一”,实际利用率不足30%。云厂商通过弹性算力、竞价实例等模式,正在提高整体算力利用效率。
二、中美云厂商AI算力服务对比
厂商 训练算力主力 推理算力主力 自研芯片 定价策略 核心优势
AWS H100/B200 Inferentia、Trainium Trainium2、Inferentia2 按需、预留实例、竞价 规模最大,生态最成熟
Azure H100/B200 自研Maia Maia 100 与OpenAI深度绑定 企业生态整合
谷歌云 H100/B200、TPU TPU v5e/v6e TPU v6e 按需、承诺使用折扣 TPU成本优势,全栈AI能力
阿里云 昇腾910B、少量H100 昇腾310、自研含光 平头哥含光、倚天 算力券补贴,按量付费 国内份额第一,政策支持
腾讯云 昇腾、H800(存量) 自研芯片 沧海、玄灵 游戏/社交场景打包 垂直行业生态
训练算力:英伟达仍是王者,自研芯片开始替代
在训练算力市场,英伟达H100/B200凭借CUDA生态和超强性能,占据80%以上份额。AWS、Azure、谷歌云均大量部署H100/B200,同时积极推广自研芯片——AWS Trainium2、Azure Maia 100、谷歌TPU v6e。
谷歌TPU是自研芯片中最为成熟的。TPU v6e在FP8精度下算力高达1979 TFLOPS,接近H100水平,且能效比更优。谷歌云通过TPU提供极具性价比的训练服务,吸引了不少AI初创公司。AWS Trainium2在2025年全面上市,性能对标H100,但生态兼容性仍需时间验证。
中国云厂商受出口管制影响,无法大量获取H100/B200,训练算力主力转向华为昇腾910B。昇腾910B性能接近A100,但与H100仍有差距。阿里云、腾讯云也在自研训练芯片(含光、沧海),但尚未大规模商用。
推理算力:性价比为王,中国厂商优势渐显
推理算力对绝对性能要求较低,更看重单位成本、延迟和能效。谷歌TPU v5e/v6e在推理场景表现优异,且成本仅为英伟达GPU的1/3-1/2。AWS Inferentia2同样主打高性价比推理。
中国厂商在推理算力上差距较小。华为昇腾310已广泛应用于云端推理,阿里云含光芯片推理性能对标英伟达T4。更重要的是,中国厂商通过“算力券”等补贴,将推理算力价格压至极低水平,吸引大量中小企业和开发者。
价格对比(以FP16推理为例,每百万Token成本):
· 谷歌TPU v5e:约0.15-0.20美元
· AWS Inferentia2:约0.20-0.25美元
· 英伟达A10G:约0.40-0.50美元
· 华为昇腾310(国内):约0.10-0.15美元(补贴后更低)
· 阿里云含光(国内):约0.08-0.12美元(补贴后)
三、中国“算力券”政策:效果如何?
为应对算力瓶颈、促进AI应用落地,中国各地政府自2024年起纷纷推出“算力券”补贴政策。
政策概览
截至2026年初,已有超过20个省市出台算力券政策,形式包括:
· 直接补贴:政府向企业发放算力券,企业可用于抵扣云厂商的AI算力服务费用。例如,北京市2025年发放10亿元算力券,覆盖5000家企业。
· 间接补贴:政府与云厂商合作,以优惠价格向中小企业提供算力套餐。例如,上海市联合阿里云、腾讯云推出“AI算力普惠计划”,企业可享受5折优惠。
· 专项支持:针对高校、科研机构、初创公司的特殊算力需求,提供免费或极低成本的算力资源。
效果评估
积极成效:
1. 降低了中小企业使用AI的门槛。算力券使AI算力成本降低30-50%,大量中小企业和开发者得以尝试大模型训练和推理。据工信部数据,2025年全国新增AI相关企业数量同比增长45%,算力券政策是重要推动因素。
2. 拉动了云厂商的算力服务收入。虽然单价降低,但用量大幅增长。阿里云2025年AI算力服务收入同比增长200%以上,腾讯云增长150%以上。
3. 促进了国产芯片的应用。算力券通常优先支持使用国产芯片(如昇腾、含光)的算力服务,加速了国产芯片的生态成熟和商业化进程。
存在问题:
1. 补贴覆盖面有限。大部分算力券面向中小企业和初创公司,大型企业无法享受。而真正需要大规模算力的AI头部企业(如智谱、百川、月之暗面)反而得不到补贴。
2. 算力券使用效率有待提高。部分企业领取算力券后并未真正使用,或仅用于低价值测试,造成资源浪费。
3. 地方保护主义倾向。部分省市要求算力券只能用于本地云厂商,不利于全国统一市场形成。
未来展望:算力券政策将在“十五五”期间持续深化,可能从“普惠补贴”转向“精准支持”——重点扶持AI大模型训练、智能体应用开发等高价值场景。同时,国家级算力调度平台正在建设中,未来有望实现全国算力资源的统一调配和补贴。
四、投资视角的启示
1. 云厂商是AI算力服务的最大受益者。无论是训练还是推理,都需要云基础设施支撑。AWS、Azure、谷歌云、阿里云、腾讯云将直接受益于AI算力需求的爆发式增长。
2. 自研芯片是云厂商降低成本、构建差异化的关键。谷歌TPU已证明其商业价值,AWS Trainium、Azure Maia正在追赶。拥有自研芯片能力的云厂商,将在长期竞争中占据成本优势。
3. 中国算力券政策利好国产算力产业链。算力券推动国产芯片(昇腾、含光等)的应用,同时拉动服务器、光模块、液冷等基础设施需求。中科曙光、浪潮信息、中际旭创、中航光电等将间接受益。
4. 关注AI算力服务的新商业模式。算力租赁、算力交易平台、算力期货等新模式正在兴起。商汤科技、青云科技等已推出AI算力云服务,值得跟踪。
五、结语
AI算力服务正在成为云计算领域增长最快的细分赛道。训练算力仍由英伟达主导,但自研芯片正在改变竞争格局;推理算力性价比为王,中国厂商凭借成本和政策优势快速追赶。
中国的“算力券”政策有效降低了中小企业使用AI的门槛,拉动了国产算力产业链发展,但也面临覆盖面有限、使用效率不高等挑战。未来,算力券将从“普惠”走向“精准”,算力资源将从“分散”走向“统一调度”。
对于投资者而言,AI算力服务是一个长期增长的赛道。关注云厂商、自研芯片、算力基础设施三大方向,把握AI时代的基础设施红利。
风险提示
本文仅为个人投资思考与策略分享,不构成任何投资建议。市场有风险,投资需谨慎。据此操作,风险自负。
夜雨聆风