OpenAI之后,谁拿走AI时代的利润?

INFRASTRUCTURE · PRICING POWER

OpenAI之后，谁拿走AI时代的利润？

2026.06

如果回到2005年，你问一个人：互联网时代最大的赢家是谁？

大多数人会回答：门户网站。搜索引擎。电子商务。

没人会猜Amazon。因为Amazon那时候只是个卖书的网站。

但后来真正市值最高的公司之一是Amazon。而Amazon最赚钱的业务之一是AWS——一个卖计算资源和存储的底层基础设施平台。

今天AI行业出现了同样的现象。所有人都在盯着OpenAI、Anthropic、DeepSeek。但一个问题很少有人问：

如果AI成为像电力、自来水一样的基础能力，最大的赢家还会是模型公司吗？

模型正在变成一种标准品

2023年，GPT-4遥遥领先。能力碾压，价格坚挺，几乎没有替代选项。

2024年，Claude追上来了。Gemini追上来了。差距在缩小。

2025年，DeepSeek出现。用更低的成本，跑出了接近第一梯队的性能。

2026年，模型差距越来越小。

很多能力开始趋同：你会的，我也会。你有的，我也有。模型之间的差异，正在从"能不能做"变成"谁便宜几分"。

价格持续下降。OpenAI的API价格一年内降了不止一次。DeepSeek直接把推理成本打到行业地板。模型能力在涨，模型价格在跌。

这像什么？

像CPU——Intel和AMD打到只看性价比。

像带宽——运营商扩容扩到单价年年跌。

像云主机——功能一模一样，竞争到最后就是拼折扣。

标准品的终局都一样：利润率越来越低。

AI最大的赢家，可能是国家电网

模型在变成标准品。但AI产业里，稀缺资源并没有消失——它只是换了地方。

训练时代缺GPU。推理时代缺缓存。异构时代缺调度。超大规模时代缺电。

稀缺资源迁移，利润就迁移。

如果顺着这条线往下推，一个反直觉的结论浮出来：AI行业最大的受益者，可能不是OpenAI，而是国家电网。

OpenAI消耗电。Anthropic消耗电。DeepSeek消耗电。

但国家电网向所有人卖电。

淘宝赚钱，国家电网赚钱。拼多多赚钱，国家电网还赚钱。字节赚钱，国家电网继续赚钱。

所有模型公司竞争，竞争越激烈，推理规模越大，电力消耗越猛。但电网向所有模型公司收费。不管谁赢谁输，电网都赚。

这就是基础设施的利润逻辑：你不需要赌谁赢，你只需要确保所有人都离不开你。

AI正在寻找自己的AWS

互联网时代，大家认为Google最重要，Facebook最重要，淘宝最重要。但最后利润最厚的业务之一是AWS。因为所有互联网公司都运行在它上面。

AI时代可能也一样。OpenAI很重要，Anthropic很重要，DeepSeek很重要。但二十年后回头看，真正吃掉产业利润的，可能是那个为所有模型提供算力、电力和调度的平台。

铁路时代

最热的是铁路公司。大量资本涌入，股价飞涨。但铁路公司真正赚到钱的没几家——运力过剩、价格战、资本泡沫。后来赚钱的是给铁路供钢铁的卡内基、做铁路重组与金融整合的J.P.摩根、供能源的标准石油。底层才赚钱，因为铁路公司拼的是运价，底层拼的是不可替代性。

移动互联网时代

最热的是APP。成千上万的应用争夺屏幕空间。但APP的存活率低得可怜。真正把持利润的是Android和Apple生态——控制分发、控制支付、控制规则。底层才赚钱，因为APP拼的是用户时长，底层拼的是所有APP都必须经过你。

规律很清楚：越成熟的产业，利润越向底层基础设施集中。技术创造者定义了一个时代的起点，但基础设施的拥有者定义了这个时代的利润结构。

为什么稀缺资源在迁移

训练时代，最稀缺的是GPU。谁卡多谁说话硬。2023年，H100一卡难求，排队等半年是常态。

但产业重心正在从训练转向推理。据行业估算，2026年推理在AI基础设施支出中占比已超过70%。推理时代的问题跟训练时代完全不同——瓶颈不再是算力本身，而是存储和调度。

+435%

存储成本涨幅

+57%

GPU成本涨幅

65%→51%

GPU成本占比

数据来源：摩根士丹利拆解英伟达Rubin机柜BOM

一个数字能说明问题：存储成本从上一代的约37万美元飙升到逾200万美元，涨幅435%。同一时期，GPU成本只涨了57%。GPU在总成本中的占比从65%降到51%，存储从9%升到26%。最贵的部件在变。

为什么存储暴涨？因为推理的瓶颈在KV Cache——模型推理时需要反复读取的上下文缓存。1M Token上下文的KV Cache需求可达TB级。这不是算力问题，是存储问题。算力再强，缓存命中率不够，GPU就在等数据，利用率上不去。

谁把缓存命中率做上去，谁就把推理成本打下来。Anthropic在Claude Code场景把缓存命中率做到了92%，缓存命中价格是普通输入的1/10。DeepSeek V4-Pro的缓存命中价格低至0.025元/百万tokens。

推理时代的定价权公式

存储命中率 × KV Cache调度效率 = 单位推理成本优势

GPU可以买，存储可以扩，调度可以优化——但电力的供给受制于物理基础设施，不是花钱就能解决的。

能源公司为什么突然进入AI价值链

微软重启核电项目。亚马逊投资小型模块化反应堆（SMR）。谷歌签长期能源协议。Meta开始大规模采购绿电。

这些公司突然爱上能源了吗？

不是。是因为AI开始吞噬电力。

训练时代，GPU决定产能。算力是瓶颈，电力是后勤。但推理规模指数级膨胀之后，电力从后勤变成了前线。北美云厂商2026年资本开支合计约7250亿美元（据行业估算），同比增长77%。这些钱不只是买卡，很大一部分是在解决"电从哪来"的问题。

美国的问题更特殊。它的电网由三大独立系统组成，仅通过少数低容量线路互联，基本互不相通。有电送不出，缺电调不来。王坚院士说得直白："美国要建电厂，变压器的制造业都在中国。"

3.7亿千瓦

中国特高压跨区输电能力

1/10

变压器交货周期 vs 美国

电力这条线上，中国有两个结构性优势。第一，统一电网调度能力。中国是全球唯一大规模运营特高压输电的国家，跨省跨区输电能力已达3.7亿千瓦。第二，关键设备制造产能。全球变压器产能超过一半在中国，交货周期仅为美国的十分之一左右。

当AI的产能上限从算力转向电力，这两个优势会从"基础设施条件"变成"产业竞争变量"。

英伟达会不会重演Intel的故事

Intel曾经统治一个时代。CPU无处不在，x86架构是事实标准，利润率惊人。但后来利润链条迁移了。Intel的市值在2024年低点时较巅峰跌去大半，不是因为它做错了什么，而是因为产业的重心离开了它所在的位置。

今天GPU会不会经历类似过程？英伟达仍然是最强。但护城河正在被蚕食——CANN开源拆CUDA的封闭生态，海光让CUDA代码零成本迁移绕过围墙，信通院推国标另建规则。生态壁垒的解法不是造出更好的芯片，是让用户不需要依赖你的生态。

GPU仍然会是最贵的部件。但最贵不等于拥有定价权。

石油时代，炼油厂很贵，但决定利润的是油田。云计算时代，服务器很贵，但决定利润的是调度系统。AI时代，GPU仍然占51%的成本，但如果供电容量不足、KV Cache效率不足、集群利用率不足，再多GPU也无法转化成有效Token。

谁决定Token成本，谁才拥有定价权。

铁路时代，最耀眼的是铁路公司。

互联网时代，最耀眼的是网站。

AI时代，最耀眼的是模型公司。

但历史反复证明一件事：

技术革命负责创造需求。

基础设施负责收割利润。

当所有人都在讨论哪个模型更强时，下一代AI巨头，可能已经在卖电了。