INFRASTRUCTURE · PRICING POWER
OpenAI之后,谁拿走AI时代的利润?
2026.06
如果回到2005年,你问一个人:互联网时代最大的赢家是谁?
大多数人会回答:门户网站。搜索引擎。电子商务。
没人会猜Amazon。因为Amazon那时候只是个卖书的网站。
但后来真正市值最高的公司之一是Amazon。而Amazon最赚钱的业务之一是AWS——一个卖计算资源和存储的底层基础设施平台。
今天AI行业出现了同样的现象。所有人都在盯着OpenAI、Anthropic、DeepSeek。但一个问题很少有人问:
如果AI成为像电力、自来水一样的基础能力,最大的赢家还会是模型公司吗?
01
模型正在变成一种标准品
2023年,GPT-4遥遥领先。能力碾压,价格坚挺,几乎没有替代选项。
2024年,Claude追上来了。Gemini追上来了。差距在缩小。
2025年,DeepSeek出现。用更低的成本,跑出了接近第一梯队的性能。
2026年,模型差距越来越小。
很多能力开始趋同:你会的,我也会。你有的,我也有。模型之间的差异,正在从"能不能做"变成"谁便宜几分"。
价格持续下降。OpenAI的API价格一年内降了不止一次。DeepSeek直接把推理成本打到行业地板。模型能力在涨,模型价格在跌。
这像什么?
像CPU——Intel和AMD打到只看性价比。
像带宽——运营商扩容扩到单价年年跌。
像云主机——功能一模一样,竞争到最后就是拼折扣。
标准品的终局都一样:利润率越来越低。
02
AI最大的赢家,可能是国家电网
模型在变成标准品。但AI产业里,稀缺资源并没有消失——它只是换了地方。
训练时代缺GPU。推理时代缺缓存。异构时代缺调度。超大规模时代缺电。
稀缺资源迁移,利润就迁移。
如果顺着这条线往下推,一个反直觉的结论浮出来:AI行业最大的受益者,可能不是OpenAI,而是国家电网。
OpenAI消耗电。Anthropic消耗电。DeepSeek消耗电。
但国家电网向所有人卖电。
淘宝赚钱,国家电网赚钱。拼多多赚钱,国家电网还赚钱。字节赚钱,国家电网继续赚钱。
所有模型公司竞争,竞争越激烈,推理规模越大,电力消耗越猛。但电网向所有模型公司收费。不管谁赢谁输,电网都赚。
这就是基础设施的利润逻辑:你不需要赌谁赢,你只需要确保所有人都离不开你。
03
AI正在寻找自己的AWS
互联网时代,大家认为Google最重要,Facebook最重要,淘宝最重要。但最后利润最厚的业务之一是AWS。因为所有互联网公司都运行在它上面。
AI时代可能也一样。OpenAI很重要,Anthropic很重要,DeepSeek很重要。但二十年后回头看,真正吃掉产业利润的,可能是那个为所有模型提供算力、电力和调度的平台。
铁路时代
最热的是铁路公司。大量资本涌入,股价飞涨。但铁路公司真正赚到钱的没几家——运力过剩、价格战、资本泡沫。后来赚钱的是给铁路供钢铁的卡内基、做铁路重组与金融整合的J.P.摩根、供能源的标准石油。底层才赚钱,因为铁路公司拼的是运价,底层拼的是不可替代性。
移动互联网时代
最热的是APP。成千上万的应用争夺屏幕空间。但APP的存活率低得可怜。真正把持利润的是Android和Apple生态——控制分发、控制支付、控制规则。底层才赚钱,因为APP拼的是用户时长,底层拼的是所有APP都必须经过你。
规律很清楚:越成熟的产业,利润越向底层基础设施集中。技术创造者定义了一个时代的起点,但基础设施的拥有者定义了这个时代的利润结构。
04
为什么稀缺资源在迁移
训练时代,最稀缺的是GPU。谁卡多谁说话硬。2023年,H100一卡难求,排队等半年是常态。
但产业重心正在从训练转向推理。据行业估算,2026年推理在AI基础设施支出中占比已超过70%。推理时代的问题跟训练时代完全不同——瓶颈不再是算力本身,而是存储和调度。
+435% 存储成本涨幅 | +57% GPU成本涨幅 | 65%→51% GPU成本占比 |
数据来源:摩根士丹利拆解英伟达Rubin机柜BOM
一个数字能说明问题:存储成本从上一代的约37万美元飙升到逾200万美元,涨幅435%。同一时期,GPU成本只涨了57%。GPU在总成本中的占比从65%降到51%,存储从9%升到26%。最贵的部件在变。
为什么存储暴涨?因为推理的瓶颈在KV Cache——模型推理时需要反复读取的上下文缓存。1M Token上下文的KV Cache需求可达TB级。这不是算力问题,是存储问题。算力再强,缓存命中率不够,GPU就在等数据,利用率上不去。
谁把缓存命中率做上去,谁就把推理成本打下来。Anthropic在Claude Code场景把缓存命中率做到了92%,缓存命中价格是普通输入的1/10。DeepSeek V4-Pro的缓存命中价格低至0.025元/百万tokens。
推理时代的定价权公式
存储命中率 × KV Cache调度效率 = 单位推理成本优势
GPU可以买,存储可以扩,调度可以优化——但电力的供给受制于物理基础设施,不是花钱就能解决的。
05
能源公司为什么突然进入AI价值链
微软重启核电项目。亚马逊投资小型模块化反应堆(SMR)。谷歌签长期能源协议。Meta开始大规模采购绿电。
这些公司突然爱上能源了吗?
不是。是因为AI开始吞噬电力。
训练时代,GPU决定产能。算力是瓶颈,电力是后勤。但推理规模指数级膨胀之后,电力从后勤变成了前线。北美云厂商2026年资本开支合计约7250亿美元(据行业估算),同比增长77%。这些钱不只是买卡,很大一部分是在解决"电从哪来"的问题。
美国的问题更特殊。它的电网由三大独立系统组成,仅通过少数低容量线路互联,基本互不相通。有电送不出,缺电调不来。王坚院士说得直白:"美国要建电厂,变压器的制造业都在中国。"
3.7亿千瓦 中国特高压跨区输电能力 | 1/10 变压器交货周期 vs 美国 |
电力这条线上,中国有两个结构性优势。第一,统一电网调度能力。中国是全球唯一大规模运营特高压输电的国家,跨省跨区输电能力已达3.7亿千瓦。第二,关键设备制造产能。全球变压器产能超过一半在中国,交货周期仅为美国的十分之一左右。
当AI的产能上限从算力转向电力,这两个优势会从"基础设施条件"变成"产业竞争变量"。
06
英伟达会不会重演Intel的故事
Intel曾经统治一个时代。CPU无处不在,x86架构是事实标准,利润率惊人。但后来利润链条迁移了。Intel的市值在2024年低点时较巅峰跌去大半,不是因为它做错了什么,而是因为产业的重心离开了它所在的位置。
今天GPU会不会经历类似过程?英伟达仍然是最强。但护城河正在被蚕食——CANN开源拆CUDA的封闭生态,海光让CUDA代码零成本迁移绕过围墙,信通院推国标另建规则。生态壁垒的解法不是造出更好的芯片,是让用户不需要依赖你的生态。
GPU仍然会是最贵的部件。但最贵不等于拥有定价权。
石油时代,炼油厂很贵,但决定利润的是油田。云计算时代,服务器很贵,但决定利润的是调度系统。AI时代,GPU仍然占51%的成本,但如果供电容量不足、KV Cache效率不足、集群利用率不足,再多GPU也无法转化成有效Token。
谁决定Token成本,谁才拥有定价权。
铁路时代,最耀眼的是铁路公司。
互联网时代,最耀眼的是网站。
AI时代,最耀眼的是模型公司。
但历史反复证明一件事:
技术革命负责创造需求。
基础设施负责收割利润。
当所有人都在讨论哪个模型更强时,下一代AI巨头,可能已经在卖电了。
夜雨聆风