AI 正在缺粮

如果算力不限，Anthropic 现在的年收入不是 300 亿美元，是 1500 亿。

不是我编的。是 Anthropic 的核心投资人 Gavin Baker 公开说的。他在最近一次访谈里的原话是："如果 Anthropic 拥有全部所需算力，它今天的收入很可能已经远远超过 1000 亿美元，可能达到 1500 亿美元。"

产品好卖得很。竞争对手也没赢。问题在物理层面——电不够、芯片不够、token 不够。

AI 行业撞上的这堵墙，跟算法和数据都没关系。就是物理墙。

谁在喊缺粮？

先看 Anthropic。今年 4 月他们干了一件得罪用户的事：禁止月费订阅用户用 Claude 驱动第三方 Agent 工具。像 OpenClaw 这种爆火的开源 Agent，之前你付 $20/月就能用 Claude 在后台跑。现在不行了。想用 Agent？切到 API，按 token 付费，一个字一个字地算钱。

同时高峰期严格限流。Reddit 上骂声一片。

Amazon 也在财报里公开说"产能限制拖累了增长"。这句话翻译成大白话就是：我们有客户想买，但我们卖不了更多，因为没有多余的算力了。

OpenAI 更直接。把 Sora 这种非核心项目的算力抽走，集中到能产生收入的业务线。视频生成很酷，但在 token 短缺面前，酷不值钱。

最狠的一个数据来自 Gavin Baker 对 Claude 的分析：同一个问题，Claude 输出的 token 量比之前偷偷砍了 70%。

不是模型变笨了。是 Anthropic 在后台强行让它"少说点"。你付的 $20 月费，买到的是一个被切了前额叶的 Claude。

Token 为什么突然不够了？

答案不复杂。Agent 模式把 token 消耗量炸开了。

一次普通聊天，几百到几千 token 搞定。一个 Coding Agent 跑一次完整任务——读代码、理解上下文、写方案、执行、验证——轻轻松松 5 万到 20 万 token。这还没算推理模型在后台"思考"时烧掉的那些。

更关键的是规模。一个人同时跑 100 个 Agent 在今天的企业场景里已经很常见。100 个 Agent 同时工作，一天烧掉几千万 token 跟玩一样。

还有一个被很多人忽略的因素：推理模型本身就比传统模型"能吃"。

DeepSeek 那篇引发美股暴跌的论文，媒体报道都在讲"低成本训练"——中国公司用更少的钱训出了能打的模型。但 Gavin Baker 指出了被忽略的另一面：那篇论文恰恰证明了新一代推理模型在推理阶段消耗的算力，比传统模型高出一个数量级。

训练便宜了，推理更贵了。这个账，当时没几个人算。

商业模式被逼着改

AI 现在的处境，跟 2000 年代的电信业一模一样。

当年手机刚普及，运营商推包月套餐抢用户。增长飞起。但所有人都转向无限套餐之后，增长就停了。按量收费才是电信业的黄金时代——你打多少分钟就付多少钱，用得越多赚得越多。无限套餐？那是增长的终点。

AI 在走同样的路。

$20-200 的月费套餐看起来便宜，但后端偷偷给你的模型"降智"。Gavin Baker 在访谈里说得非常直白："如果你用的是每月 200、300 美元那种套餐，你会受到非常严格的速率限制。你拿到的是一个被限制了能力的 AI 版本。"

按他的估算，Anthropic 和 OpenAI 今年的 ARR 将远远超过 2000 亿美元。用户没变多，是按量付费让前沿 token 的价格涨上去了。

结果是什么？前沿 AI 正在变成奢侈品。

付得起按量计费的，拿到完整版。只能付月费的，拿到节能模式。这不是技术分层，是支付能力分层。

我觉得这件事比任何单款新模型发布都重要。模型能力的进步是线性的——每个月强 5%、10%。但 token 稀缺是一个结构性约束——它决定了谁能用 AI、用多少、用到什么程度。后者的影响比前者大一个数量级。

算力军备竞赛

Anthropic 的应对动作非常大。

今年他们紧急签下了 SpaceX 在孟菲斯的 Colossus 1 数据中心——22 万张 NVIDIA GPU、300 兆瓦电力。马斯克点了头，附了一条"如果 AI 危害人类可以随时收回算力"的保留条款。这话从马斯克嘴里说出来，半是公关半是真心，但合同是真的。

同一时间，半导体产能全面向 AI 倾斜。HBM 显存产能被 AI 芯片吃掉了大半，企业级 SSD 同步缺货。你装机买不到显卡，跟矿潮没关系——是 AI 在跟你抢晶圆。

有分析师管这个叫"算力通胀"。名字起得挺准的。AI 的算力需求正在永久性地重塑半导体供应链，消费级硬件市场被挤到了边缘位置。

电力更是一个被低估的瓶颈。Baker 的判断是电力短缺可能要到 2027-2028 才能缓解。马斯克已经在公开场合认真讨论"轨道算力"——把数据中心送上天，用太阳能 24 小时供电。

去年你还觉得这像科幻。今年看到 SpaceX 和 Anthropic 的合同，再想想，好像也没那么远了。

Token 就是新石油

我再说一遍：这是物理事实，不是比喻修辞。

Agent 时代最大的瓶颈是 token 成本，不是模型能力。一个 Agent 任务烧掉几十万 token，企业可以承受。但普通用户呢？

我觉得开源模型 + 本地算力可能是未来一年普通人唯一的出路。大家不是不喜欢闭源模型，是用不起。

Ben Thompson 在最近的访谈里提了一个观点我觉得很准：如果算力是稀缺资源，AI 公司就不能只按互联网软件的逻辑扩张。消费者入口、企业部署、模型成本、基础设施融资会互相牵制。AI 产品的战略问题不再只是"模型能力够不够"，还包括"谁替你承担长期推理成本"。

这个问题的答案，会决定未来五年谁能用 AI，谁能建 AI，谁只能看着别人用 AI。

硅谷那帮人喜欢说"AI 民主化"。在 token 短缺面前，这个词听起来有点讽刺。