不是我编的。是 Anthropic 的核心投资人 Gavin Baker 公开说的。他在最近一次访谈里的原话是:"如果 Anthropic 拥有全部所需算力,它今天的收入很可能已经远远超过 1000 亿美元,可能达到 1500 亿美元。"
产品好卖得很。竞争对手也没赢。问题在物理层面——电不够、芯片不够、token 不够。
AI 行业撞上的这堵墙,跟算法和数据都没关系。就是物理墙。
谁在喊缺粮?
先看 Anthropic。今年 4 月他们干了一件得罪用户的事:禁止月费订阅用户用 Claude 驱动第三方 Agent 工具。像 OpenClaw 这种爆火的开源 Agent,之前你付 $20/月就能用 Claude 在后台跑。现在不行了。想用 Agent?切到 API,按 token 付费,一个字一个字地算钱。
同时高峰期严格限流。Reddit 上骂声一片。
Amazon 也在财报里公开说"产能限制拖累了增长"。这句话翻译成大白话就是:我们有客户想买,但我们卖不了更多,因为没有多余的算力了。
OpenAI 更直接。把 Sora 这种非核心项目的算力抽走,集中到能产生收入的业务线。视频生成很酷,但在 token 短缺面前,酷不值钱。
最狠的一个数据来自 Gavin Baker 对 Claude 的分析:同一个问题,Claude 输出的 token 量比之前偷偷砍了 70%。
不是模型变笨了。是 Anthropic 在后台强行让它"少说点"。你付的 $20 月费,买到的是一个被切了前额叶的 Claude。
Token 为什么突然不够了?
答案不复杂。Agent 模式把 token 消耗量炸开了。
一次普通聊天,几百到几千 token 搞定。一个 Coding Agent 跑一次完整任务——读代码、理解上下文、写方案、执行、验证——轻轻松松 5 万到 20 万 token。这还没算推理模型在后台"思考"时烧掉的那些。
更关键的是规模。一个人同时跑 100 个 Agent 在今天的企业场景里已经很常见。100 个 Agent 同时工作,一天烧掉几千万 token 跟玩一样。
还有一个被很多人忽略的因素:推理模型本身就比传统模型"能吃"。
DeepSeek 那篇引发美股暴跌的论文,媒体报道都在讲"低成本训练"——中国公司用更少的钱训出了能打的模型。但 Gavin Baker 指出了被忽略的另一面:那篇论文恰恰证明了新一代推理模型在推理阶段消耗的算力,比传统模型高出一个数量级。
训练便宜了,推理更贵了。这个账,当时没几个人算。
商业模式被逼着改
AI 现在的处境,跟 2000 年代的电信业一模一样。
当年手机刚普及,运营商推包月套餐抢用户。增长飞起。但所有人都转向无限套餐之后,增长就停了。按量收费才是电信业的黄金时代——你打多少分钟就付多少钱,用得越多赚得越多。无限套餐?那是增长的终点。
AI 在走同样的路。
$20-200 的月费套餐看起来便宜,但后端偷偷给你的模型"降智"。Gavin Baker 在访谈里说得非常直白:"如果你用的是每月 200、300 美元那种套餐,你会受到非常严格的速率限制。你拿到的是一个被限制了能力的 AI 版本。"
按他的估算,Anthropic 和 OpenAI 今年的 ARR 将远远超过 2000 亿美元。用户没变多,是按量付费让前沿 token 的价格涨上去了。
结果是什么?前沿 AI 正在变成奢侈品。
付得起按量计费的,拿到完整版。只能付月费的,拿到节能模式。这不是技术分层,是支付能力分层。
我觉得这件事比任何单款新模型发布都重要。模型能力的进步是线性的——每个月强 5%、10%。但 token 稀缺是一个结构性约束——它决定了谁能用 AI、用多少、用到什么程度。后者的影响比前者大一个数量级。
算力军备竞赛
Anthropic 的应对动作非常大。
今年他们紧急签下了 SpaceX 在孟菲斯的 Colossus 1 数据中心——22 万张 NVIDIA GPU、300 兆瓦电力。马斯克点了头,附了一条"如果 AI 危害人类可以随时收回算力"的保留条款。这话从马斯克嘴里说出来,半是公关半是真心,但合同是真的。
同一时间,半导体产能全面向 AI 倾斜。HBM 显存产能被 AI 芯片吃掉了大半,企业级 SSD 同步缺货。你装机买不到显卡,跟矿潮没关系——是 AI 在跟你抢晶圆。
有分析师管这个叫"算力通胀"。名字起得挺准的。AI 的算力需求正在永久性地重塑半导体供应链,消费级硬件市场被挤到了边缘位置。
电力更是一个被低估的瓶颈。Baker 的判断是电力短缺可能要到 2027-2028 才能缓解。马斯克已经在公开场合认真讨论"轨道算力"——把数据中 心送上天,用太阳能 24 小时供电。
去年你还觉得这像科幻。今年看到 SpaceX 和 Anthropic 的合同,再想想,好像也没那么远了。
Token 就是新石油
我再说一遍:这是物理事实,不是比喻修辞。
Agent 时代最大的瓶颈是 token 成本,不是模型能力。一个 Agent 任务烧掉几十万 token,企业可以承受。但普通用户呢?
我觉得开源模型 + 本地算力可能是未来一年普通人唯一的出路。大家不是不喜欢闭源模型,是用不起。
Ben Thompson 在最近的访谈里提了一个观点我觉得很准:如果算力是稀缺资源,AI 公司就不能只按互联网软件的逻辑扩张。消费者入口、企业部署、模型成本、基础设施融资会互相牵制。AI 产品的战略问题不再只是"模型能力够不够",还包括"谁替你承担长期推理成本"。
这个问题的答案,会决定未来五年谁能用 AI,谁能建 AI,谁只能看着别人用 AI。
硅谷那帮人喜欢说"AI 民主化"。在 token 短缺面前,这个词听起来有点讽刺。
夜雨聆风