所有人都在谈论石油,但世界真正短缺的或许是Token——算力短缺正成为AI繁荣时代最棘手的瓶颈。
01 / Token,新的稀缺资源

▲ 数据中心成为AI时代的新型基础设施
词元Token是AI领域衡量算力消耗的基本单位,直接对应模型推理的计算开销。OpenAI的API平台上,Token调用量从去年10月的每分钟60亿次,飙升至今年3月底的每分钟150亿次,不足半年增幅达150%。
推动这一增长的核心驱动力,是"智能体"AI的快速普及。这类工具能够自主执行任务,从编写代码到安排日程,正深度替代人工工作流程。
"所有人都在谈论石油,但我认为世界真正短缺的是词元Token。"
—— 洛杉矶工程师兼科技投资人 Ben Pouladian
02 / 宕机与限流,行业信任危机

▲ GPU芯片成为AI时代的"新石油"
自今年2月以来,Anthropic旗下Claude API服务中断事件愈发频繁。截至4月8日,其过去90天正常运行率仅为98.95%,远低于行业标准的99.99%。
AI推理初创公司Baseten联合创始人Amir Haghighat直言:"AWS、数据库、支付平台都需要极高的可用性,但AI领域的现实并非如此。"
面对压力,Anthropic在3月底宣布将在工作日高峰时段对Token用量实施限制。此举迅速引发用户在社交媒体上的集中抱怨,一位用户在X平台写道:"这周大概45分钟就到上限了。"
讽刺的是,宕机频发的背景恰恰是Anthropic业务的超高速增长——其年化营收从2025年底的90亿美元,在短短两个月内跃升至300亿美元。 —— 营收数据来源:Anthropic官方披露
03 / 算力成本飙升,供给困局难解

▲ 大规模服务器集群支撑AI算力需求
供给端的紧张同步推高了算力成本。租用英伟达最新一代Blackwell芯片的每小时费用目前为4.08美元,较两个月前的2.75美元上涨48%。
云基础设施公司Vultr首席执行官J.J. Kardwell将此描述为"五年多来从未见过的大规模算力紧缺"。他解释道:"交货周期太长,数据中心建设周期太长,而且2026年之前可用的电力容量已经全部提前预订完了。"
美国银行分析师预计CoreWeave的服务需求至少在2029年之前将持续超过供给。OpenAI首席财务官Sarah Friar坦言:"我花了大量时间试图寻找任何临时可用的算力,在一些本来想推进的事情上做出了非常艰难的取舍。"
"需求增速始终快于资源获取与产能扩张的速度——这是贯穿技术史的经典命题。"
这场困境并非AI行业独有,从19世纪的铁路扩张到21世纪初的互联网泡沫,每一轮技术热潮都伴随着基础设施建设的滞后。对于眼下正在激烈争夺用户的前沿AI公司而言,涨价可能直接损害用户增长,而这恰恰是估值逻辑的核心支柱。
如何在维持服务质量与控制算力成本之间找到平衡,将是AI行业下一阶段必须正面作答的核心挑战。
夜雨聆风