34亿人民币,一个月,全烧给了Claude。
上周Axios爆出一条消息:美国某家公司给全员开通了Anthropic企业授权,忘了设用量上限。等财务月底看到账单的时候,5亿美元已经蒸发了。
换算一下:按Anthropic目前470亿美元的年化收入算,这家公司一个月贡献了Anthropic接近八分之一的月收入。Anthropic每赚8块钱,其中1块来自这家连名字都不敢公开的公司。
而这个故事的诡异之处在于,没人知道这是谁。
更诡异的是接下来发生了的事
黄仁勋的一句话,让整个硅谷烧了半年钱
今年3月,黄仁勋在《All-In Podcast》里说了一句话,把整个行业带进了沟里。
大意是,如果一个年薪50万美元的工程师,每年花的Token不到25万美元,他会"深感担忧"。
也就是说:你用的Token越少,说明你越不会用AI。你的工程师如果不用AI,他们就是在浪费你的钱。
这句话在当时被奉为圭臬。逻辑听起来也没毛病,AI帮你省下工程师时间,多烧些Token就是买生产力。用的越多,省的越多。
于是硅谷掀起了一场浩浩荡荡的"Token maxxing"运动。企业建排行榜比谁刷Token多,员工把AI使用量写进绩效,管理层把Token消耗等同于AI采用率、等同于数字化转型进度。一套完整的内卷闭环就此形成。
我当时也觉得这套逻辑挺对的。直到最近,一张张真实账单开始寄到企业手里,剧情急转直下。
反转来了:账单说话,老板们集体跳车
亚马逊内部有一个AI使用排行榜。哪个团队用的Token多、跑的任务多,排名就靠前。这本来是为了鼓励大家多用AI。
结果你猜怎么着?
《金融时报》爆出来,亚马逊已经把这个排行榜取消了。因为员工开始为了冲名次而疯狂执行大量没有实际价值的任务,让AI反复改写同一份文档、无限次重跑过期报表、甚至自动循环生成垃圾内容来刷量。
亚马逊不是唯一的醒悟者。
微软宣布6月30日之前,Experiences + Devices部门(负责Windows、M365、Teams、Surface)的大部分工程师将被取消Claude Code授权。用了不到6个月的Claude Code,微软说停就停,要求全员迁回自家GitHub Copilot CLI。
微软对外说的是"Eat Your Own Dog Food",吃自己的狗粮。但所有人都知道,Token账单是最诚实的催命符。
Uber的故事更惨。CTO公开说,工程师团队4个月就烧完了全年Claude Code预算。COO接着来了一刀,他在公开场合说:"AI Token消耗与最终发布的有价值产品之间,似乎并不存在明显的线性关系。"
这句话翻译一下:我们烧了一堆Token,但没看到对应的产出。
连最会玩AI的公司之一,多邻国——都翻车了。他们曾计划把AI使用情况纳入员工绩效考核。结果员工集体反问:"我必须为了用AI而用AI吗?"多邻国CEO后来在播客里承认了这个错误,撤回了决定。
他说了一句我觉得很有水平的话:"感觉我们不是在为实际结果负责,而是在试图强推一些并不总是适合的东西。"

你以为是AI不行,其实是用法错了
看到这里你可能觉得:是不是AI泡沫破了?大模型不行了?
我的朋友,问题不在AI身上。问题出在我们怎么用它。
我仔细看完所有这些翻车案例之后,发现它们都有一个共同的死法:把"多烧Token"当成了目的本身,而不是手段。
给你打个比方。这就像你家装修,工人跟你说"我多买点材料肯定对你有好处",于是买了一卡车的油漆、十吨水泥。结果房子没装好,账单炸了。你的钱去了哪里?去了工人刷存在感的无用劳动里。
AI Token就是这个"材料"。烧得多不等于活干得好。烧得多只说明——有人在替AI的无意义劳动买单。
米哈游的郑银河分享过一个经典案例:他们的某个Agent项目上线后,一晚上烧掉200万元Token费用。
200万,一个晚上。
这钱花到哪了?大部分Token消耗在一个循环里:Agent生成了一段代码 → 用自己的另一个Agent检查这段代码 → 发现一个小问题 → 重新生成 → 再次检查 → 再次微调 → 又发现问题……像一个永动机关一样反复内耗,直到人类介入才停止。
这不是AI在帮你解决问题。这是AI在帮你花钱。

我翻遍所有翻车案例,总结出3条铁律
但这不是AI行业要完蛋的信号。恰恰相反,这是企业在从"先用再说"的狂热期,进入"精细运营"的成熟期。
而在这个转折点上,谁能把Token花在刀刃上,谁就能用别人的学费换自己的效率。我总结了三条铁律:
1:便宜模型跑日常,贵模型做决策。
给Claude喂"今天天气怎么样"这种问题,就是开法拉利送外卖。Open Squilla的智能路由已经证明了这个模式:把查询用户年龄、偏好这类简单任务甩给DeepSeek,只有生成安全审查方案、复杂代码才调用Claude。Token成本直接砍掉60-80%。这不是技术难题,这是基本的管理常识,你不会让年薪500万的合伙人去接客服电话。为什么给AI就不这么做了?
2:加一个"人类开关"在关键节点上。
米哈游那200万的教训,核心就是一个词:Agent无限循环。AI自己写代码、自己检查、自己修改、再检查,中间没有一个"等一等,先给人看看"的暂停按钮。如果你在Agent工作流里设置几个关键审批点,代码写完了,暂停,人类看一下方向对不对,那200万可能只需要2万(虽然夸张了)。Agent不是不能跑长任务,但你不能把方向盘全交给它。留一脚刹车在人类脚下,这就是省钱的秘诀。
铁律3:Token账单和业务结果挂钩,而不是和"使用量"挂钩。
Uber COO说的那句"Token消耗与产品价值之间没有线性关系",道破了天机。你烧1000万Token和100万Token,如果产出的代码行数、修复的Bug数量、上线的功能点数是一样的,那多出来的900万Token就是纯粹的浪费。把Token预算和真实的业务指标挂钩——新功能发布速度、Bug解决率、用户留存提升,而不是盯着"这个月谁的Token用得多"。多邻国在这点上已经用脚投票了。

所以,AI泡沫到底破没破?
我的答案是:不是泡沫破了,而是"Token maxxing"这个特定阶段的泡沫破了。
一个更有力的证据来自Hacker News上的讨论。很多开发者指出,这恰恰说明AI正在进入一个更成熟的阶段,企业终于开始思考"怎么用AI"而不是"用不用AI"。
去年这个时候,企业最担心的是员工不用AI。现在,企业在担心AI是不是用得太多了。
从"要不要用"到"怎么用对",这是任何一个技术从狂热走向实用的必经之路。当年云计算刚起来的时候,企业也是疯狂上云,烧了不计其数的钱,然后才学会"弹性伸缩""按需付费""成本优化"。AI正在经历一模一样的曲线。
而这条曲线上,赢家和输家的分野会很清楚:
输家是那些还在用"Token消耗量"来衡量AI成功的公司。
赢家是那些学会了"用最少Token做最多事"的公司。
这个道理的残酷之处在于:它跟黄仁勋说的正好相反。
不是"烧Token越少说明你越不会用AI"。而是"烧Token越多,说明你的流程设计越差"。

从狂热到冷静,谁在裸泳一目了然
老实说,我写这篇文章的时候,内心是兴奋的。
为什么?因为过去半年所有人都在讨论"AI能做什么"。而现在,终于有人开始讨论"AI应该怎么用才能赚钱"。
这是AI行业从青春期进入成年期的标志。
那些靠无限Token补贴、靠"多烧就是好"的粗暴逻辑撑起来的泡沫,会被挤出市场。而真正能帮企业用AI创造价值的产品和方案,会迎来爆发。
如果你是一个技术管理者,现在该做什么?
停下来,看一眼你的Token账单。如果上面只有"总量"一个数字,而没有任何关于"这个月AI帮我多发了几个版本""修复了几个关键Bug""帮用户省了多少时间"的对应关系——你已经在Tokenmaxxing的铁轨上裸奔了。
如果你是一个创业公司,做什么方向?
做Token优化工具、做智能路由产品、做Agent成本监控平台,帮企业把Token花在刀刃上。这个需求,在接下来6个月会爆炸。
黄仁勋说"少烧Token就是不会用AI"的那个时代,结束了。
新玩法是:烧最少的Token,做最多的事。
这不叫抠门,这叫成熟。

夜雨聆风