Token经济学,AI泡沫的第一个裂缝?

34亿人民币，一个月，全烧给了Claude。

上周Axios爆出一条消息：美国某家公司给全员开通了Anthropic企业授权，忘了设用量上限。等财务月底看到账单的时候，5亿美元已经蒸发了。

换算一下：按Anthropic目前470亿美元的年化收入算，这家公司一个月贡献了Anthropic接近八分之一的月收入。Anthropic每赚8块钱，其中1块来自这家连名字都不敢公开的公司。

而这个故事的诡异之处在于，没人知道这是谁。

更诡异的是接下来发生了的事

黄仁勋的一句话，让整个硅谷烧了半年钱

今年3月，黄仁勋在《All-In Podcast》里说了一句话，把整个行业带进了沟里。

大意是，如果一个年薪50万美元的工程师，每年花的Token不到25万美元，他会"深感担忧"。

也就是说：你用的Token越少，说明你越不会用AI。你的工程师如果不用AI，他们就是在浪费你的钱。

这句话在当时被奉为圭臬。逻辑听起来也没毛病，AI帮你省下工程师时间，多烧些Token就是买生产力。用的越多，省的越多。

于是硅谷掀起了一场浩浩荡荡的"Token maxxing"运动。企业建排行榜比谁刷Token多，员工把AI使用量写进绩效，管理层把Token消耗等同于AI采用率、等同于数字化转型进度。一套完整的内卷闭环就此形成。

我当时也觉得这套逻辑挺对的。直到最近，一张张真实账单开始寄到企业手里，剧情急转直下。

反转来了：账单说话，老板们集体跳车

亚马逊内部有一个AI使用排行榜。哪个团队用的Token多、跑的任务多，排名就靠前。这本来是为了鼓励大家多用AI。

结果你猜怎么着？

《金融时报》爆出来，亚马逊已经把这个排行榜取消了。因为员工开始为了冲名次而疯狂执行大量没有实际价值的任务，让AI反复改写同一份文档、无限次重跑过期报表、甚至自动循环生成垃圾内容来刷量。

亚马逊不是唯一的醒悟者。

微软宣布6月30日之前，Experiences + Devices部门（负责Windows、M365、Teams、Surface）的大部分工程师将被取消Claude Code授权。用了不到6个月的Claude Code，微软说停就停，要求全员迁回自家GitHub Copilot CLI。

微软对外说的是"Eat Your Own Dog Food"，吃自己的狗粮。但所有人都知道，Token账单是最诚实的催命符。

Uber的故事更惨。CTO公开说，工程师团队4个月就烧完了全年Claude Code预算。COO接着来了一刀，他在公开场合说："AI Token消耗与最终发布的有价值产品之间，似乎并不存在明显的线性关系。"

这句话翻译一下：我们烧了一堆Token，但没看到对应的产出。

连最会玩AI的公司之一，多邻国——都翻车了。他们曾计划把AI使用情况纳入员工绩效考核。结果员工集体反问："我必须为了用AI而用AI吗？"多邻国CEO后来在播客里承认了这个错误，撤回了决定。

他说了一句我觉得很有水平的话："感觉我们不是在为实际结果负责，而是在试图强推一些并不总是适合的东西。"

你以为是AI不行，其实是用法错了

看到这里你可能觉得：是不是AI泡沫破了？大模型不行了？

我的朋友，问题不在AI身上。问题出在我们怎么用它。

我仔细看完所有这些翻车案例之后，发现它们都有一个共同的死法：把"多烧Token"当成了目的本身，而不是手段。

给你打个比方。这就像你家装修，工人跟你说"我多买点材料肯定对你有好处"，于是买了一卡车的油漆、十吨水泥。结果房子没装好，账单炸了。你的钱去了哪里？去了工人刷存在感的无用劳动里。

AI Token就是这个"材料"。烧得多不等于活干得好。烧得多只说明——有人在替AI的无意义劳动买单。

米哈游的郑银河分享过一个经典案例：他们的某个Agent项目上线后，一晚上烧掉200万元Token费用。

200万，一个晚上。

这钱花到哪了？大部分Token消耗在一个循环里：Agent生成了一段代码 → 用自己的另一个Agent检查这段代码 → 发现一个小问题 → 重新生成 → 再次检查 → 再次微调 → 又发现问题……像一个永动机关一样反复内耗，直到人类介入才停止。

这不是AI在帮你解决问题。这是AI在帮你花钱。

我翻遍所有翻车案例，总结出3条铁律

但这不是AI行业要完蛋的信号。恰恰相反，这是企业在从"先用再说"的狂热期，进入"精细运营"的成熟期。

而在这个转折点上，谁能把Token花在刀刃上，谁就能用别人的学费换自己的效率。我总结了三条铁律：

1：便宜模型跑日常，贵模型做决策。

给Claude喂"今天天气怎么样"这种问题，就是开法拉利送外卖。Open Squilla的智能路由已经证明了这个模式：把查询用户年龄、偏好这类简单任务甩给DeepSeek，只有生成安全审查方案、复杂代码才调用Claude。Token成本直接砍掉60-80%。这不是技术难题，这是基本的管理常识，你不会让年薪500万的合伙人去接客服电话。为什么给AI就不这么做了？

2：加一个"人类开关"在关键节点上。

米哈游那200万的教训，核心就是一个词：Agent无限循环。AI自己写代码、自己检查、自己修改、再检查，中间没有一个"等一等，先给人看看"的暂停按钮。如果你在Agent工作流里设置几个关键审批点，代码写完了，暂停，人类看一下方向对不对，那200万可能只需要2万（虽然夸张了）。Agent不是不能跑长任务，但你不能把方向盘全交给它。留一脚刹车在人类脚下，这就是省钱的秘诀。

铁律3：Token账单和业务结果挂钩，而不是和"使用量"挂钩。

Uber COO说的那句"Token消耗与产品价值之间没有线性关系"，道破了天机。你烧1000万Token和100万Token，如果产出的代码行数、修复的Bug数量、上线的功能点数是一样的，那多出来的900万Token就是纯粹的浪费。把Token预算和真实的业务指标挂钩——新功能发布速度、Bug解决率、用户留存提升，而不是盯着"这个月谁的Token用得多"。多邻国在这点上已经用脚投票了。

所以，AI泡沫到底破没破？

我的答案是：不是泡沫破了，而是"Token maxxing"这个特定阶段的泡沫破了。

一个更有力的证据来自Hacker News上的讨论。很多开发者指出，这恰恰说明AI正在进入一个更成熟的阶段，企业终于开始思考"怎么用AI"而不是"用不用AI"。

去年这个时候，企业最担心的是员工不用AI。现在，企业在担心AI是不是用得太多了。

从"要不要用"到"怎么用对"，这是任何一个技术从狂热走向实用的必经之路。当年云计算刚起来的时候，企业也是疯狂上云，烧了不计其数的钱，然后才学会"弹性伸缩""按需付费""成本优化"。AI正在经历一模一样的曲线。

而这条曲线上，赢家和输家的分野会很清楚：

输家是那些还在用"Token消耗量"来衡量AI成功的公司。

赢家是那些学会了"用最少Token做最多事"的公司。

这个道理的残酷之处在于：它跟黄仁勋说的正好相反。

不是"烧Token越少说明你越不会用AI"。而是"烧Token越多，说明你的流程设计越差"。

从狂热到冷静，谁在裸泳一目了然

老实说，我写这篇文章的时候，内心是兴奋的。

为什么？因为过去半年所有人都在讨论"AI能做什么"。而现在，终于有人开始讨论"AI应该怎么用才能赚钱"。

这是AI行业从青春期进入成年期的标志。

那些靠无限Token补贴、靠"多烧就是好"的粗暴逻辑撑起来的泡沫，会被挤出市场。而真正能帮企业用AI创造价值的产品和方案，会迎来爆发。

如果你是一个技术管理者，现在该做什么？

停下来，看一眼你的Token账单。如果上面只有"总量"一个数字，而没有任何关于"这个月AI帮我多发了几个版本""修复了几个关键Bug""帮用户省了多少时间"的对应关系——你已经在Tokenmaxxing的铁轨上裸奔了。

如果你是一个创业公司，做什么方向？

做Token优化工具、做智能路由产品、做Agent成本监控平台，帮企业把Token花在刀刃上。这个需求，在接下来6个月会爆炸。

黄仁勋说"少烧Token就是不会用AI"的那个时代，结束了。

新玩法是：烧最少的Token，做最多的事。

这不叫抠门，这叫成熟。

引用来源

1.Axios: "AI spending ROI and enterprise costs"

—axios.com/2026/05/28/ai-spending-roi-enterprise-costs

2.Tom's Hardware: "Mystery company accidentally blew $500M on Claude in a single month"

—tomshardware.com

3.Financial Times: Amazon cancels internal AI leaderboard

4.Bloomberg: Microsoft to cancel Claude Code licenses for E+D division by June 30

5.Uber COO Andrew Macdonald: Public statement on AI token ROI — x.com

6.Duolingo CEO Luis von Ahn: Podcast interview on canceling AI performance metrics

7.Hacker News: Discussion thread "Tokenmaxxing era ending?"

—news.ycombinator.com/item?id=48307098

8.Nathan Lambert (Interconnects): "Open and closed models are on different exponentials"

—interconnects.ai

9.量子位: "老黄的Token经济学翻车了！微软亚马逊通通跳车"

— qbitai.com/2026/06/427541.html

#AI#Token经济学#人工智能#科技#企业管理