AI 编程工具烧钱实录:Uber 4 个月烧光全年预算,你的团队怎么活

70% 的代码由 AI 生成，但 4 个月花掉了全年的钱。当工具越好用、预算消失得越快，这个悖论没有人教过你怎么解。

✿ ✿ ✿

两个事实，放在一起看特别刺眼

Uber 的工程师们用 Claude Code 写了公司 70% 的提交代码。

Uber 在 4 个月内烧光了 2026 全年的 AI 工具预算。

这两件事发生在同一家公司。它们不矛盾——恰恰相反,第一件事导致了第二件事。工具越好用,工程师用得越多;用得越多,token 消耗越大;token 按量计费,预算就这么没了。

我第一次看到 Bloomberg 6 月 2 日的报道时,反应不是惊讶,是"终于有人把这事儿说出来了"。因为这不是 Uber 一家的问题——这是 2026 年上半年整个行业正在集体踩的坑。

AI 编程工具的效率悖论

✿ ✿ ✿

Uber 是怎么一步步把钱烧光的

故事要从 2025 年 12 月说起。

Uber 向工程团队开放了 Claude Code 访问权限。一开始只是"试试看"。到 2 月，使用量翻了一倍——工程师们发现这工具确实能干活,不是玩具。

然后事情开始失控。

Uber 内部搞了一个 使用量排行榜——是的,你没看错,鼓励工程师多用 AI 工具的排行榜。工程师被按使用量排名。Claude Code 成了主流工具,Cursor 的使用量反而停滞了。

95% 的 Uber 工程师每月都在用 AI 工具。每位工程师的月均 API 消耗在 $500 到 $2000 之间。5000 名工程师,就算取中位数 $1000——每月 500 万美元。四个月,两千万。

但这还不是全部。Agentic 工作流是真正的"隐形杀手"：一次 Claude Code 的 prompt,如果涉及多文件理解和多步推理,可以一口气吃掉 5 万到 30 万个 token。一个长 session 下来,单次 prompt 就能消耗掉 5 小时预算的 30%-90%。

Uber 的 COO 在 Fortune 杂志的采访里问了一个灵魂问题："这个投入值不值得?"

Uber AI 预算消耗时间线

✿ ✿ ✿

微软：自己的工程师更喜欢 Claude Code

如果 Uber 的故事让你觉得只是管理失误,来看微软的案例。

Tom Warren 在 Build 前一天爆料：微软 E+D 部门正在取消大部分 Claude Code 许可证。Windows、Microsoft 365、Outlook、Teams、Surface——这些产品线的工程师必须在 6 月 30 日前迁移到 GitHub Copilot CLI。

取消的原因？多个信源说,微软自己的工程师其实更偏好 Claude Code。一家公司不可能一边在全球推销 Copilot,一边让自己的工程师跑去用竞品。

但成本也是关键因素。Claude Code 企业版按 token 计量,用得越多越贵。Copilot Enterprise 呢？每席每月 $39,flat rate,用多少都一样。

从"省钱"的角度看,微软的选择很理性。

从"好不好用"的角度看——算了,这个问题让微软工程师自己回答吧。

企业级 AI 编程工具成本对比

✿ ✿ ✿

还有一家公司，一个月花了 5 亿美元

你以为 Uber 已经够狠了？

有一家未具名企业,一个月在 Claude AI 上花了 5 亿美元。根因是什么？零消费控制 + 无限员工访问。没有任何 spending limit,没有任何审批流程,API key 发下去就完事了。

这个案例极端,但暴露了一个普遍问题：大多数企业在部署 AI 编码工具时,根本没有做成本管控的基础设施。Mavvrik 的调查显示,85% 的企业 AI 成本实际支出超出预测 10% 以上,84% 的企业毛利率因此下降超过 6 个百分点。

说白了：大家都知道 AI 工具好用,但没人算清楚账。

AI 工具企业成本失控数据

✿ ✿ ✿

好,现在聊聊怎么活下来

吐槽完了。接下来是我这半年踩出来的实操经验。

第一件事：每天盯 /cost

Claude Code 里输入 /cost,立刻能看到当前 session 的 token 消耗和花费。这是最基础的感知——如果你连自己烧了多少钱都不知道,优化无从谈起。

我现在养成了一个习惯：每完成一个任务,敲一次 /cost。对,就像你写代码会 git status 一样,这应该是本能操作。

第二件事：model 选择是最大的杠杆

90% 的日常任务用 Sonnet 就够了,不需要 Opus。

我说的"日常任务"包括：代码补全、单文件 bug 修复、简单重构、文档生成、测试编写。这些任务上 Sonnet 和 Opus 的体感差异很小,但 token 消耗差好几倍。

只有这些场景才值得上 Opus：多文件架构级重构、复杂 debug（需要跨模块推理）、新功能的 0 到 1 设计。

具体操作：在 Claude Code 里用 /model 切换模型。很多人不知道这个命令,一直在用默认的 Opus——这就等于每次出门都开法拉利去买菜。

第三件事：session 管理,别让上下文爆炸

Claude Code 每次请求都会重发整个对话历史 + 系统提示 + 工具定义。session 越长,每次请求的 token 数越大。

我的做法：

01一个任务完成就 /clear,开新 session
02用 CLAUDE.md 把项目关键信息"固化",这样不需要在对话里反复解释上下文
03复杂任务用 plan mode 先对齐方案,避免来回试错（每次试错都是实打实的 token）

第四件事：设硬上限

如果你是团队 lead 或 CTO——现在就给每人设月度消费上限。

Uber 最终的做法是每人每月 $1500。这个数字不一定适合你的团队,但关键是必须有一个数字。

企业版 Claude Code 可以在管理后台设置 spend limits。如果用 API 模式,就在 Anthropic 控制台设 usage alerts 和 hard limits。

没有限制 = 无限消耗。这不是假设,是已经被验证的事实。

第五件事：预处理,别让 AI 读不该读的东西

Claude Code 支持 preprocessing hooks——在请求发送前先跑一段脚本。

用这个功能可以：

自动过滤掉不相关的大文件（比如 node_modules 里的东西被意外引入上下文）
压缩重复的日志输出
在 prompt 前自动加上项目特定的约束

这些操作能显著减少每次请求的 token 数。

5 条实战省钱策略

✿ ✿ ✿

个人开发者 vs 企业，逻辑完全不同

如果你是个人开发者用 Max 20x 计划（$200/月),你的成本焦虑和企业完全不一样。

个人开发者的核心问题不是"花太多钱",而是"额度用完了这个月还能不能继续写代码"。所以你的优化方向是 额度效率最大化：

白天写思路、晚上跑任务（错峰使用,避开高峰限流）
大块工作拆成小步——每步完成后 /clear
把 CLAUDE.md 写详细,减少"解释需求"的 token 浪费
不重要的任务走 Haiku（是的,2026 年了 Haiku 依然有它的位置）

企业的核心问题是 可预测性——CFO 要知道下个季度 AI 工具要花多少钱。所以企业需要的是 spend limits、usage dashboards、团队级别的 model policy。

这两种焦虑需要完全不同的解法,但 99% 的"AI 编程工具省钱指南"把它们混在一起讲。

个人 vs 企业 AI 编程成本策略对比

✿ ✿ ✿

真正的问题不是省钱

写到这里我想说一个可能不太受欢迎的观点。

"工具越好用,预算越快花完"——这个悖论的终极解法不是省钱。是重新定义"预算"的含义。

如果一个工程师用了 $1000 的 token,但交付了原来需要三个人才能完成的工作量——这 $1000 是成本还是投资？Uber 的 COO 问"值不值",但他应该问的是"跟不用 AI 相比,单位产出的成本降低了还是上升了"。

我自己的数据（样本量为 1,不具统计意义）：用 Claude Code 之后,我的个人项目产出大概是之前的 3-4 倍。每月 $200 的 Max 计划,折算下来每个"项目"的成本比以前低很多。

但这个算法在企业里很难讲通。因为你没办法精确量化"这段代码如果不用 AI,工程师要写多久"。所以 CFO 看到的就是一个疯涨的账单,而不是一个疯涨的产出。

这个认知差才是 2026 年 AI 编程工具面对的真正问题。

AI 编程投入产出认知差

✿ ✿ ✿

写在最后

总结一下今天这篇的实操建议：

01每天 /cost,养成本能
02默认 Sonnet,大活才上 Opus
03任务完成就 /clear
04团队必须设月度硬上限
05用 preprocessing hooks 减少 token 浪费
06CLAUDE.md 是最便宜的上下文——写一次,用无数次

Uber 和微软的故事还在发展中。Uber 的 $1500 月限够不够用、微软工程师迁移到 Copilot CLI 后效率会不会下降——这些问题的答案要到下半年才知道。

但有一件事我现在就能告诉你：如果你的团队还在毫无限制地使用 AI 编码工具,你不是在节省人力成本,你是在赌博。

赌注是你的全年预算。