70% 的代码由 AI 生成,但 4 个月花掉了全年的钱。当工具越好用、预算消失得越快,这个悖论没有人教过你怎么解。
✿ ✿ ✿
两个事实,放在一起看特别刺眼
Uber 的工程师们用 Claude Code 写了公司 70% 的提交代码。
Uber 在 4 个月内烧光了 2026 全年的 AI 工具预算。
这两件事发生在同一家公司。它们不矛盾——恰恰相反,第一件事导致了第二件事。工具越好用,工程师用得越多;用得越多,token 消耗越大;token 按量计费,预算就这么没了。
我第一次看到 Bloomberg 6 月 2 日的报道时,反应不是惊讶,是"终于有人把这事儿说出来了"。因为这不是 Uber 一家的问题——这是 2026 年上半年整个行业正在集体踩的坑。

AI 编程工具的效率悖论
✿ ✿ ✿
Uber 是怎么一步步把钱烧光的
故事要从 2025 年 12 月说起。
Uber 向工程团队开放了 Claude Code 访问权限。一开始只是"试试看"。到 2 月,使用量翻了一倍——工程师们发现这工具确实能干活,不是玩具。
然后事情开始失控。
Uber 内部搞了一个 使用量排行榜——是的,你没看错,鼓励工程师多用 AI 工具的排行榜。工程师被按使用量排名。Claude Code 成了主流工具,Cursor 的使用量反而停滞了。
95% 的 Uber 工程师每月都在用 AI 工具。每位工程师的月均 API 消耗在 $500 到 $2000 之间。5000 名工程师,就算取中位数 $1000——每月 500 万美元。四个月,两千万。
但这还不是全部。Agentic 工作流是真正的"隐形杀手":一次 Claude Code 的 prompt,如果涉及多文件理解和多步推理,可以一口气吃掉 5 万到 30 万个 token。一个长 session 下来,单次 prompt 就能消耗掉 5 小时预算的 30%-90%。
Uber 的 COO 在 Fortune 杂志的采访里问了一个灵魂问题:"这个投入值不值得?"

Uber AI 预算消耗时间线
✿ ✿ ✿
✿ ✿ ✿
微软:自己的工程师更喜欢 Claude Code
如果 Uber 的故事让你觉得只是管理失误,来看微软的案例。
Tom Warren 在 Build 前一天爆料:微软 E+D 部门正在取消大部分 Claude Code 许可证。Windows、Microsoft 365、Outlook、Teams、Surface——这些产品线的工程师必须在 6 月 30 日前迁移到 GitHub Copilot CLI。
取消的原因?多个信源说,微软自己的工程师其实更偏好 Claude Code。一家公司不可能一边在全球推销 Copilot,一边让自己的工程师跑去用竞品。
但成本也是关键因素。Claude Code 企业版按 token 计量,用得越多越贵。Copilot Enterprise 呢?每席每月 $39,flat rate,用多少都一样。
从"省钱"的角度看,微软的选择很理性。
从"好不好用"的角度看——算了,这个问题让微软工程师自己回答吧。

企业级 AI 编程工具成本对比
✿ ✿ ✿
还有一家公司,一个月花了 5 亿美元
你以为 Uber 已经够狠了?
有一家未具名企业,一个月在 Claude AI 上花了 5 亿美元。根因是什么?零消费控制 + 无限员工访问。没有任何 spending limit,没有任何审批流程,API key 发下去就完事了。
这个案例极端,但暴露了一个普遍问题:大多数企业在部署 AI 编码工具时,根本没有做成本管控的基础设施。Mavvrik 的调查显示,85% 的企业 AI 成本实际支出超出预测 10% 以上,84% 的企业毛利率因此下降超过 6 个百分点。
说白了:大家都知道 AI 工具好用,但没人算清楚账。

AI 工具企业成本失控数据
✿ ✿ ✿
✿ ✿ ✿
好,现在聊聊怎么活下来
吐槽完了。接下来是我这半年踩出来的实操经验。
第一件事:每天盯 /cost
Claude Code 里输入 /cost,立刻能看到当前 session 的 token 消耗和花费。这是最基础的感知——如果你连自己烧了多少钱都不知道,优化无从谈起。
我现在养成了一个习惯:每完成一个任务,敲一次 /cost。对,就像你写代码会 git status 一样,这应该是本能操作。
第二件事:model 选择是最大的杠杆
90% 的日常任务用 Sonnet 就够了,不需要 Opus。
我说的"日常任务"包括:代码补全、单文件 bug 修复、简单重构、文档生成、测试编写。这些任务上 Sonnet 和 Opus 的体感差异很小,但 token 消耗差好几倍。
只有这些场景才值得上 Opus:多文件架构级重构、复杂 debug(需要跨模块推理)、新功能的 0 到 1 设计。
具体操作:在 Claude Code 里用 /model 切换模型。很多人不知道这个命令,一直在用默认的 Opus——这就等于每次出门都开法拉利去买菜。
第三件事:session 管理,别让上下文爆炸
Claude Code 每次请求都会重发整个对话历史 + 系统提示 + 工具定义。session 越长,每次请求的 token 数越大。
我的做法:
- 01一个任务完成就
/clear,开新 session - 02用 CLAUDE.md 把项目关键信息"固化",这样不需要在对话里反复解释上下文
- 03复杂任务用 plan mode 先对齐方案,避免来回试错(每次试错都是实打实的 token)
第四件事:设硬上限
如果你是团队 lead 或 CTO——现在就给每人设月度消费上限。
Uber 最终的做法是 每人每月 $1500。这个数字不一定适合你的团队,但关键是必须有一个数字。
企业版 Claude Code 可以在管理后台设置 spend limits。如果用 API 模式,就在 Anthropic 控制台设 usage alerts 和 hard limits。
没有限制 = 无限消耗。这不是假设,是已经被验证的事实。
第五件事:预处理,别让 AI 读不该读的东西
Claude Code 支持 preprocessing hooks——在请求发送前先跑一段脚本。
用这个功能可以:
- 自动过滤掉不相关的大文件(比如 node_modules 里的东西被意外引入上下文)
- 压缩重复的日志输出
- 在 prompt 前自动加上项目特定的约束
这些操作能显著减少每次请求的 token 数。

5 条实战省钱策略
✿ ✿ ✿
✿ ✿ ✿
个人开发者 vs 企业,逻辑完全不同
如果你是个人开发者用 Max 20x 计划($200/月),你的成本焦虑和企业完全不一样。
个人开发者的核心问题不是"花太多钱",而是"额度用完了这个月还能不能继续写代码"。所以你的优化方向是 额度效率最大化:
- 白天写思路、晚上跑任务(错峰使用,避开高峰限流)
- 大块工作拆成小步——每步完成后
/clear - 把 CLAUDE.md 写详细,减少"解释需求"的 token 浪费
- 不重要的任务走 Haiku(是的,2026 年了 Haiku 依然有它的位置)
企业的核心问题是 可预测性——CFO 要知道下个季度 AI 工具要花多少钱。所以企业需要的是 spend limits、usage dashboards、团队级别的 model policy。
这两种焦虑需要完全不同的解法,但 99% 的"AI 编程工具省钱指南"把它们混在一起讲。

个人 vs 企业 AI 编程成本策略对比
✿ ✿ ✿
真正的问题不是省钱
写到这里我想说一个可能不太受欢迎的观点。
"工具越好用,预算越快花完"——这个悖论的终极解法不是省钱。是重新定义"预算"的含义。
如果一个工程师用了 $1000 的 token,但交付了原来需要三个人才能完成的工作量——这 $1000 是成本还是投资?Uber 的 COO 问"值不值",但他应该问的是"跟不用 AI 相比,单位产出的成本降低了还是上升了"。
我自己的数据(样本量为 1,不具统计意义):用 Claude Code 之后,我的个人项目产出大概是之前的 3-4 倍。每月 $200 的 Max 计划,折算下来每个"项目"的成本比以前低很多。
但这个算法在企业里很难讲通。因为你没办法精确量化"这段代码如果不用 AI,工程师要写多久"。所以 CFO 看到的就是一个疯涨的账单,而不是一个疯涨的产出。
这个认知差才是 2026 年 AI 编程工具面对的真正问题。

AI 编程投入产出认知差
✿ ✿ ✿
写在最后
总结一下今天这篇的实操建议:
- 01每天
/cost,养成本能 - 02默认 Sonnet,大活才上 Opus
- 03任务完成就
/clear - 04团队必须设月度硬上限
- 05用 preprocessing hooks 减少 token 浪费
- 06CLAUDE.md 是最便宜的上下文——写一次,用无数次
Uber 和微软的故事还在发展中。Uber 的 $1500 月限够不够用、微软工程师迁移到 Copilot CLI 后效率会不会下降——这些问题的答案要到下半年才知道。
但有一件事我现在就能告诉你:如果你的团队还在毫无限制地使用 AI 编码工具,你不是在节省人力成本,你是在赌博。
赌注是你的全年预算。
夜雨聆风