💰 Uber 四个月烧完全年 AI 编程预算,微软也扛不住强制切换工具。AI 写代码本该省钱,怎么反而成了成本黑洞?
过去一年,你可能见过太多这样的标题:"AI 取代程序员"、"90% 的代码将由 AI 生成"。
但没人告诉你另一面:用 AI 写代码,可能比雇人还贵——而且代码质量还未必靠谱。
最近,Uber 高管公开承认了一件事——公司在 4 月份就已经烧完了 2026 全年的 Claude Code 预算。为了补这个窟窿,Uber 不得不放缓全年招聘计划。
紧接着,连财大气粗的微软也撑不住了。微软 CEO 纳德拉下达指令:从 6 月起,内部开发工作从 Claude Code 强制切换回自家的 GitHub Copilot。控制预算是核心原因,但也有产品战略考量——既然自家有 Copilot,何必花冤枉钱用别人的?
AI 本该降本增效,结果成了最大的成本黑洞。这事值得好好聊聊。
💸 先算一笔账
AI 编程工具按 Token 计费。你每发一条指令、每让 AI 生成一行代码、每让它改一个 bug,都在烧 Token。
单次调用看起来很便宜——几毛钱甚至几分钱。但问题在于,当一个开发团队开始部署 AI Agent,让它 7×24 小时自动运行时,Token 消耗就像开着水龙头不关。
以 Claude Code 为例,Sonnet 模型的定价是 $3/$15 per million token,Opus 更是 $15/$75 per million token。一个开发者如果全天候使用,尤其是涉及长上下文对话时,一天下来 Token 费用很容易就上百美元。一个 10 人团队,一个月的 AI 调用费可能就不是小数目了。
如果是让 AI Agent 全天候自动跑——执行代码审查、跑测试、自动修复 bug——成本直接翻几倍。Uber 就是这么烧完预算的。
更要命的是,AI 写代码很快,但它改代码也很快。一个常见的场景是:AI 写了一版代码 → 人工审查发现问题 → 让 AI 重新写 → 又发现新问题 → 再改……每一轮都在烧 Token,而且越改越贵。

▲ AI 编程工具让开发更快,但 Token 账单也在飞速增长
🔴 不止是钱的问题
除了贵,AI 生成的代码质量也正在被业界重新审视。
多位技术专家最近公开指出,AI 在"批量制造垃圾代码"。这不是说 AI 写的代码都是错的,而是:
• AI 倾向于生成"看起来正确"的代码,但经常忽略边界情况和异常处理
• AI 生成的代码中隐藏着安全漏洞,你自己可能看不出来
• 当 AI 修复一个 bug 时,有时会引入新的 bug
这就形成了一个恶性循环:
💬 AI 写代码 → 人审查 → 发现问题 → 让 AI 改 → 更多 Token 消耗 → 更高成本 → 改完有一定概率引入新问题 → 再改……
最后算总账,你发现 AI 确实帮你省了写代码的时间,但省下来的时间全花在了审查和修复上——而且你还多付了一笔昂贵的 Token 账单。
✅ 那到底还用不用?
用。但要用得聪明,而不是用得任性。
1. 别让 AI 自由跑,设置预算上限
这是最重要的一条。不管是个人还是团队,一定要给 AI 工具设定每月的 Token 预算上限。跑超了就停,而不是月底才看到账单傻眼。
2. 明确任务边界,别让 AI 干整项目重构
AI 最擅长的是:写初稿、生成模板代码、单文件修改、解释代码逻辑。最不擅长的是:理解整个项目的架构,然后做跨文件的大规模重构。把大任务拆成小任务,每个任务明确输入输出,Token 消耗会可控得多。
3. 高频场景优先考虑本地模型
如果你是重度用户,每天调用量很大,纯 API 调用的成本会非常高。这时候可以考虑本地部署开源模型——比如 Qwen3.5-Coder、DeepSeek-Coder 等。硬件投入一次性,之后没有 Token 费。对于写模板代码、做代码补全这类简单任务,开源模型的效果已经够用了。
4. 优先用集成 AI 的 IDE,性价比更高
GitHub Copilot、Cursor 这类工具采用月费订阅制(个人版几十到一百多元/月),比纯 API 调用便宜得多。需要注意,它们背后仍然有 Token 消耗,也有使用限额(比如 Copilot 每月补全次数有上限),但对于日常的代码补全和小规模修改,整体性价比远高于直接调 API。
5. 不要让 AI Agent 无监督长时间运行
这条针对正在尝试 AI Agent 的团队。7×24 小时无人值守听起来很美好,但现实是:Agent 会反复尝试、反复失败、反复消耗 Token,而你可能直到月底才发现一笔巨额账单。至少在当前阶段,AI Agent 需要人在关键节点做判断。

▲ 选对工具、设好预算,才能让 AI 真正降本增效
📉 一个好消息
国内大模型的价格战,对使用者来说是实实在在的好消息。
豆包、DeepSeek、通义千问的 API 定价,远低于 Claude 和 GPT。以 DeepSeek 为例,其 API 定价约为 Claude Sonnet 的数分之一,日常编程任务的性价比优势明显。
当然,能力上还有差距——尤其是复杂推理和长上下文场景。但对于大多数日常编程任务,国产模型已经够用了。
长期来看,算力成本会继续下降,模型效率会继续提升。但有一个问题值得关注:当 AI 编程从"锦上添花"变成"基础设施",成本管理将从技术问题变成经营问题。 今天 Uber 和微软踩过的坑,明天可能就是每个开发团队的日常。
AI 写代码不会让你失业,但可能让你破产——如果你不知道怎么控制成本的话。工具是别人的,账单是自己的。
夜雨聆风