AI 写代码比人还贵?Uber 四个月烧完全年预算

💰 Uber 四个月烧完全年 AI 编程预算，微软也扛不住强制切换工具。AI 写代码本该省钱，怎么反而成了成本黑洞？

过去一年，你可能见过太多这样的标题："AI 取代程序员"、"90% 的代码将由 AI 生成"。

但没人告诉你另一面：用 AI 写代码，可能比雇人还贵——而且代码质量还未必靠谱。

最近，Uber 高管公开承认了一件事——公司在 4 月份就已经烧完了 2026 全年的 Claude Code 预算。为了补这个窟窿，Uber 不得不放缓全年招聘计划。

紧接着，连财大气粗的微软也撑不住了。微软 CEO 纳德拉下达指令：从 6 月起，内部开发工作从 Claude Code 强制切换回自家的 GitHub Copilot。控制预算是核心原因，但也有产品战略考量——既然自家有 Copilot，何必花冤枉钱用别人的？

AI 本该降本增效，结果成了最大的成本黑洞。这事值得好好聊聊。

💸 先算一笔账

AI 编程工具按 Token 计费。你每发一条指令、每让 AI 生成一行代码、每让它改一个 bug，都在烧 Token。

单次调用看起来很便宜——几毛钱甚至几分钱。但问题在于，当一个开发团队开始部署 AI Agent，让它 7×24 小时自动运行时，Token 消耗就像开着水龙头不关。

以 Claude Code 为例，Sonnet 模型的定价是 $3/$15 per million token，Opus 更是 $15/$75 per million token。一个开发者如果全天候使用，尤其是涉及长上下文对话时，一天下来 Token 费用很容易就上百美元。一个 10 人团队，一个月的 AI 调用费可能就不是小数目了。

如果是让 AI Agent 全天候自动跑——执行代码审查、跑测试、自动修复 bug——成本直接翻几倍。Uber 就是这么烧完预算的。

更要命的是，AI 写代码很快，但它改代码也很快。一个常见的场景是：AI 写了一版代码 → 人工审查发现问题 → 让 AI 重新写 → 又发现新问题 → 再改……每一轮都在烧 Token，而且越改越贵。

▲ AI 编程工具让开发更快，但 Token 账单也在飞速增长

🔴 不止是钱的问题

除了贵，AI 生成的代码质量也正在被业界重新审视。

多位技术专家最近公开指出，AI 在"批量制造垃圾代码"。这不是说 AI 写的代码都是错的，而是：

• AI 倾向于生成"看起来正确"的代码，但经常忽略边界情况和异常处理
• AI 生成的代码中隐藏着安全漏洞，你自己可能看不出来
• 当 AI 修复一个 bug 时，有时会引入新的 bug

这就形成了一个恶性循环：

💬 AI 写代码 → 人审查 → 发现问题 → 让 AI 改 → 更多 Token 消耗 → 更高成本 → 改完有一定概率引入新问题 → 再改……

最后算总账，你发现 AI 确实帮你省了写代码的时间，但省下来的时间全花在了审查和修复上——而且你还多付了一笔昂贵的 Token 账单。

✅ 那到底还用不用？

用。但要用得聪明，而不是用得任性。

1. 别让 AI 自由跑，设置预算上限

这是最重要的一条。不管是个人还是团队，一定要给 AI 工具设定每月的 Token 预算上限。跑超了就停，而不是月底才看到账单傻眼。

2. 明确任务边界，别让 AI 干整项目重构

AI 最擅长的是：写初稿、生成模板代码、单文件修改、解释代码逻辑。最不擅长的是：理解整个项目的架构，然后做跨文件的大规模重构。把大任务拆成小任务，每个任务明确输入输出，Token 消耗会可控得多。

3. 高频场景优先考虑本地模型

如果你是重度用户，每天调用量很大，纯 API 调用的成本会非常高。这时候可以考虑本地部署开源模型——比如 Qwen3.5-Coder、DeepSeek-Coder 等。硬件投入一次性，之后没有 Token 费。对于写模板代码、做代码补全这类简单任务，开源模型的效果已经够用了。

4. 优先用集成 AI 的 IDE，性价比更高

GitHub Copilot、Cursor 这类工具采用月费订阅制（个人版几十到一百多元/月），比纯 API 调用便宜得多。需要注意，它们背后仍然有 Token 消耗，也有使用限额（比如 Copilot 每月补全次数有上限），但对于日常的代码补全和小规模修改，整体性价比远高于直接调 API。

5. 不要让 AI Agent 无监督长时间运行

这条针对正在尝试 AI Agent 的团队。7×24 小时无人值守听起来很美好，但现实是：Agent 会反复尝试、反复失败、反复消耗 Token，而你可能直到月底才发现一笔巨额账单。至少在当前阶段，AI Agent 需要人在关键节点做判断。

▲ 选对工具、设好预算，才能让 AI 真正降本增效

📉 一个好消息

国内大模型的价格战，对使用者来说是实实在在的好消息。

豆包、DeepSeek、通义千问的 API 定价，远低于 Claude 和 GPT。以 DeepSeek 为例，其 API 定价约为 Claude Sonnet 的数分之一，日常编程任务的性价比优势明显。

当然，能力上还有差距——尤其是复杂推理和长上下文场景。但对于大多数日常编程任务，国产模型已经够用了。

长期来看，算力成本会继续下降，模型效率会继续提升。但有一个问题值得关注：当 AI 编程从"锦上添花"变成"基础设施"，成本管理将从技术问题变成经营问题。 今天 Uber 和微软踩过的坑，明天可能就是每个开发团队的日常。

AI 写代码不会让你失业，但可能让你破产——如果你不知道怎么控制成本的话。工具是别人的，账单是自己的。