Uber 给 AI 工具设限后,技术团队该醒醒了

写在前面Uber 给 Claude Code、Cursor 这类工具设了月度限额。真正该警惕的不是工具太贵，而是团队只统计 token，却说不清它到底交付了什么。

今天看到 Uber 给 AI 编程工具设限，我脑子里第一句话不是“连 Uber 都嫌贵了”。

我想到的是公司里很常见的一个画面：某个团队突然开始猛推 AI 编程，群里每天都有人晒 Claude Code、Cursor、Codex 帮自己改了多少文件，排行榜里谁的 token 用得多，谁看起来就更像先进生产力。

一开始挺爽。

以前半天才能整理完的接口迁移，现在 Agent 跑一会儿就给出 diff。以前写测试要硬着头皮补边界，现在 prompt 一扔，它能先铺一版。以前改一个老模块，要先读半小时上下文，现在它能帮你把调用链拎出来。

问题是，爽归爽，账单也是真的。

TechCrunch 和 Los Angeles Times 都报道了这件事：Uber 给 Claude Code、Cursor 这类 agentic coding 工具设了限制，每个员工、每个工具每月 1500 美元 token 预算；员工有看板能看自己的用量，超额要申请。更早之前，Uber CTO 说公司 4 个月就用完了全年 AI 预算。

这事最有意思的地方不是 1500 美元多不多。

而是一个大公司开始承认：AI 编程工具进入日常以后，不能只鼓励大家“尽量多用”，还得问一句，它到底交付了什么。

token 用量不是产出

工程团队很容易迷信一个东西：可量化指标。

以前是提交次数、代码行数、故事点、PR 数量。现在轮到 token 了。

谁用得多，谁看起来就更积极。哪个组消耗高，哪个组好像就在拥抱 AI。甚至还有一种奇怪的气氛：你不用 AI，就是落后；你用得少，就是效率还没打开。

但 token 用量和真实产出之间，隔着很厚一层。

一个 Agent 可能花很多 token 帮你探索方案，最后没有一行代码能合并。它可能连续重试，把测试改绿了，却顺手把断言改松。它也可能帮你写出一大段看起来完整的实现，review 时才发现业务边界没理解对。

这些都算使用量。

但不一定算价值。

我不是说 AI 编程没用。恰恰相反，我现在很多工作都会用它，尤其是读陌生代码、整理变更影响、生成测试骨架、写迁移脚本第一版。

可越是好用，越不能把使用量当成绩。

因为团队一旦把“多用 AI”变成目标，大家就会自然优化这个目标。以前 KPI 看代码行数，有人就会写更多行。现在看 token，有人就会让 Agent 干更多事，哪怕这些事最后只是把 review 成本挪给了同事。

最贵的不是工具，是没有边界的任务

AI 编程工具的费用，经常不是按“一个需求”来的。

它是按模型调用、上下文长度、多轮对话、工具执行、重试次数来的。一个任务边界不清楚，Agent 就会不断绕圈。

比如你给它一句：“帮我优化一下这个模块。”

这句话在人类同事那里都很危险，给 Agent 更危险。它不知道优化的是性能、可读性、架构边界，还是只是把 lint 清一下。它可能先读一堆文件，再提出方案，再改一版，再跑测试，再发现测试环境缺依赖，再继续修。

这一圈下来，钱花了，时间也花了，最后你还得问：这个 PR 到底解决了哪个问题？

所以我现在更愿意把 AI 任务切小。

不是“优化模块”，而是“读这三个文件，列出缓存穿透风险，不要改代码”。

不是“帮我重构支付流程”，而是“基于当前测试，补 5 个失败样本，先只生成测试用例”。

不是“把这个需求做完”，而是“根据这个 issue，找出最小改动路径，列出受影响接口和需要跑的测试”。

任务越清楚，AI 越像工具。

任务越模糊，AI 越像一个很勤快但可能乱花钱的实习生。

小团队更不能学大厂烧法

Uber 这种公司烧穿预算，还能立刻补上看板、限额、审批流程。

小团队不行。

你可能就是十来个人，几个开发共用一堆 AI 账号。大家一开始觉得每月几百美元没什么，和人力比起来太便宜了。可真放开以后，Agent 任务、代码索引、长上下文、图片、日志分析、自动修复全接上，账单会涨得很快。

更麻烦的是，小团队通常没有专门的人算这笔账。

产品只看到功能快了。开发只感觉写代码轻松了。老板只听到“AI 能提效”。月底账单来了，大家才开始补一句：这东西到底省了谁的时间？

我建议小团队别一上来搞大而全。

先挑三类任务。

第一类，重复且低风险。比如生成测试骨架、整理接口文档、补充类型定义、做代码说明。错了也容易发现，回滚成本低。

第二类，有明确验收。比如某个 lint 规则迁移、某批老 API 替换、某个页面的埋点字段核对。做完能跑检查，不靠感觉判断。

第三类，能减少等待。比如值班时先整理日志、把错误样本分组、把最近变更和异常时间线对齐。它不直接改生产，但能让人更快进入状态。

不要先让它碰“开放式大任务”。

开放式大任务最容易烧 token，也最容易产出一堆需要人收拾的半成品。

AI 工具预算应该接进研发流程

我觉得 Uber 这次的信号不是“少用 AI”。

更像是提醒所有团队：AI 工具预算应该像云资源、CI 资源、日志存储一样，进入工程治理。

最少要有四个东西。

第一，用量看板。谁用、哪个工具用、什么任务用、峰值在哪里，要能看见。没有看板，就只能靠月底账单复盘。

第二，任务标签。AI 花在 bug 修复、测试生成、需求开发、文档整理、线上排障上的比例应该分开看。否则所有 token 混在一起，根本不知道钱花在哪。

第三，产出对照。不是精确到每一分钱都算 ROI，但至少要知道这些 AI 任务有没有减少返工、缩短 lead time、提高测试覆盖、降低值班排查时间。

第四，超额审批。不是为了卡大家，而是为了让高成本任务先停下来想一想：是不是上下文太大？是不是模型选贵了？是不是该拆任务？是不是该换成本地模型或低成本模型先筛一层？

这些东西听起来不酷。

但工程里真正救命的，往往就是这些不酷的表和开关。

别把 AI 编程变成新的面子工程

现在很多团队对 AI 的态度有点矛盾。

一边说要提效，一边又不好意思承认自己还没量清楚效果。

一边让大家多用，一边又没有定义哪些任务适合用，哪些任务必须人工 review，哪些任务不能让 Agent 自己跑。

最后就容易变成面子工程。

周会上说本周 AI 使用量增长了多少，PR 描述里写“由 AI 辅助完成”，内部分享里展示 prompt 技巧。但线上 bug、需求延期、review 堆积、测试缺口，并没有明显改善。

如果是这样，那就不是 AI 编程的问题。

是团队管理问题。

我更愿意看到的汇报是这样：

这个月 AI 帮我们把 30 个老接口补了测试，回归时间从 2 天降到半天。

这个月 AI 帮值班同学整理了 18 次日志时间线，平均定位时间少了 20 分钟。

这个月 AI 生成的代码有 12% 在 review 中被整体退回，主要原因是业务边界理解错，下个月我们收窄任务模板。

这才是工程团队该看的东西。

不是“我们用了多少 AI”，而是“AI 帮我们把哪段流程变稳了”。

最后

Uber 给 AI 编程工具设限，不代表 AI 编程不行。

我反而觉得这说明它真的进入日常了。

一个工具只有被大量使用，才会开始暴露预算、权限、审批、质量和责任问题。没人用的时候，所有讨论都停在 demo。

但进入日常以后，大家就不能继续用 demo 时代的眼光看它。

AI 编程不是免费的聪明同事。它是一个会消耗预算、会放大流程问题、会把模糊任务变成昂贵试错的工程工具。

我的判断很简单：

该用，甚至应该认真用。

但别再用“用得多”证明先进。

从今天开始，把 AI 工具当成生产资源管理：设预算、分任务、留日志、看产出、做复盘。能带来交付质量和真实速度的地方，多投。只能制造热闹和返工的地方，赶紧收。

技术团队最怕的不是 AI 工具太贵。

最怕的是钱花出去了，大家只记得 token 很多，却没人说得清用户到底多拿到了什么。

资料来源

TechCrunch：Uber caps employee AI spending after blowing through budget in 4 months，发布时间 2026-06-02：https://techcrunch.com/2026/06/02/uber-caps-employee-ai-spending-after-blowing-through-budget-in-four-months/

Los Angeles Times / Bloomberg：Uber caps staff use of AI coding tools after blowing its budget，发布时间 2026-06-02：https://www.latimes.com/business/story/2026-06-02/uber-caps-staff-use-of-ai-coding-tools-after-blowing-its-budget

Microsoft 官方博客：Microsoft Build 2026: Be yourself at work，发布时间 2026-06-02：https://blogs.microsoft.com/blog/2026/06/02/microsoft-build-2026-be-yourself-at-work/

Microsoft 365 Blog：Introducing Microsoft Scout: Your always-on personal agent，发布时间 2026-06-02：https://www.microsoft.com/en-us/microsoft-365/blog/2026/06/02/introducing-microsoft-scout-your-always-on-personal-agent/

GitHub：responsibleai/ASSERT，ASSERT v0.1.0 初始版本，发布时间 2026-06-02：https://github.com/responsibleai/ASSERT

The White House：Promoting Advanced Artificial Intelligence Innovation and Security，发布时间 2026-06-02：https://www.whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security/

AP News：Trump signs an executive order to vet top AI models for security risks，发布时间 2026-06-02：https://apnews.com/article/trump-ai-executive-order-e41af74f7b0865482f07d10fe7a50fe3

关于「技术放肆聊」

我是小肆，一个大厂程序员，下班后聊 AI、前端、后端和互联网热点。不写通稿，不装导师，尽量把技术圈的热闹翻译成工程现场能听懂的话。

觉得这种视角还对胃口，可以关注一下。下次继续聊点真实的技术和互联网。