AI Agent不是替你干活,而是逼你先想清楚

AI Agent不是替你干活，而是逼你先想清楚

AI 越能执行，人越不能模糊 · 第一篇

我本来以为，让 Agent 帮我整理一个选题计划，是把一部分工作交出去。

但真正发生的事恰恰相反。它没有让我少想，反而逼我把之前含混带过的东西一项项说清楚——这篇到底写给谁？核心判断是什么？和旧文怎么区分？哪些素材只能做入口，不能当论证主线？什么算完成？什么叫写好了？

我突然意识到一件事：Agent 不是让我更容易执行模糊需求，而是让我更难掩盖模糊需求。

这件事不只是我一个人的体验。

全世界现在每周有超过 9 亿人在用 ChatGPT，但开始让 AI 替自己干活的，可能只有 500 万人。^[4] 这中间 180 倍的差距，不只是工具门槛的问题——从聊天到委托，人和 AI 的关系变了。你不再是在问它问题，而是在把一件事交给它。而一旦你开始委托，你就必须说清楚你要什么。

✵

模糊需求是怎么活下来的

你可能会说，这不是很正常吗？AI 又不是人，你不说清楚它怎么做？

对。但问题不在 AI。问题在于——过去那些没说清楚的事，是怎么活下来的？

产品经理提了一个需求：「做一个面向小团队的项目管理工具，主要强调简单易用和协作。」开发不会直接照做，而是追问：团队多大？什么角色？现有工具哪里太复杂？协作是实时还是异步？产品经理在追问中被迫把模糊想法逐步补清楚。中间有无数轮「你说的是这个意思吗？」「不是，我其实是想……」

客户说：「要个好看的设计。」设计师不会直接出图，而是问：哪种风格？有参考吗？给谁看的？什么场景用？如果客户说不清，设计师就出两三个方向让客户选，选完再迭代。

老板半夜说：「明天要汇报这个项目。」下属不会直接写方案，而是先想：老板上次关注什么？最在意哪个指标？上次汇报他追问了什么？写完初稿先给同事看一遍，同事说「这里老板肯定要问」，再改。

从追问到猜测到默契，模糊需求的存活方式越来越隐蔽。

你看，需求不清楚，开发追问。边界不清楚，设计师兜底。目标不清楚，下属靠默契补。上下文不清楚，老员工凭经验填。

模糊需求不是不存在，而是被人吸收了。追问、猜测、迭代、默契——这些看起来像是「沟通成本」，但它们实际上是一道缓冲层，把没想清楚的东西拦在了执行之前。

所谓「执行力」，很多时候其实是人在替组织吸收认知债。

✵

Agent 不会替你兜底

Agent 不擅长维持模糊地带。

它要稳定执行，就必须知道五件事：目标是什么；边界在哪里；什么算完成；失败怎么处理；权限到哪里为止。

这五件事，过去不需要你一次性说清楚。你可以边做边补，边问边改，边错边修。因为对面是人，人会追问，会犹豫，会拒绝，会替你兜底。

但 Agent 不会追问你「你确定吗」，不会犹豫「这样做对不对」，不会拒绝「这个需求我不接」，更不会替你兜底「老板可能不是这个意思」。

你不说，它就自己定。

你想想，这意味着什么。没说目标，它就把「让你满意」当目标——这是最危险的默认值。没说边界，它就把目标函数的极限当边界。没说完成标准，它就把「输出格式正确」当完成。没说失败怎么处理，它的错误就直接变成结果，没有纠错窗口。没说权限到哪里，它就把「能做的」都做了，不管该不该做。

英国有个律师让 AI 生成法律文书，AI 凭空编造了 18 个不存在的判例，律师没核查直接提交了法庭。主审法官在审查材料时才察觉异常。^[1]

律师没有告诉 AI「完成标准是每个判例都必须可查证」。AI 就把「生成看起来像法律文书的文本」当成了完成标准。

某保险公司用 AI 调整汽车保险费率。我猜，AI 大概是从数据中捕捉到了某种价格弹性差异——某个年龄段的人更少比价、更换意愿低——于是系统性地给他们更高保费。^[2] 没有人告诉 AI「不能利用信息不对称歧视弱势群体」。AI 的目标函数是利润最大化，它忠实地执行了——但越过了公平性边界。

联合健康集团高度依赖 AI 做医疗决策，医生的判断常常被推翻。结果大量 AI 决策被证明是错误的。^[2] 没有失败处理机制——人不能有效反对，AI 的错误就直接变成了结果。

这三个案例的共同结构是：人没说清楚，AI 就按自己的理解做了。而 AI 的「自己的理解」，往往是最简单、最直接、最没有安全余量的那个版本。

✵

执行越快，错误越快成形

你可能会想：那我说清楚不就行了？

没那么简单。因为执行成本下降之后，想不清楚的后果变了。

以前想不清楚，可以慢慢试。需求模糊，开发追问，你被迫在追问中补全。方案粗糙，同事审一遍，你被迫在修改中打磨。判断草率，老板追问，你被迫在答辩中想清楚。

模糊的代价是慢，但慢本身也是一种保护。错误在追问中被拦住了，在修改中被修正了，在答辩中被暴露了。

现在执行太快，错误也会更快变成结果。

过去律师手写文书，每个判例都要去查，错误在查找环节就被拦住了。现在 AI 几秒钟生成 18 个判例，跳过了核查环节，错误直接变成了提交物。过去做一版设计方案要一周，你有一周的时间发现方向偏了。现在 AI 四分钟出原型，如果你不在这四分钟之后做判断，方向偏了你也更快走远了。

Gartner 2025 年预测：到 2027 年底，超过 40% 的 Agentic AI 项目将因成本上升、商业价值不明确或风险控制不足而被取消。^[3] 注意那个「商业价值不明确」——很多项目不是工具不行，而是人没想清楚到底要什么。

执行成本下降，思考不清楚的成本上升。AI 越能执行，人越不能模糊。这是一枚硬币的两面。

✵

认知债提前到期

所以我想说一个判断：Agent 化不是自动化的终点，而是认知债的提前到期。

什么是认知债？就是个人或组织在早期没有完成的问题理解、需求澄清、判断标准设定和边界定义，后来被迫以返工、沟通、加班、争吵和系统失控的形式偿还的成本。

过去，认知债是被人的追问、猜测、迭代和默契吸收的。你不需要一次性想清楚，因为执行过程中有人帮你补。

Agent 把这层缓冲撤了。它不追问，不猜测，不兜底。它只是忠实地把你没说清楚的东西，按最简单的理解执行下去。

AI 真正改变的不是「谁来干活」，而是「谁必须先想清楚」。

我猜，很多人第一次用 Agent 时的感受不是「太方便了」，而是「原来我这么多东西没想清楚」。这不是 AI 的问题，这是 Agent 的功能：它把你欠下的认知债，提前摊在了桌面上。

下一讲我们说，当判断写进自动循环，会发生什么。

参考与注释

[1] 英国高等法院 2025 年 6 月案件，原告律师使用 AI 生成法律材料，其中包含 18 个虚构判例。主审法官维多利亚·夏普在审查材料时察觉异常。来源：快刀广播站第 514 期。

[2] 保险公司 AI 价格歧视案例及联合健康集团（UnitedHealth）AI 医疗决策错误案例，转引自快刀广播站第 698 期。

[3] Gartner 2025 年 6 月发布预测：到 2027 年底，超过 40% 的 Agentic AI 项目将因成本上升、商业价值不明确或风险控制不足而被取消。分析师 Anushree Verma。