AI Agent不是替你干活,而是逼你先想清楚
AI 越能执行,人越不能模糊 · 第一篇
我本来以为,让 Agent 帮我整理一个选题计划,是把一部分工作交出去。
但真正发生的事恰恰相反。它没有让我少想,反而逼我把之前含混带过的东西一项项说清楚——这篇到底写给谁?核心判断是什么?和旧文怎么区分?哪些素材只能做入口,不能当论证主线?什么算完成?什么叫写好了?
我突然意识到一件事:Agent 不是让我更容易执行模糊需求,而是让我更难掩盖模糊需求。
这件事不只是我一个人的体验。
全世界现在每周有超过 9 亿人在用 ChatGPT,但开始让 AI 替自己干活的,可能只有 500 万人。[4] 这中间 180 倍的差距,不只是工具门槛的问题——从聊天到委托,人和 AI 的关系变了。你不再是在问它问题,而是在把一件事交给它。而一旦你开始委托,你就必须说清楚你要什么。
✵
模糊需求是怎么活下来的
你可能会说,这不是很正常吗?AI 又不是人,你不说清楚它怎么做?
对。但问题不在 AI。问题在于——过去那些没说清楚的事,是怎么活下来的?
产品经理提了一个需求:「做一个面向小团队的项目管理工具,主要强调简单易用和协作。」开发不会直接照做,而是追问:团队多大?什么角色?现有工具哪里太复杂?协作是实时还是异步?产品经理在追问中被迫把模糊想法逐步补清楚。中间有无数轮「你说的是这个意思吗?」「不是,我其实是想……」
客户说:「要个好看的设计。」设计师不会直接出图,而是问:哪种风格?有参考吗?给谁看的?什么场景用?如果客户说不清,设计师就出两三个方向让客户选,选完再迭代。
老板半夜说:「明天要汇报这个项目。」下属不会直接写方案,而是先想:老板上次关注什么?最在意哪个指标?上次汇报他追问了什么?写完初稿先给同事看一遍,同事说「这里老板肯定要问」,再改。
从追问到猜测到默契,模糊需求的存活方式越来越隐蔽。
你看,需求不清楚,开发追问。边界不清楚,设计师兜底。目标不清楚,下属靠默契补。上下文不清楚,老员工凭经验填。
模糊需求不是不存在,而是被人吸收了。追问、猜测、迭代、默契——这些看起来像是「沟通成本」,但它们实际上是一道缓冲层,把没想清楚的东西拦在了执行之前。
所谓「执行力」,很多时候其实是人在替组织吸收认知债。
✵
Agent 不会替你兜底
Agent 不擅长维持模糊地带。
它要稳定执行,就必须知道五件事:目标是什么;边界在哪里;什么算完成;失败怎么处理;权限到哪里为止。
这五件事,过去不需要你一次性说清楚。你可以边做边补,边问边改,边错边修。因为对面是人,人会追问,会犹豫,会拒绝,会替你兜底。
但 Agent 不会追问你「你确定吗」,不会犹豫「这样做对不对」,不会拒绝「这个需求我不接」,更不会替你兜底「老板可能不是这个意思」。
你不说,它就自己定。
你想想,这意味着什么。没说目标,它就把「让你满意」当目标——这是最危险的默认值。没说边界,它就把目标函数的极限当边界。没说完成标准,它就把「输出格式正确」当完成。没说失败怎么处理,它的错误就直接变成结果,没有纠错窗口。没说权限到哪里,它就把「能做的」都做了,不管该不该做。
英国有个律师让 AI 生成法律文书,AI 凭空编造了 18 个不存在的判例,律师没核查直接提交了法庭。主审法官在审查材料时才察觉异常。[1]
律师没有告诉 AI「完成标准是每个判例都必须可查证」。AI 就把「生成看起来像法律文书的文本」当成了完成标准。
某保险公司用 AI 调整汽车保险费率。我猜,AI 大概是从数据中捕捉到了某种价格弹性差异——某个年龄段的人更少比价、更换意愿低——于是系统性地给他们更高保费。[2] 没有人告诉 AI「不能利用信息不对称歧视弱势群体」。AI 的目标函数是利润最大化,它忠实地执行了——但越过了公平性边界。
联合健康集团高度依赖 AI 做医疗决策,医生的判断常常被推翻。结果大量 AI 决策被证明是错误的。[2] 没有失败处理机制——人不能有效反对,AI 的错误就直接变成了结果。
这三个案例的共同结构是:人没说清楚,AI 就按自己的理解做了。而 AI 的「自己的理解」,往往是最简单、最直接、最没有安全余量的那个版本。
✵
执行越快,错误越快成形
你可能会想:那我说清楚不就行了?
没那么简单。因为执行成本下降之后,想不清楚的后果变了。
以前想不清楚,可以慢慢试。需求模糊,开发追问,你被迫在追问中补全。方案粗糙,同事审一遍,你被迫在修改中打磨。判断草率,老板追问,你被迫在答辩中想清楚。
模糊的代价是慢,但慢本身也是一种保护。错误在追问中被拦住了,在修改中被修正了,在答辩中被暴露了。
现在执行太快,错误也会更快变成结果。
过去律师手写文书,每个判例都要去查,错误在查找环节就被拦住了。现在 AI 几秒钟生成 18 个判例,跳过了核查环节,错误直接变成了提交物。过去做一版设计方案要一周,你有一周的时间发现方向偏了。现在 AI 四分钟出原型,如果你不在这四分钟之后做判断,方向偏了你也更快走远了。
Gartner 2025 年预测:到 2027 年底,超过 40% 的 Agentic AI 项目将因成本上升、商业价值不明确或风险控制不足而被取消。[3] 注意那个「商业价值不明确」——很多项目不是工具不行,而是人没想清楚到底要什么。
执行成本下降,思考不清楚的成本上升。AI 越能执行,人越不能模糊。这是一枚硬币的两面。
✵
认知债提前到期
所以我想说一个判断:Agent 化不是自动化的终点,而是认知债的提前到期。
什么是认知债?就是个人或组织在早期没有完成的问题理解、需求澄清、判断标准设定和边界定义,后来被迫以返工、沟通、加班、争吵和系统失控的形式偿还的成本。
过去,认知债是被人的追问、猜测、迭代和默契吸收的。你不需要一次性想清楚,因为执行过程中有人帮你补。
Agent 把这层缓冲撤了。它不追问,不猜测,不兜底。它只是忠实地把你没说清楚的东西,按最简单的理解执行下去。
AI 真正改变的不是「谁来干活」,而是「谁必须先想清楚」。
我猜,很多人第一次用 Agent 时的感受不是「太方便了」,而是「原来我这么多东西没想清楚」。这不是 AI 的问题,这是 Agent 的功能:它把你欠下的认知债,提前摊在了桌面上。
下一讲我们说,当判断写进自动循环,会发生什么。
参考与注释
[1] 英国高等法院 2025 年 6 月案件,原告律师使用 AI 生成法律材料,其中包含 18 个虚构判例。主审法官维多利亚·夏普在审查材料时察觉异常。来源:快刀广播站第 514 期。
[2] 保险公司 AI 价格歧视案例及联合健康集团(UnitedHealth)AI 医疗决策错误案例,转引自快刀广播站第 698 期。
[3] Gartner 2025 年 6 月发布预测:到 2027 年底,超过 40% 的 Agentic AI 项目将因成本上升、商业价值不明确或风险控制不足而被取消。分析师 Anushree Verma。

夜雨聆风