与 AI Agent 协作的五条经验
你以为在用工具,其实在管人
约 2800 字 · 阅读 8 分钟 · 基于日常 Agent 协作实践整理
周一早上九点,三个 deadline 压在桌上,两个 bug 还没定位,十一点的会又不能推。
你打开 Codex,甩给 Agent 一句「把这个功能做完」,然后去冲咖啡。回来时 diff 已经生成好了,格式漂亮,注释齐全,测试也加上了。你差点直接 merge——直到同事问了一句:「这个 API 响应结构,谁批准的?」
你才发现 Agent 顺手改了一个公开接口,前端、移动端、外部调用方,全可能跟着炸。
这不是模型不行。是你还在「用工具」,而它已经在「替你决策」了。

一
从「用 AI」到「管 AI」,只差一个认知切换
最近 PMI 发布了 AI 项目管理标准,方向是对的。但大多数官方文档回答的是宏观框架,没回答那个周一早上真正折磨人的问题:
有 deadline、有 bug、有会议的时候,我该怎么跟 Agent 协作?
我几乎每天都在用 Agent 写代码、审代码、查 bug、写文档。踩过的坑很具体:prompt 写得太烂、输出信得太快、错误方向放得太久。从这些失误里,我总结出五条转变——都不复杂,但每一条都改了一点协作方式。
核心认知只有一句:
你下达指令、检查输出、修正方向、决定能不能推进——这本质上就是管理。
二
布置任务之前,先划定边界
我对 Agent 的第一反应,和带新人一样:「任务在这,去做完。」
结果有一次,Agent 做了一个当时看起来很合理的架构决定,等我反应过来,已经很难撤销了。问题不在 Agent,在我——从没告诉它,哪些决定可以自己拍板,哪些必须等我点头。
现在我会在任务清单之前,先写一份决策边界。可以是一份 decision-boundaries.yml,也可以是一段写进项目规则的说明。关键是三类清单:
可以自主做的
格式化代码、补测试、改注释、单模块内安全重构——能用 git 回滚的改动。
必须批准的
改数据库 schema、动公开 API、碰认证授权、部署上线、花一分钱。
没有明确指令绝不碰的
删生产数据、改密钥、force push、绕过测试。
以前我是在「派活」;现在是在「划定决策空间」。Agent 仍然可以快,但它知道路在哪里结束。真正该告诉 AI 的,不只是该做什么,更是不该往哪里走。
三
学会「冷审」——不看过程,只看结果
审查同事的工作时,你通常知道讨论过程、知道某步为什么这么做。看到产出「看起来没问题」,大多数时候可以信。
Agent 不一样。它给你一份干净的 diff、一份成稿文档,背后的推理过程你根本没看见。输出可以很整洁,解释可以很自信,逻辑却可能是错的。
所以我改用冷审(cold review):不假设过程正确,只检查最终产出。五个问题:
真的解决了最初的问题吗? 有没有动不该动的东西? 会不会搞坏系统其他部分? 逻辑对不对,还是只是「看起来像对」? 有测试或证据证明能跑吗?
当 Agent 的工作时长超过你的注意力跨度,你不可能盯着每一步。新技能不是「会用 AI」,而是不因输出好看就盲信。
四
规划能力,而不只是规划人头
以前排项目,我问的是:「这事要几个开发者?」
现在我会问:「完成这件事,需要什么能力组合?」
因为活不只能人干。Agent 适合写代码、生成文档、找 bug、探索方案;产品方向、架构选择、安全决策、最终拍板,必须留给人。
排期时我会画四格:
AI 能快速做什么 | 什么必须人判断 |
什么需要人机配合 | 什么始终不能外包 |
目标不是用 Agent 替代人,而是让人和 Agent 各有清晰角色。这个时代,人最有价值的技能不只是执行,而是判断——知道委派什么、审查什么、保护什么、何时喊停。
五
在起火之前设警报,别等站会才知道
团队站会有个毛病:通常是出事之后才告诉你。
Agent 更快。它可以在错误方向上连改二十个文件,悄悄碰了 .env、动了支付模块、改了你没注意的数据库迁移——等你 review,损失已经发生了。
所以我加了一层触发线(tripwire)。思路很简单:某件事越过安全线,立刻停、立刻通知。
几条我常用的:
涉及文件的测试通过率低于 100% → 暂停 单个任务改动超过 20 个文件 → 审查范围 碰到 .env、auth/、payments/、迁移目录 → 必须批准公开 API 结构变了 → 必须批准 产生任何费用 → 必须批准 Agent 对需求不确定 → 停止,别猜
目标不是阻止 Agent 干活,是在它制造更大麻烦之前拦住它。最好的审查,有时不是任务结束时的 review,而是进行中的警报。
六
拥有系统,而不只是拥有产出
以前「负责」很简单:代码是我的,文档是我的,结果是我的。
Agent 时代,负责的层次变了。你不只拥有交付物,还拥有制造交付物的系统——人、Agent、prompt、审查流程、边界规则、安全检查、最终决策,全算在内。
当 Agent 写了那段代码,你不能说「是 AI 做的」。产出仍是你的责任。但你的工作从「亲手做每一块」,变成「设计一个能反复产出好成果的工作流」。
我会定期问自己五个问题:
Agent 拿到足够上下文了吗? 边界清楚吗? 有审查环节吗? 高风险区域被保护了吗? 最终产出真的解决了实际问题吗?
交付一个成果有用;能持续交付好成果的系统,才是规模化的起点。这是 AI 给我们的「晋升」:从亲手做每一项任务,到拥有让工作完成的系统。
七
这不是更大的活,是不同层次的活
五条说起来都不难。难的是从「偶尔用一下」变成「默认就这么协作」。
你可以做个简单自评:每条打 1 到 5 分。1 分是「基本没在做」,5 分是「已经是工作流的一部分」。得分最低的两项,就是这个季度最该改的行为——不必一次全改,先动一个小习惯。
对我来说,第一个大转变是先划边界再派任务;我还在练的,是不因输出干净就放松审查。
真正的学习曲线,不是学会每一个新 AI 工具,而是学会以安全、清晰、真正有用的方式与 AI 协作。
留给你的一个问题
这五条转变里,你已经在做哪些,还在回避哪一条?
如果只能先改一条,你会从哪条开始?
下一篇,我想把「冷审」的五问清单拆成可以直接贴进 PR 的 review checklist。如果你更想先看那份清单,留言告诉我。
想要今天文里提到的两份 YAML 配置?decision-boundaries.yml(决策边界)和 tripwires.yml(触发线警报),后台回复「边界」或「触发线」,我把对应完整模板发你。也可以留言你正在用的 Agent 工具(Cursor、Claude Code、Copilot 等),我按你的场景改一版最小可用配置。
说明:本文核心观点整理自日常 Agent 协作实践,并参考了相关工程管理经验。AI 工具与工作流变化很快,请结合自己的项目、团队场景自行调整。
每周一场网球,每天一杯咖啡,聊一个 AI 经营洞察。
夜雨聆风