AI编程翻车,常死在第一分钟
我以前判断一个 Coding Agent 好不好,喜欢看它能不能一口气改十几个文件。
现在我更在意另一件事:它开工前的第一分钟,到底读到了什么。
很多 AI 编程事故,不是模型突然变笨,也不是工具链不够先进。它从第一步就站错了地方:不知道这个仓库怎么启动,不知道哪条测试才算数,不知道哪个目录不能碰,不知道 PR 该交什么证据。
后面看起来像“Agent 乱改代码”,其实前面是人没给它铺轨道。
我踩过的坑:把规则当聊天内容
最早用 AI 写代码时,我也干过一件很偷懒的事:每次开新会话,复制一大段提示词进去。
“这是一个 TypeScript 项目。”
“请先看 README。”
“改完记得跑测试。”
“不要动某某目录。”
当时觉得挺精致,像是在训练一个懂事的助手。结果真实情况是:同样的规则,今天粘一遍,明天漏两句;这个人记得说测试命令,另一个人只说了需求;一次任务在根目录开,一次任务在子包里开,Agent 看到的上下文完全不同。
最麻烦的不是它不会做,而是它每次都像第一天入职。
你以为自己在“提示工程”,其实是在用嘴维护生产环境配置。
项目说明书,不是文档洁癖
最近几家工具的方向其实很一致。
OpenAI Codex 有 AGENTS.md,会在运行开始前读取全局和项目里的指令,并且按目录层级叠加;离当前工作目录越近的规则越靠后,也就更容易覆盖前面的通用规则。
GitHub Copilot 支持仓库级自定义指令,比如 .github/copilot-instructions.md,还支持路径级 instruction 文件,用来告诉 Copilot 这个仓库怎么构建、怎么测试、哪些约定不能破。
Claude Code 则有 CLAUDE.md、记忆文件和 Skills。官方文档里甚至把 /run、/verify 这类能力做成可复用技能,让 Agent 不是只“写完代码”,而是能按项目方式启动和验证。
这些东西表面看是配置文件,实际是 Agent 的入职手册。

如果一个团队已经开始让 AI 改仓库,却还没有一份给 Agent 看的项目说明书,我会默认它还停留在玩具阶段。
不是不能用,是每次都要赌。
真正该写进去的,不是口号
很多人第一次写 AGENTS.md 或 CLAUDE.md,会写成价值观宣言:
“代码要优雅。”
“保持简洁。”
“遵循最佳实践。”
这种话对人都不一定有用,对 Agent 更像噪音。
我现在更愿意写四类东西。
第一类是入口。
这个项目怎么装依赖,怎么启动,本地需要哪些环境变量,常见命令分别跑多久。比如 monorepo 里到底用 pnpm --filter,还是要先进某个 package;测试是全量跑,还是先跑受影响模块。
第二类是边界。
哪些目录可以改,哪些目录只读;哪些配置不能顺手重命名;哪些 migration、权限、账单、支付、审计相关改动必须停下来让人看。
第三类是验收。
改完以后最低要跑什么。不是笼统一句“run tests”,而是写清楚:改前端跑哪条,改 API 跑哪条,改 schema 要补哪类 snapshot,PR 描述里要贴什么证据。
第四类是已知坑。
比如某个测试第一次会超时,某个命令在本机和 CI 输出不一致,某个目录看起来废弃但其实线上还在引用。这些知识平时散在老员工脑子里,Agent 不会自动继承。
这四类写完,AI 编程的稳定性会比换一个更贵模型更明显。
我现在的做法:先给它一张开工卡
如果今天让我接一个新仓库,我不会第一步就让 Agent “帮我重构”。
我会先让它做一件更小、更无聊、但更值钱的事:生成一张开工卡。
这张卡只有几项:
项目做什么,最重要的入口在哪 安装、启动、测试、lint 的真实命令 哪些目录和文件属于高危区 改动后必须留下哪些验证证据 遇到失败时先查哪些日志、哪些已知问题
然后把这张卡沉淀到项目级说明文件里,而不是继续塞在聊天框。
这里有个反常识:写这张卡时,不要追求完整。
完整的文档通常没人维护。Agent 真正需要的是“开工前 60 秒必须知道的东西”。少一点,但每条都能影响行为。
我见过很多团队一上来就想做复杂多 Agent 编排、自动派单、自动评审。最后卡住的地方很朴素:Agent 连正确的测试命令都不知道,改完代码也不知道怎么证明自己没搞坏。
这不是智能问题,是交付流程问题。
分水岭不在会不会用 AI,而在能不能复用上下文
以后 AI 编程团队会有一个很明显的分水岭。
一类团队,每次开 Agent 都像开盲盒:靠人临时解释、靠模型现场猜、靠 reviewer 最后兜底。
另一类团队,会把仓库的工作方式逐步沉淀成机器可读的规则:项目说明、路径规则、验证脚本、技能命令、失败处理记录。
前者看起来也在用 AI,后者才是在把 AI 接进工程系统。
我的判断是:接下来很多人会高估“更强模型”的短期收益,低估“更清楚的项目说明书”的长期收益。
模型可以帮你写代码,但它不会凭空知道你们团队到底怎么交付。
如果你现在也在用 AI 写代码,可以回头看一眼自己的仓库:
一个新来的 Agent,开工前第一分钟能读到什么?
你们的规则是在文件里,还是还躺在某个人的嘴里?
夜雨聆风