需求不复杂:后台加个导出接口,前端加个按钮,对接他们旧系统的字段规范。PRD 丢给 WorkBuddy,前后端代码 20 分钟全出来了,本地跑通,我觉得稳了。
联调那天,三个坑接连爆:字段名和旧系统对不上——他们叫 goodsCode,我们写成了 productCode;权限校验漏了一环,普通角色也能调导出;日志里还躺着一串硬编码的测试 token。
我盯着 diff 看了 40 分钟,脑子是懵的。
不是 AI 不行。是我看 diff 的速度,跟不上 AI 吐代码的速度。
琢磨这三个月,有个判断越来越清楚。
从 3 月初到现在,我基本是天天靠 AI 写代码。Prompt 调来调去的时间少了,花在验收、拆解、换工具、把活交出去上的时间多了。说实话,后者才决定这个月能不能按时结账。
5 月那篇我写「用 AI 写代码,发现自己不会写代码了」——当时慌的是能力退化。这篇换个问题:AI 撤不掉了,肌肉该练在哪?
我给自己捋了四件事,每件下面有个小动作,这周就能试:
•验收:AI 写得快,你能不能 15 分钟看出对不对
•拆解:需求能不能拆成 AI 能一步步干完的活儿
•切换:Claude 封 IP、涨价的时候,能不能快速换道
•交付:Demo 顺和能上线,中间差什么

01 Prompt 越写越花,交付并没有更稳
3 月初那会儿,我也干过蠢事:在各种群里收藏「万能 Prompt」。
最多存了 40 多个。真正干活时,八成时间花在改 Prompt 上——措辞换一版、上下文补一段、模型换一个——任务本身反而推进得慢。
第二个月某天晚上改需求改到一半,突然想明白:Prompt 是油门,不是方向盘。
油门踩狠了车会飙,方向盘不在手里,照样开沟里。
Prompt 管的是这一次对话顺不顺。但要交一个功能、交一个客户、跑通一条流水线,靠的是另一套东西:能不能验、能不能拆、工具挂了能不能换、Demo 完能不能上线。
三个月下来,我自己的体感大概是这样:
•功能交付量比 2 月份多了一倍左右
•自己手写的代码,占总代码量大概 15% 到 20%
•Prompt 调优占工作时间,从早期三成左右,降到一成以内
•返工次数却没跟着降下来
问题变了。不是 AI 听不懂我说什么,是我听不明白 AI 干了什么、下一步该怎么控。
6 月初 Claude 封 IP、6 月 15 日还要改价——上篇横测里聊过,这儿不展开了。对我这种石家庄一人公司、白天跑客户晚上写代码的人来说,能交付比能炫技重要。所以我不再追「完美 Prompt 模板」,改成每周固定练一个跟 Prompt 无关的变量。
Prompt 决定 AI 一次回答的上限;验收、拆解、切换、交付,决定你一个月能稳定出几次活。
02 验收:AI 十分钟出码,你能不能十五分钟验完
程序员最值钱的手艺之一,我觉得变了:快速判断这段代码能不能进仓库。
不是逐行精读。AI 一次吐五百行,逐行读你会疯。得靠清单。
上面那个导出功能,我后来复盘了一下。按老办法 Code Review,这 PR 至少得看一小时。现在压到 15 分钟,靠的是我自己定的「验收五问」:
1.边界:空值、异常、权限、并发——AI 最爱漏哪类?
2.接口:入参出参、字段名、跟现有系统对齐了没?
3.依赖:新引了哪些包、配置?环境变量要不要改?
4.安全:硬编码密钥、SQL 拼接、日志有没有泄露敏感信息?
5.可回滚:出问题怎么撤?有没有破坏性迁移?

那个导出接口,五问里至少中了三项。联调前过一遍的话,四十分钟对着 diff 发呆,可以变成十五分钟勾选清单。
我这周的规矩叫「15 分钟验收练习」:挑一个 AI 生成的 PR,或者 AI 改过的模块,关掉「AI 写的应该没问题」这种心态,按五问过一遍,记漏了几项。我固定在周五下午练,连续练四周,看漏项能不能从平均三个以上降到一两个。
还有一个用法:让 AI 当验收助手,别当代写者。把 diff 贴进去:
请按以下 5 项检查,每项用「通过/风险/必须改」标注,并给出具体行号: 1. 边界与异常 2. 接口契约 3. 依赖与配置 4. 安全 5. 可回滚性 不要重写代码,只列问题清单。AI 帮你扫盲区,最后拍板还是你。
03 拆解:任务太大,万能 Prompt 也救不了
Prompt 写不好,很多时候不是措辞问题,是任务太大、上下文太糊。
4 月份我踩过坑:对一个老模块说「帮我把这个模块重构一下」。AI 改了一半,测试挂了,git diff 散在七八个文件里,不知道该回退还是硬着头皮继续修。
同一模块,5 月份换了个打法,拆成六步:
1.读现有接口,列出不能变的契约
2.确定要改的文件,不超过三个
3.单文件改完,跑测试
4.补文档
5.人工确认关键逻辑
6.合并
每步五到十五分钟,全程可控。返工从三次降到零。
会拆的人,普通 Prompt 也能跑通。不会拆的人,收藏四十七个万能 Prompt 也救不了——这话是我石家庄做外包的朋友 C 说的,我俩情况挺像。
开干前我花二十分钟做三件事:写清楚什么叫做完(验收标准三条以内);把任务切成 AI 能独立执行的步长,每步能暂停;标出哪些步必须我确认完才能继续。
拆解模板我直接贴这儿,复制改改就能用:
【完成定义】:1… 2… 3… 【步骤】: Step1 …(预计输出:…) Step2 … 【人工确认点】:Step X 完成后我先看 … 再继续 【禁止】:不要一次改超过 N 个文件 / 不要动 XX 目录
你可以挑个真实小需求试一把——修 bug、加字段、写脚本都行。先手写拆解模板,再分步喂给 AI。记两列对比:一步到位直接问返工几次,六步拆开返工几次。对比一次,就知道差在哪。
5 月那篇我说「有些以前会写的东西想不起来了」。这篇补一句:会拆任务的人,不需要自己写每一行。
04 切换:工具会封、会涨价,链路得真能换
6 月 Claude 封 IP、6 月 15 日独立计费池上线——上篇横测里测过 OpenCode、通义灵码、Trae 这几款国产工具。我现在的看法就一句:单点依赖不是技术问题,是交付风险。
主备切换练的不是「收藏备用工具」,是真的跑通过一次。
我现在的配置大概是这样:
切换包我提前备好,别临时翻:
•API Key、账号
•项目 rules、AGENTS.md、.cursorrules 导出一份
•常用的拆解模板、验收清单
•一条测试命令,验证环境 OK
5 月底 Claude 断流那回,靠备链路把客户的 hotfix 按时交了。第一次切换花了 35 分钟——找 key、配环境、重新喂上下文。第二次演练压到 12 分钟。
每月我练一次「十分钟切换演练」:关掉主工具,只用备链路完成一个小任务,计时。第一次大概率超时,记下来卡在哪,下次优化切换包。有大新闻(封 IP、涨价)之后 48 小时内,我会再练一次。
05 交付:Demo 顺和能上线,中间差三道关
AI 让 Demo 变得特别便宜。客户要的却是能上线、能验收、能维护的东西。
4 月份我踩过大坑:给客户演示 AI 做的管理后台,现场改需求,AI 秒改,客户当场拍板。签约之后呢?联调、部署、权限、数据迁移,拖了两周。客户没骂人,我自己脸上挂不住。
缺的不是 coding,是测试、部署、验收标准没进 workflow。
后来我给 AI 产出加了三道关:
•可测:产出必须带「怎么验证」,至少一条测试步骤
•可部署:环境差异、配置、迁移脚本——不能 README 里就一句话
•可验收:「完成定义」书面确认,别让 Demo 范围越滚越大
Demo 可以快。我给自己立了规矩:对外演示前,三道关没过,不准上。
拿一个最近「演示过但没交付完」的项,补三样东西,各五行以内:测试步骤、部署步骤、验收签字项。以后 AI 生成的功能,没补交付清单,不准对外 Demo。
白天跑客户、晚上出 Demo 很爽。真正决定能不能接单续费的,是闭环速度。
06 不断网,但把四件事排进周历
5 月那篇我建议「偶尔断网手写」——确认离开了 AI 还能独立解决问题。
三个月下来看法变了:AI 撤不掉,也没必要撤。但要把四件事排进周历,固定练。

我还是程序员吗?是。但工作分配变了:手写的少了,判断、拆解、兜底多了。Prompt 仍然有用,降级成步骤里的一个输入,不再是核心竞争力。
三个月下来,我给自己总结了四条:
1.验收:15 分钟清单,每周练一次
2.拆解:六步 workflow,先拆再喂 AI
3.切换:主备演练每月一次,切换包提前备好
4.交付:Demo 前三道关,没过不准对外
工具是拐杖,不是腿——5 月那篇的金句我还认。但与其纠结会不会手写快排,不如把验收、拆解、切换、交付这四项练熟。
偶尔服务器上想不起来 jstack 怎么用,后背还是会凉一下。这个凉意我接着。同时我也清楚,AI 写得再快,兜底的人还是得有真本事。
你觉得自己 AI 编程三个月来,最薄弱的环节是哪一个?
A. 验收——看不出 AI 代码的问题
B. 交付——Demo 快但上线慢
评论区选 A 或 B,我下篇把对应的清单扩成完整版。
分享金句:「Prompt 是油门,不是方向盘。验收、拆解、切换、交付,才是 AI 时代程序员该练的基本功。」
下期预告:看评论区——A 多写验收清单完整版,B 多写 Demo 到交付实操。
庄码,一个在石家庄用 AI 编程干活的程序员。关注我,记录哪些工具好使、哪些坑别踩。
夜雨聆风