最近看开发者讨论 AI 编程工具,我发现一个很有意思的变化。
大家嘴上还在问:Claude Code 、 Codex 、 Cursor ,到底哪个更强?
但实际用起来,很多人已经不是这么选了。
有的工具适合快速探索,有的适合长时间跑任务,有的适合在 IDE 里补细节,有的适合最后帮你审一遍。问题从“选哪一个”,慢慢变成了“这一步该派谁”。
这才是 AI 编程真正进入日常的标志。
工具站队是新手问题
每一波开发工具变化,都会先经历一段站队期。
当年编辑器是这样,前端框架是这样,现在 AI 编程工具也是这样。一个人说 Claude Code 更懂大型重构,另一个人说 Codex 更适合异步任务,还有人说 Cursor 才是日常写代码最顺手的入口。
这些讨论不是没价值。
但如果问题永远停在“谁最强”,很容易把自己带偏。
因为真实工作不是一类任务。你一天里做的事情,可能包括读陌生代码、拆需求、生成方案、改文件、跑测试、查报错、 review diff 、写 PR 说明、等一个长任务跑完。它们都叫编程,但对 AI 工具的要求完全不同。
读代码需要耐心和上下文组织。
改代码需要执行力和文件操作稳定性。
审代码需要怀疑精神。
长任务需要状态管理。
发布前检查需要保守和可追溯。
你让同一个 AI 工具把这些全部包了,当然方便。但方便不等于成熟。
我注意到一个信号:越是重度使用 AI 编程的人,越不会把工具当信仰。他们更像在排一个小团队。
不是谁替代谁。
是谁坐哪个工位。
五个工位,比一个最强工具更重要
我倾向把个人 AI 编程工作流拆成五个工位。
第一个工位是探索。
这个角色负责读项目、找路径、解释陌生模块、提出几种方案。它不一定马上改代码,甚至最好先别改。它的价值是帮你把问题摊开,让你知道自己面对的不是一个黑盒。
第二个工位是执行。
这个角色负责按明确方案改文件、补测试、跑命令。它需要稳定,不需要太多文学性。你给它的任务越具体,它越有价值。
第三个工位是审查。
这个角色不能太听话。它要挑毛病,要问“这个改动有没有破坏旧逻辑”“有没有遗漏边界条件”“有没有改了用户没要求的东西”。很多人用 AI 写代码,却忘了用 AI 审 AI ,这是很大的浪费。
第四个工位是长跑。
它适合处理那些你不想一直盯着的事:升级依赖、修一批类型错误、跑一组实验、整理大型日志。它不一定每一步都聪明,但它能持续推进。
第五个工位是发布前检查。
这个角色最不性感,但最值钱。它负责确认有没有漏测、有没有凭证泄露、有没有文档和代码不一致、有没有把临时文件带进提交。它不负责创造,它负责刹车。
这五个工位放在一起,你会发现问题变了。
你不再问“Claude Code 、 Codex 、 Cursor 谁最强”。你会问:这个任务现在处在哪个阶段?我需要探索、执行、审查,还是长跑?
工具只是候选人。
任务才是岗位说明书。
为什么一个全能助手不够
有人会说,这是不是太复杂了?
我理解这个反驳。普通开发者当然希望一个工具解决所有问题。打开它,描述需求,等它改完,自己点接受。越简单越好。
但复杂项目里,一个全能助手最容易带来三个问题。
第一,它会把探索和执行混在一起。
它一边想方案一边改文件,最后你拿到一个很大的 diff ,却不知道里面哪些是必要改动,哪些是它半路想出来的延伸。
第二,它会把自信和正确混在一起。
AI 很擅长给出完整答案,也很擅长把错误包装成顺畅叙述。如果没有另一个角色专门审查,你很容易被“看起来合理”的改动说服。
第三,它会把短任务和长任务混在一起。
短任务追求快,长任务追求稳。你用同一个交互节奏处理两者,要么短任务变啰嗦,要么长任务失控。
我判断 AI 编程工具链成熟的标志,不是你终于找到了一个永远最强的工具。
而是你开始有意识地拆角色。
像一个小团队一样使用 AI ,而不是像抽卡一样押宝某个模型。
一个最小可用分工表
如果你现在不想搞复杂,我建议从最小三件套开始。
一个主写。
它负责具体改代码。任务给得越窄越好:改这个文件、补这个测试、不要碰这个目录、完成后告诉我改了什么。
一个主审。
它不接触原任务,只看 diff 。你让它站在反方问:有没有隐藏风险?有没有过度实现?有没有命名不一致?有没有测试没覆盖?
一个主跑长任务。
它负责那些可以异步推进的事,比如批量修 lint 、整理迁移方案、跑完测试后归纳失败原因。它的输出不是“我都修好了”,而是“这是过程、结果、剩余问题”。
这三件套已经能解决很多问题。
主写保证产出。主审保证判断。长跑保证你不用一直守在旁边。
如果你愿意再进一步,可以加两个角色:一个专门探索陌生代码,一个专门做发布前检查。到这里,你的 AI 编程工作流就不再是“一个聊天框帮我写代码”,而是一个小型工程系统。
注意,这里不需要固定绑定具体产品。
今天你可以用 Claude Code 做主写,用 Codex 跑长任务,用 Cursor 处理 IDE 内细节。明天工具能力变了,你可以换。真正稳定的是工位,不是工具名。
别把工具选择变成焦虑来源
很多开发者的 AI 焦虑,表面上是怕工具选错,底层其实是工作流没成型。
只要没有分工,每次新工具出现,你都会被迫重新站队。别人说 Codex 更强,你怀疑自己是不是该迁移。别人说 Claude Code 降智,你又怀疑自己是不是落后。别人说 Cursor 接入了新能力,你又想重配一遍。
但一旦你有了分工表,工具更新就没那么可怕。
你只需要问:它能不能更好地胜任某个工位?
如果能,就替换。
如果不能,就观察。
这比“全量迁移”健康得多。
我建议你今天就做一个很小的动作:把自己最近一次 AI 编程任务拆开复盘。
哪一步是在探索?哪一步是在执行?哪一步其实应该让另一个 AI 来审?哪一步适合丢给长任务?哪一步必须由你自己拍板?
你会发现, AI 编程真正的分水岭,不是会不会用某个工具。
是你有没有开始像管理一个小团队一样,管理这些 AI 。
别再问哪个 AI 编程工具最强。
先问这一句:
这一步,该派谁?
夜雨聆风