AI Coding研发体系(二):AI如何进入研发流程

AI Coding 研发体系｜第二篇

这一篇拆流程层：为什么把 AI 塞进旧研发流程，常常会带来更多返工。后面会继续写组织能力、监督式工程、评价指标和治理体系，适合连起来看。

本篇聚焦第三层：流程层。它连接 Agent 执行层和组织能力层。

很多团队第一次用 AI Coding，流程其实没有变。

需求还是产品写一段话，开发还是自己理解，AI 只是在编码时被叫出来：“帮我实现一下”“帮我修一下”“帮我补个测试”。

短期看，这样确实能省几步。但进入真实项目后，很快会出现另一种返工：AI 写得很快，人改得也很快；AI 生成很多 diff，团队却花更多时间解释背景、补充约束、回滚错误方向。

问题通常不在 AI 不会写代码，而在旧流程没有给 AI 准备可执行的输入和可验证的出口。

所以 AI Coding 的流程层，不是把“开发”那一步换成 AI，而是要重新整理需求表达、上下文组织、验证方式和反馈循环。

从总架构图看，流程层是一个承上启下的位置：下面的执行层负责让 Agent 做事，上面的组织层负责让人管理这些 Agent。中间如果没有流程设计，AI 的产出就会变成一堆散落的 diff、日志和对话记录。

这篇不抽象讲概念，就用一个常见需求贯穿：给订单列表增加 CSV 导出。看起来只是一个小功能，但它足够说明 AI Coding 为什么不能只靠一句“帮我做一下”。

传统流程更像：一句需求 -> 工程师脑补 -> 写代码 -> 测试发现问题 -> 返工。

AI 流程更应该像：意图说明 -> 上下文包 -> 生成修改 -> 自动验证 -> 人工判断 -> 反馈沉淀。

旧流程靠人脑补

传统研发流程有一个隐性前提：人能补全很多没写出来的东西。

产品说“订单列表加个导出”，老工程师可能会自动补出一堆信息：导出的是当前筛选结果，不是全量订单；字段顺序要和财务模板一致；超过 5000 行不能直接导出；手机号和地址可能要脱敏；已有 Excel 导出逻辑不能被破坏。

这些信息在团队里流动，但不一定在需求里、文档里、测试里。人可以靠经验补，AI 不行。

如果只把“做一个订单导出”丢给 AI，它很可能先实现一个能下载 CSV 的按钮。代码看起来没问题，但业务上可能已经错了：导出范围不对，字段不对，权限不对，性能边界也不对。

AI 不怕任务复杂，怕的是任务边界一直在对话里漂。

需求要变成意图

这就是 Intent Engineering 的位置。

它不是 Prompt 技巧，也不是把一句话包装得更像命令。它真正要解决的是：任务目标、边界、验收标准和禁止事项能不能在 AI 开始行动前说清楚。

以前写需求，很多时候是写给人看的。人看到不完整的地方，会开会、追问、翻代码、找同事确认。AI 也可以追问，但如果每次都靠对话临时补，它就会把研发流程拖回“边做边猜”。

旧需求写法	AI 友好写法
做一个导出功能	给订单列表增加 CSV 导出，只导出当前筛选结果，字段顺序按现有 Excel 模板，超过 5000 行提示用户缩小范围
修复登录异常	定位手机号验证码登录失败的问题，不修改密码登录逻辑，补充失败场景测试
优化页面性能	先定位首屏慢的主要原因，只允许改数据请求和组件加载，不重构页面结构

拿订单导出来说，好的意图不是“做导出”，而是把任务压成一组明确约束：只导出当前筛选结果；复用现有权限判断；字段顺序按财务模板；超过 5000 行给提示；不改订单查询接口；补一组导出字段测试。这样 AI 才知道哪些是目标，哪些是红线。

需求表达越含糊，AI 生成越勤快，返工就越稳定。

上下文要先整理

有了意图，还不够。

AI Coding 进入真实代码库以后，最耗的往往不是写代码，而是理解环境：订单列表入口在哪里，已有导出组件在哪，权限判断怎么写，测试怎么跑，哪些模块不能碰，历史上为什么这么设计。

这就是 Context Engineering。

它不是把所有文档都塞给 AI。上下文越多，未必越好。长日志、过期文档、无关代码和泛泛规范一起丢进去，只会让 AI 花更多成本判断什么重要。

更好的做法，是在任务开始前整理一个小上下文包。对订单导出这类需求，上下文包至少应该包含：

订单列表页面和数据请求入口；
已有 Excel 或 CSV 导出的相似实现；
字段映射、脱敏规则和权限判断；
相关测试文件和本地验证命令；
禁止修改的订单查询接口和公共组件。

上下文不是资料堆得越多越好，而是要让 AI 少走弯路。

验证要提前设计

传统流程里，测试常常在开发之后才出现。代码写完了，再跑测试；PR 提了，再做 Review；出了问题，再补修复。

AI 流程不能这样。

原因很简单：AI 让生成和试错成本变低，未经验证的改动也更容易堆起来。如果验证仍然滞后，团队会得到大量“看起来合理”的代码，然后把时间花在筛选、解释和回滚上。

Verification Engineering 要做的，是在任务开始前就说明验证方式。不是等 AI 写完才问“能不能跑一下测试”，而是一开始就告诉它：导出文件字段顺序必须正确，筛选条件必须生效，超过 5000 行必须提示，未授权用户不能导出，旧的订单查询测试不能挂。

验证对象	任务开始前要说明
功能正确性	哪些用例必须通过
代码质量	哪些 lint、类型检查、Review 规则必须跑
安全边界	哪些数据、接口、权限不能碰
回归风险	哪些旧功能不能被破坏
人工验收	谁确认，确认什么

没有验证入口，AI 很容易把“能生成 CSV”误认为“导出功能完成”。这在小工具、小脚本里问题不大，在企业代码库里会迅速变成质量风险。

AI 可以加速写代码，但不能替一个没有验证体系的项目承担质量责任。

反馈要能沉淀

AI Coding 还有一个容易被忽略的地方：反馈循环。

很多团队的反馈停在聊天窗口里：“字段顺序不对”“这里要复用权限判断”“这个模块不能碰”“测试挂了再修一下”。当次订单导出需求可能被救回来了，但这些纠偏没有进入团队资产。

下次换一个人、换一个 Agent、换一个任务，错误还会重来。

更好的反馈循环，应该把一次次纠偏沉淀成四类东西：

导出类需求模板；
订单模块上下文说明；
字段顺序、权限和大数据量测试用例；
Agent 修改订单模块时的禁止事项。

这也是个人用 AI 和团队用 AI 的分水岭。个人可以靠经验临场补救，团队必须让经验进入流程。

如果每次纠偏都只停在聊天窗口里，团队不会真的变强，只是当次任务被救回来了。

AI Coding 的流程层，核心不是把“开发”换成“AI 开发”，而是把研发流程改成 AI 能理解、能执行、能验证、能复盘的形态。

这也是为什么我不太建议企业只从工具培训开始。会用工具当然重要，但如果需求仍然含糊、上下文仍然分散、验证仍然滞后、反馈仍然不沉淀，AI 只会把原来的流程问题放大。

下一步，变化会落到人身上。

当流程开始围绕意图、上下文、验证和反馈重新设计，工程师的核心能力也会变。以前最重要的是亲自写代码，之后越来越重要的是表达任务、组织上下文、设计验收和纠偏结果。监督式工程师会在这个位置出现。

后续会继续拆 AI Coding 体系里的组织能力层。做研发管理、工程效率或企业 AI 落地的朋友，可以关注这个系列。