乐于分享
好东西不私藏

AI 时代的软件流水线,99% 的人都做错了

AI 时代的软件流水线,99% 的人都做错了

本文是对之前别让 AI 裸奔写代码 · 01|为什么 AI 写得越快,返工来得越早? 的优化。

TL;DR
让 AI 裸奔写代码 = 让 AI 加速返工。
真正的 AI 时代研发流程是:AI 生成、人类决策、文档承载上下文、MVP 渐进交付
本文给你一套 「7 个文件 + 5 个 Gate」的最小可行流程,附完整示例,今天就能落地。


📑 阅读路线图

🎬 1·症状 熟悉场景

🩺 2·诊断 为何失控

💡 3·理念 4 关键词

🧰 4·方法 7 文件 + 5 Gate

🛠 5·实战 订单导出

🚀 6·进阶 匹配复杂度

⚠️ 7·避坑 5 个误区

📚 8·沉淀 长期上下文

建议从头读到尾。如果时间紧,可以直接跳到 第四节方法和 第十节速查表


一、🎬 症状:一个熟悉的场景

周一上午,产品同学走过来:

“我们要做一个订单导出功能,你看一下,这周能上吗?”

你打开 Cursor / Claude Code,敲下:

“帮我实现订单导出功能。”

AI 飞快地生成了 300 行代码。然后,真实世界开始反击

字段对不上

权限漏了

大数据超时

破坏老功能

📝 产品一句话需求

💻 直接丢给 AI

⚡ AI 生成大量代码

🔌 开始联调

出问题

回去问产品

让 AI 改

人工救火

继续救火

最终,你得出一个反直觉的结论:

AI 写得越快,返工来得越早。


二、🩺 诊断:为什么 AI 会失控?

问题不在于 AI 不会写代码。问题在于:我们经常让 AI 在缺少上下文、缺少边界、缺少验收标准的情况下直接开工

来看一下「裸奔模式」和「流水线模式」的关键差异:

维度
❌ 裸奔模式
✅ 流水线模式
输入
一句话需求
结构化需求文档
范围
AI 自由发挥
明确 In / Out Scope
验收
“能跑就行”
可测试的 AC 列表
过程
Prompt → Code
Plan → Review → Code
沉淀
聊天记录丢失
文档持久化
结果
反复返工
渐进收敛

换一个角度看:AI 时代,开发者时间会被怎样重新分配?

35%25%25%15%AI 时代:开发者时间分配的新格局需求与上下文工程 [35]Review 与判断 [25]实际编码 / Prompt [25]测试与验收 [15]

写代码不再是开发者最值钱的能力,「把问题说清楚、把边界框清楚、把验收标准定清楚」才是。

AI 时代的软件开发要做到 4 件事

🎯 目标
📌 含义
需求说得清
不止”我要 X”,要包含为什么、给谁、不做什么
AI 知道该做什么
Prompt 是任务书,不是聊天
人知道该 review 什么
验收标准提前定,不是事后凑
后续迭代有上下文
文档承载知识,而非头脑或聊天历史

三、💡 理念:AI 不是替代流程,而是进入流程

过去我们对 AI 的理解是这样的:

输入 prompt ──► 输出代码

在真实软件工程里,这远远不够。更合理的方式是:

📥 需求

Intake定义问题

Research调研证据

Requirements需求分析

MVP Design最小版本设计

➡️ 继续

➡️ 接上

Prompt Spec编码任务书

Plan First先计划

Code生成代码

Review对齐验收

🔁 Next MVP继续迭代

核心理念用一句话概括

AI 生成、人类决策、文档承载上下文、MVP 渐进交付。

把这四个关键词展开:

🧩 关键词
谁来做
它解决什么
AI 生成
Coding / Research Agent
把人从重复劳动里解放
人类决策
开发 / 产品 / Tech Lead
判断、取舍、最终拍板
文档承载
docs/ 目录
让上下文不丢失,可追溯
MVP 渐进
整个团队
控制范围,快速反馈

四、🎭 角色化:把 AI 工具看成角色,不是绑死的产品

🤖 AI 研发流水线

👤HumanReviewer

🔍 Research AgentGemini Deep Research

📋 Requirement AgentClaude

⚙️ Coding AgentCodex / Cursor

✅ Review AgentClaude / Codex

📁 docs/项目上下文

角色职责清单

🎭 角色
🛠 工具示例
✅ 主要职责
❌ 不该负责
Research Agent
Gemini Deep Research
背景研究、竞品分析、技术方案调研
最终拍板
Requirement Agent
Claude
需求拆解、验收标准、边界条件
替业务做决策
Coding Agent
Codex / Cursor
实现计划、写代码、补测试
自行扩大范围
Review Agent
Claude / Codex
对照需求 review 代码
代替人工验收
Human Reviewer
产品、开发、Tech Lead
判断、取舍、确认、验收
机械搬运 AI 输出

🔑 关键原则

流程绑定的是职责,不是工具。
今天可以是 Gemini + Claude + Codex,明天工具变了,只替换角色,不推翻流程。


五、🧰 方法:7 文件 + 5 Gate 的最小可行流程

很多团队做流程失败,不是因为流程不对,而是因为一开始就做得太重

5.1 最小目录结构

docs/
└── order-export/
    ├── 00-intake.md            # 定义问题
    ├── 01-deep-research.md     # 调研证据
    ├── 02-requirements.md      # 正式需求
    ├── 03-mvp-1.md             # MVP 范围
    ├── 04-mvp-1-prompt.md      # 编码任务书
    ├── 05-mvp-1-review.md      # 验收记录
    └── open-questions.md       # 未决问题

5.2 七文件工作流

持续更新

持续更新

持续更新

00-intake.md📝 定义问题

01-deep-research.md🔍 记录调研

02-requirements.md📋 正式需求

03-mvp-1.md🎯 MVP 范围与设计

04-mvp-1-prompt.md⚙️ 编码任务书

💻 代码实现Plan + Code

05-mvp-1-review.md✅ 验收与复盘

open-questions.md❓ 未决问题

文件
作用
大概篇幅
00-intake.md
定义问题,防止一开始就跑偏
1 页
01-deep-research.md
记录 AI 研究结果和证据
1–2 页
02-requirements.md
正式需求、范围、验收标准
2–3 页
03-mvp-1.md
MVP 范围、设计、完成标准
1–2 页
04-mvp-1-prompt.md
给 AI 的正式编码任务书
1 页
05-mvp-1-review.md
对照需求的验收记录
1 页
open-questions.md
持续跟踪未决问题
滚动维护

5.3 五个 Gate:流程可控但不繁重

整个流程压缩到 5 个检查点,每个都是 1–2 个问题:

🚪 Intake Gate问题清楚?

🚪 Requirement Gate验收明确?

🚪 MVP Gate范围够小?

🚪 Plan Gate计划合理?

🚪 Review Gate满足需求?

Gate
必须确认的问题
🚪 Intake Gate
解决什么问题?谁会用?什么暂时不做?
🚪 Requirement Gate
验收标准是否可测试?P0 问题是否关闭?
🚪 MVP Gate
是否控制在最小可交付范围?Done 是否明确?
🚪 Plan Gate
AI 的实现路线是否合理?是否有越界?
🚪 Review Gate
代码是否满足需求?测试是否覆盖关键路径?

5 个 Gate 已经足够防住绝大多数 AI 编码失控的问题。


六、🛠 实战演练:订单导出功能

需求一句话:“后台系统需要支持订单导出。”

这句话其实暗藏着至少 8 个问题:

导出哪些字段?谁可以导出?CSV 还是 Excel?数据量大怎么办?
是否需要异步?是否需要操作日志?是否允许导出手机号?失败后怎么提示?

所以我们不要直接进入编码。下面一步步走完整套流程。


Step 1 · Intake:先把问题说清楚

Intake 的目标不是写完整需求,而是先把问题边界框住。

📥 需求来了

先问 5 个问题

解决什么问题?

谁会使用?

什么算成功?

这次不做什么?

哪些问题需要研究?

📝 00-intake.md

📄 00-intake.md 示例(点击展开)

💡 Intake 一页就够,不要写成大文档。


Step 2 · Deep Research:研究是证据库,不是需求

接下来用 Research Agent 进行调研。但要记住一个原则:

Research 是证据库,不是最终需求。AI 研究结果只是输入,不能直接变成产品决策。

📄 01-deep-research.md 关键部分(点击展开)

调研得到的方案对比(直接放在文章里方便阅读):

方案
优点
缺点
适合 MVP?
同步 CSV 导出
实现简单,交付快
大数据量容易超时
✅ 适合
异步导出任务
稳定,适合大数据
实现复杂,需任务系统
⏸ 留给 MVP-2
报表系统
扩展性强
成本高,周期长
❌ 不适合

聚焦三个问题就够了:

  • • 🔍 这个需求有什么常见方案?
  • • ⚖️ 每种方案有什么优缺点?
  • • ⚠️ MVP 应该避开什么坑?

Step 3 · 需求分析:重点是收敛,不是发散

需求分析不是让 AI 继续发散,而是让 AI 帮我们 收敛到:

需求分析收敛而非发散

👥 用户故事

📐 范围边界

✅ 验收标准

⚙️ 非功能需求

❓ 未决问题

📄 02-requirements.md 关键片段(点击展开)

验收标准必须显式列出

编号
验收项
必须
AC-1
按当前筛选条件导出
AC-2
权限范围正确
AC-3
单次导出不超过 5000 条
AC-4
导出操作写入日志
AC-5
导出历史页面
❌ MVP-2

open-questions.md始终在更新

ID
问题
优先级
状态
结论
Q1
是否导出手机号?
P0
✅ Resolved
MVP-1 不导出
Q2
是否支持 Excel?
P1
✅ Resolved
MVP-1 只支持 CSV
Q3
超过 5000 条怎么处理?
P0
✅ Resolved
前端提示缩小筛选
Q4
是否需要导出历史?
P2
🟡 Open
放到 MVP-2 评估

Requirement Gate 检查

需求可进入设计?

范围明确?

🔁 继续澄清

验收标准可测试?

P0 问题已关闭?

✅ 进入 MVP 设计


Step 4 · 抽取 MVP:控制范围是核心

AI 很容易把功能做大。”订单导出”如果不控制,可能会被 AI 主动设计出:

异步任务 + 导出历史 + 字段配置 + 报表模板 + 邮件通知 + 权限矩阵 + 报表中心…

这些功能不一定错,但它们不属于 MVP

📦 订单导出

MVP-1 ✅

同步 CSV

当前筛选条件

权限控制

5000 条限制

操作日志

MVP-2 ⏸

异步导出

导出历史

Excel 支持

暂不考虑 ❌

定时报表

自定义模板

报表中心

03-mvp-1.md必须包含三件事

03-mvp-1.md

✅ 范围内

❌ 范围外

🎯 Done Definition

📄 03-mvp-1.md 示例(点击展开)

🚨 没有「范围外」,AI 很容易过度发挥。
🚨 没有「Done Definition」,就很难判断是否真的完成。


Step 5 · Prompt 当成正式任务书

很多人对 AI 编程的理解还停留在”帮我实现这个功能”。这太模糊了。

更好的方式是把 prompt 写成一份正式任务书,并单独成文档:

需求文档

📜 Prompt 任务书

MVP 文档

open-questions

项目规则AGENTS.md

代码上下文

🤖 Coding Agent 理解任务

📋 先输出实现计划

📄 04-mvp-1-prompt.md 示例(点击展开)

Prompt 单独成文档的好处

好处
含义
📋 方便人工 review
Prompt 不再是临时聊天记录
♻️ 方便下次复用
同类需求可借鉴模板
🔍 方便追溯
AI 为什么这么改有据可查
🏛 项目资产化
沉淀为团队知识

Step 6 · 编码前必须先 Plan

这是整个流程中最重要的一步。不要让 AI 拿到 prompt 就直接改代码。

✅ Review Agent📁 Docs🤖 Coding Agent👤 Human✅ Review Agent📁 Docs🤖 Coding Agent👤 HumanReview 计划alt[计划合理][计划不合理]提供 mvp-1-prompt.md阅读 requirements/mvp/AGENTS输出 implementation plan批准编码修改代码 + 补测试输出 diff + 测试结果请求交叉 review对照文档检查输出 review 结论要求修改计划

Plan Review 能提前拦截的常见问题

🚨 AI 计划中的问题
⚠️ 为什么危险
想新增大型报表模块
超出 MVP 范围
想引入重型依赖
增加维护成本
忘了权限校验
安全风险
没有测试计划
无法验收
改动大量无关文件
增加 review 难度
自行支持异步导出
范围失控

💣 AI 写错一行代码不可怕,可怕的是它理解错任务后,写了一堆看似合理的代码。


Step 7 · 代码生成后,对照需求验收

AI 写完代码后,不要只问”能不能跑”,还要问:

  • • ✅ 它是不是实现了需求?
  • • 📐 有没有超出范围?
  • • 🔍 有没有漏掉验收标准?
  • • 🧹 有没有引入技术债?

建议让另一个 AI 做一次 交叉 review

💾 代码 diff

🔍 Review Agent

02-requirements.md

03-mvp-1.md

🧪 测试结果

需求对齐检查

范围检查

测试缺口

安全/权限风险

技术债

📄 05-mvp-1-review.md

验收记录直接做成对照表

验收标准
实现情况
结论
按当前筛选条件导出
已实现
权限过滤
复用订单查询权限
单次最多 5000 条
已实现限制
操作日志
已记录导出人和筛选条件
CSV 文件下载
前端已支持
范围外功能
是否误实现
异步导出
❌ 否
导出历史
❌ 否
自定义字段
❌ 否

结论:✅ Accept with follow-up。MVP-1 可以上线,MVP-2 评估异步导出和导出历史。


七、🚀 进阶:流程要匹配复杂度

不要所有需求都套完整流程。流程要和复杂度匹配。

高流程重量 + 复杂需求高流程重量 + 简单需求低流程重量 + 简单需求低流程重量 + 复杂需求报表平台会员系统审核流程订单导出修 Bug加字段改文案简单需求复杂需求需求复杂度 vs 流程重量(纵向:低 → 高)

用「T 恤尺码」匹配流程

👕 尺码
需求类型
推荐流程
文件数
S
改文案、加字段、修 bug
轻量:requirements + prompt + review
3
M
导出、审核、支付
标准:本文 7 文件
7
L
会员、权限、报表平台
完整:design + adr + 多 MVP + release
10+

📏 一句话:小需求不要流程过载,大需求不要裸奔开发。


八、⚠️ 避坑:5 个最常见的误区

❌ 误区
✅ 正确做法
把 Deep Research 当最终需求
Research 只是证据库,人类做判断
以为 prompt 写得好就够了
前置的需求/MVP 没写清,prompt 再好也救不了
让 AI 一次性做完整功能
每个 MVP 都明确”范围内”和”范围外”
没有测试计划
MVP 文档必须写功能/权限/边界/回归测试
只 review 代码,不 review 需求对齐
对照 requirements + MVP + prompt + diff 一起 review

九、📚 沉淀:两个长期上下文文件

除了每个需求的 docs/需求名/,建议在项目根目录维护两个长期文件

📗 CLAUDE.md — 约束 Requirement / Review Agent

约束

📗 CLAUDE.md

需求分析原则

文档规范

Review 检查项

Open Questions 规则

🤖 Requirement / Review Agent

📘 AGENTS.md — 约束 Coding Agent

约束

📘 AGENTS.md

项目结构

运行命令

代码规范

Done Definition

🤖 Coding Agent

📘 AGENTS.md 示例(点击展开) 📗 CLAUDE.md 示例(点击展开)

💡 这两个文件的作用是把每次都要重复提醒 AI 的规则,沉淀成长期上下文。


十、📋 一页速查表(建议截图保存)

阶段
产物
核心问题
Gate
🟦 Intake
00-intake.md
需求到底解决什么?
🚪 Intake Gate
🟦 Research
01-deep-research.md
有哪些方案和风险?
🟩 Requirement
02-requirements.md
验收标准是否清楚?
🚪 Requirement Gate
🟩 MVP
03-mvp-1.md
本次做什么,不做什么?
🚪 MVP Gate
🟨 Prompt
04-mvp-1-prompt.md
AI 是否知道怎么做?
🟨 Plan + Code
diff + tests
实现路线是否正确?
🚪 Plan Gate
🟧 Review
05-mvp-1-review.md
是否真的满足需求?
🚪 Review Gate

十一、🎯 结语:AI 时代,真正重要的是上下文工程

过去软件开发最难的事情是写代码

现在 AI 能写很多代码,于是最难的事情变成了:

把问题定义清楚,把上下文组织清楚,把边界约束清楚,把验收标准写清楚,把迭代过程记录清楚。

这就是 AI 时代软件开发的核心能力。它不只是 Prompt Engineering,而是更大的东西——三个工程能力的组合:

🎯AI 时代核心能力

🧠 Context Engineering把业务、约束、债务交给 AI

⚙️ Workflow Engineering让 AI 按规矩工作

🔍 Review Engineering让人类的判断介入到正确的位置

AI 不会自动知道你的业务目标、系统约束、团队习惯和技术债。你需要通过 文档、流程和 review,把这些上下文传递给它。

最终目标很简单:

少返工、少跑偏、少猜测;多复用、多沉淀;更稳定地交付。

当 AI 负责生成、人类负责判断、文档负责承载上下文,你的团队就能从——

❌ “用 AI 写代码”

升级为——

✅ “用 AI 交付软件


🚀 如果这篇文章对你有帮助,欢迎转发给身边正在被 AI “加速返工”的同事。

本站作品均采用知识共享署名-非商业性使用-相同方式共享 4.0进行许可,资源收集于网络仅供用于学习和交流,本站一切资源不代表本站立场,我们尊重软件和教程作者的版权,如有不妥请联系本站处理!

 沪ICP备2023009708号

© 2017-2026 夜雨聆风   | sitemap | 网站地图