一份真正有效的 AI 规格模板

不少团队已经在用 AI 写代码、改文档、补测试，但同一套工具在不同人手里，结果差异很大。

问题通常不在模型，而在输入。需求说得越模糊，输出越不稳定。真正要提升产出质量，先要把“怎么提需求”标准化。

这里的 AI 规格，不是厚文档，而是一份可执行、可检查、可复盘的任务说明。它的目标只有一个：让 AI 的产出进入工程流程，而不是停留在“看起来不错”。

我建议一份规格至少包含 8 个部分。

第一，任务目标。写清业务目标和边界，例如“在现有登录体系中新增邮箱验证码登录，保留手机号登录逻辑不变”。目标不清，AI 很容易默认重构过度。

第二，输入上下文。明确代码位置、依赖版本、已有接口、不可变前提。比如“仅改 auth 模块”“数据库结构不可修改”。你不写，AI 就会按通用假设补全。

第三，输出范围。要方案、伪代码还是直接补丁？能不能改测试？是否允许改公共组件？范围越清楚，返工越少。

第四，非功能要求。性能、安全、兼容、可观测性要前置，不要等代码写完再补。很多线上问题都不是功能错，而是这些约束缺失。

第五，规范要求。代码风格、命名、目录结构、注释规则都应写明。否则结果能跑，但很难合并。

第六，禁止事项。明确不能引入新框架、不能改协议字段、不能删监控埋点。告诉 AI 红线，比告诉它理想方案更重要。

第七，验收标准。必须是可验证项，比如“单测通过”“关键异常路径覆盖”“接口文档补齐示例”。可验证，才可协作。

第八，迭代策略。规定每轮处理上限、冲突处理方式、失败回退办法。这样可以把交互从反复试错变成稳定推进。

可以直接用这份简化模板：

【任务目标】
业务目标：
边界范围：

【输入上下文】
代码位置：
相关文件：
技术栈/版本：
不可变约束：

【输出范围】
需要产出：
允许修改：
禁止修改：

【非功能要求】
性能：
安全：
兼容：
可观测性：

【规范要求】
风格与命名：
目录与注释：

【禁止事项】
1)
2)
3)

【验收标准】
1)
2)
3)

【迭代策略】
每轮处理上限：
冲突处理方式：
回退方案：

落地时再补两个动作。

第一，让 AI 在输出里固定附带“影响范围、风险点、未覆盖场景”，减少评审人理解成本。第二，每次上线后复盘一次：这次返工来自哪个字段缺失，再把模板补齐。模板不是一次定稿，而是持续校正。

判断这份规格是否真正有效，可以看三个指标：同任务换人后结果是否稳定，评审耗时是否下降，回滚率是否下降。三项里只要有两项持续改善，说明规格在发挥作用。

一份真正有效的 AI 规格模板，本质上是在建立团队的结果约束。它把“会不会用 AI”从个人经验，变成可复用的方法。

模型会迭代，但这套方法会长期有效。