这里的 AI 规格,不是厚文档,而是一份可执行、可检查、可复盘的任务说明。它的目标只有一个:让 AI 的产出进入工程流程,而不是停留在“看起来不错”。
我建议一份规格至少包含 8 个部分。
第一,任务目标。写清业务目标和边界,例如“在现有登录体系中新增邮箱验证码登录,保留手机号登录逻辑不变”。目标不清,AI 很容易默认重构过度。
第二,输入上下文。明确代码位置、依赖版本、已有接口、不可变前提。比如“仅改 auth 模块”“数据库结构不可修改”。你不写,AI 就会按通用假设补全。
第三,输出范围。要方案、伪代码还是直接补丁?能不能改测试?是否允许改公共组件?范围越清楚,返工越少。
第四,非功能要求。性能、安全、兼容、可观测性要前置,不要等代码写完再补。很多线上问题都不是功能错,而是这些约束缺失。
第五,规范要求。代码风格、命名、目录结构、注释规则都应写明。否则结果能跑,但很难合并。
第六,禁止事项。明确不能引入新框架、不能改协议字段、不能删监控埋点。告诉 AI 红线,比告诉它理想方案更重要。
第七,验收标准。必须是可验证项,比如“单测通过”“关键异常路径覆盖”“接口文档补齐示例”。可验证,才可协作。
第八,迭代策略。规定每轮处理上限、冲突处理方式、失败回退办法。这样可以把交互从反复试错变成稳定推进。
可以直接用这份简化模板:
【任务目标】
业务目标:
边界范围:
【输入上下文】
代码位置:
相关文件:
技术栈/版本:
不可变约束:
【输出范围】
需要产出:
允许修改:
禁止修改:
【非功能要求】
性能:
安全:
兼容:
可观测性:
【规范要求】
风格与命名:
目录与注释:
【禁止事项】
1)
2)
3)
【验收标准】
1)
2)
3)
【迭代策略】
每轮处理上限:
冲突处理方式:
回退方案:
落地时再补两个动作。
第一,让 AI 在输出里固定附带“影响范围、风险点、未覆盖场景”,减少评审人理解成本。第二,每次上线后复盘一次:这次返工来自哪个字段缺失,再把模板补齐。模板不是一次定稿,而是持续校正。
判断这份规格是否真正有效,可以看三个指标:同任务换人后结果是否稳定,评审耗时是否下降,回滚率是否下降。三项里只要有两项持续改善,说明规格在发挥作用。
一份真正有效的 AI 规格模板,本质上是在建立团队的结果约束。它把“会不会用 AI”从个人经验,变成可复用的方法。
模型会迭代,但这套方法会长期有效。
夜雨聆风