AI 写代码总翻车?可能是你缺了一套「交通规则」
让 AI 编程代理乖乖干活,光靠 prompt 远远不够。Spec-Kit、OpenSpec、Superpowers 这三个项目,代表了三种完全不同的「驯服 AI」思路——选错了,比不用还难受。
一、先说痛点:AI 代理为什么老「自由发挥」?
你有没有这种体验——
给 AI 说”帮我写个登录模块”,它二话不说啪啪一顿输出。看着挺像那么回事,但仔细一看:项目用的是 TypeScript,它给你整了一套 Python;团队规范要求先写测试,它直接跳过测试一把梭;你和同事分别问同样的需求,结果出来两套完全不兼容的代码。
问题的根子很简单:AI 代理没有「规矩」。
它知道怎么写代码,但不知道你的团队怎么写代码。就像请了一个技术很强但从来没看过你们内部文档的外包——能力在线,规矩全无。
怎么办?给它立规矩。
目前社区里冒出了三个热门方案,各自的粉丝都不少:
-
🏛️ Spec-Kit(GitHub 官方出品,82.5K Star)——走的是「流水线质检」路线 -
🌊 OpenSpec(Fission-AI 团队,34.5K Star)——走的是「轻装上阵」路线 -
⚡ Superpowers(obra 大神,115K Star)——走的是「技能树点满」路线
名字都带”规范”的味道,但底层逻辑天差地别。选错了,就是工具反过来束缚人。

二、它们到底是什么?用人话讲
🏛️ Spec-Kit:企业级「质量总监」
GitHub 亲儿子。核心思路一句话:规范不是写着看的,是直接拿来跑的。
你可以把它想象成一条制造业的流水线:原料(需求)进来,经过 7 道质检关卡——定宪法 → 写规格 → 问清楚 → 出计划 → 拆任务 → 查一致 → 动手干——每一道必须过关才能往下走。
它最像什么? 像大厂的 PMO 流程。严谨、可追溯、适合多人协作的大项目——但如果你只是改个按钮颜色,这套流程会让你想掀桌。
🌊 OpenSpec:轻量「活文档」
Fission-AI 团队做的,口号四个词:流畅、迭代、简单、为老项目而生。
不搞阶段门控那套。你有个想法,就用 /opsx:propose 提一个变更提案,系统帮你生成设计文档和任务清单;做完了 /opsx:apply 执行,最后 /opsx:archive 归档。
它最像什么? 像 Git 的 PR 流程——但管的是需求和规范,而不是代码。每个功能是一个独立的”变更目录”,互不干扰,完成即归档。而且完全不需要 API Key 和 MCP,开箱即用。
⚡ Superpowers:自动「技能触发器」
obra(Jesse Vincent)出品,社区最大,115K Star。
它根本不走”规范驱动”那条路。它的逻辑是:与其写规范让 AI 照着做,不如给 AI 装一组「条件反射」。
核心是一套可组合的”技能”——写代码前自动触发 TDD 技能(先写测试),写完自动触发 code-review 技能(自我审查),遇到 bug 自动触发 systematic-debugging 技能。你什么命令都不用敲,说一句”帮我加个记住密码功能”,它自己就走完了 头脑风暴 → 写计划 → 跑测试 → 写代码 → 验证 → 审查 全流程。
它最像什么? 像给 AI 植入了一套职业习惯——不用你盯着,它自己就知道先写测试、后写代码、写完自查。
三、底层架构一图看懂
三者的技术栈完全不同:
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
uv tool install |
npm install -g |
|
|
|
|
|
|
|
|
|
|
|

打个比方:
-
Spec-Kit 像 ERP 系统——功能全但重,每个环节都有表单要填 -
OpenSpec 像 Notion 看板——轻巧灵活,按需组织 -
Superpowers 像 iOS 的快捷指令——设好条件就自动跑,不用手动触发
四、核心能力打分

直接看关键差异:
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
📌 划重点:
-
如果你特别在意测试纪律——只有 Superpowers 强制 RED-GREEN-REFACTOR 循环,其他两个不管这事 -
如果你有个老项目想渐进式改造——OpenSpec 明确打出”built for brownfield”的旗号 -
如果你要支持最多的 AI 工具——OpenSpec 兼容 20+ 家,从 Claude Code 到 Cursor 到 Gemini CLI 全覆盖
五、三种工作流长什么样?

Spec-Kit:「过关斩将」式
定宪法 → 写规格 → 问清楚 → 出计划 → 拆任务 → 查一致 → 动手干
[门] [门] [门] [门] [门] [门] [门]
每道门都得过。好处:质量稳定,可追溯,出了问题能精确回溯到哪个环节。坏处:小需求也得走全套流程,有点杀鸡用牛刀。
OpenSpec:「提案→执行→归档」三步走
/opsx:propose(我想干嘛)
↓
/opsx:apply(开始干)
↓
/opsx:archive(归档,下一个)
没有门控,随时可以调整提案。每个功能是独立目录,做完就归档进持久规范库。适合节奏快、需求变化多的场景。
Superpowers:「说了就自动跑」
你:"帮我加个记住密码"
↓ [自动触发 brainstorming]
↓ [自动触发 writing-plans]
↓ [自动触发 TDD]
↓ [自动触发 code-review]
完成 ✅
不用记命令,不用手动推进流程。上下文触发一切。
六、别神话它们——三个工具都有短板
🚫 说句实在话,这三个项目都还在快速迭代期,没有哪个是”装上就完事”的银弹:
-
Spec-Kit 的 7 道门控对小团队来说过于笨重。你改个 CSS 也得走完”定宪法→查一致”?认真的吗? -
OpenSpec 的团队协作功能还在开发中(🚧),多人同时修改同一个 spec 可能会出问题 -
Superpowers 目前深度优化的工具只有 Claude Code 等少数几个,如果你用 Cursor 或 Windsurf,体验可能打折 -
三个项目的社区文档质量参差不齐,遇到问题经常只能翻 Issue 或看源码 -
规范驱动≠万能——如果你的需求本身就很模糊,再好的规范工具也救不了
七、怎么选?看你的场景

三条路,按需选择:
-
你是大团队 / 企业项目 / 需要严格流程?→ 选 Spec-Kit。GitHub 官方维护,长期支持有保障,阶段门控确保每一步都可追溯。
-
你在改造老项目 / 需求变化快 / 想轻量上手?→ 选 OpenSpec。专为 brownfield 设计,学习曲线最平,支持的 AI 工具最多。
-
你是质量至上 / 信仰 TDD / 喜欢自动化流程?→ 选 Superpowers。技能触发机制让 AI 自动遵守开发纪律,不用你盯着。
如果你还是拿不定主意? 先试 OpenSpec——它最轻、门槛最低、支持工具最多。不满意再换,迁移成本很低。
总结
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
AI 编程工具的竞争,已经从”谁写得快”变成了”谁的流程稳”。 给你的 AI 代理立好规矩,它才能真正成为靠谱的队友,而不是一个需要你时刻盯着的实习生。
夜雨聆风