AI 写代码总翻车?可能是你缺了一套「交通规则」-夜雨聆风

AI 写代码总翻车?可能是你缺了一套「交通规则」

让 AI 编程代理乖乖干活，光靠 prompt 远远不够。Spec-Kit、OpenSpec、Superpowers 这三个项目，代表了三种完全不同的「驯服 AI」思路——选错了，比不用还难受。

一、先说痛点：AI 代理为什么老「自由发挥」？

你有没有这种体验——

给 AI 说”帮我写个登录模块”，它二话不说啪啪一顿输出。看着挺像那么回事，但仔细一看：项目用的是 TypeScript，它给你整了一套 Python；团队规范要求先写测试，它直接跳过测试一把梭；你和同事分别问同样的需求，结果出来两套完全不兼容的代码。

问题的根子很简单：AI 代理没有「规矩」。

它知道怎么写代码，但不知道你的团队怎么写代码。就像请了一个技术很强但从来没看过你们内部文档的外包——能力在线，规矩全无。

怎么办？给它立规矩。

目前社区里冒出了三个热门方案，各自的粉丝都不少：

🏛️ Spec-Kit（GitHub 官方出品，82.5K Star）——走的是「流水线质检」路线
🌊 OpenSpec（Fission-AI 团队，34.5K Star）——走的是「轻装上阵」路线
⚡ Superpowers（obra 大神，115K Star）——走的是「技能树点满」路线

名字都带”规范”的味道，但底层逻辑天差地别。选错了，就是工具反过来束缚人。

二、它们到底是什么？用人话讲

🏛️ Spec-Kit：企业级「质量总监」

GitHub 亲儿子。核心思路一句话：规范不是写着看的，是直接拿来跑的。

你可以把它想象成一条制造业的流水线：原料（需求）进来，经过 7 道质检关卡——定宪法 → 写规格 → 问清楚 → 出计划 → 拆任务 → 查一致 → 动手干——每一道必须过关才能往下走。

它最像什么？ 像大厂的 PMO 流程。严谨、可追溯、适合多人协作的大项目——但如果你只是改个按钮颜色，这套流程会让你想掀桌。

🌊 OpenSpec：轻量「活文档」

Fission-AI 团队做的，口号四个词：流畅、迭代、简单、为老项目而生。

不搞阶段门控那套。你有个想法，就用 /opsx:propose 提一个变更提案，系统帮你生成设计文档和任务清单；做完了 /opsx:apply 执行，最后 /opsx:archive 归档。

它最像什么？ 像 Git 的 PR 流程——但管的是需求和规范，而不是代码。每个功能是一个独立的”变更目录”，互不干扰，完成即归档。而且完全不需要 API Key 和 MCP，开箱即用。

⚡ Superpowers：自动「技能触发器」

obra（Jesse Vincent）出品，社区最大，115K Star。

它根本不走”规范驱动”那条路。它的逻辑是：与其写规范让 AI 照着做，不如给 AI 装一组「条件反射」。

核心是一套可组合的”技能”——写代码前自动触发 TDD 技能（先写测试），写完自动触发 code-review 技能（自我审查），遇到 bug 自动触发 systematic-debugging 技能。你什么命令都不用敲，说一句”帮我加个记住密码功能”，它自己就走完了 头脑风暴 → 写计划 → 跑测试 → 写代码 → 验证 → 审查 全流程。

它最像什么？ 像给 AI 植入了一套职业习惯——不用你盯着，它自己就知道先写测试、后写代码、写完自查。

三、底层架构一图看懂

三者的技术栈完全不同：

维度	Spec-Kit	OpenSpec	Superpowers
开发语言	Python	TypeScript	Shell/JS
核心机制	模板引擎 + 扩展系统	变更驱动的目录结构	技能触发 + Hook 系统
安装方式	`uv tool install`	`npm install -g`	插件市场 / 手动配置
数据管理	中心化配置文件	分布式目录（changes/specs/archive）	无独立规范层
变更追踪	Git 分支隔离	changes/ 目录	Git Worktrees

打个比方：

Spec-Kit 像 ERP 系统——功能全但重，每个环节都有表单要填
OpenSpec 像 Notion 看板——轻巧灵活，按需组织
Superpowers 像 iOS 的快捷指令——设好条件就自动跑，不用手动触发

四、核心能力打分

直接看关键差异：

你关心的事	Spec-Kit	OpenSpec	Superpowers
上手难度	⭐⭐⭐ 中等	⭐⭐ 平缓	⭐⭐ 平缓
支持的 AI 工具数	11+	20+（最广）	5+
强制写测试？	❌	❌	✅ 必须先写测试
不要 API Key？	看你用哪个代理	✅ 完全不需要	看你用哪个代理
老项目友好？	✅	✅✅（专门设计）	✅
团队协作	✅ 企业级	🚧 开发中	✅ 社区驱动
可定制程度	高（扩展+预设）	中等	高（技能系统）

📌 划重点：

如果你特别在意测试纪律——只有 Superpowers 强制 RED-GREEN-REFACTOR 循环，其他两个不管这事
如果你有个老项目想渐进式改造——OpenSpec 明确打出”built for brownfield”的旗号
如果你要支持最多的 AI 工具——OpenSpec 兼容 20+ 家，从 Claude Code 到 Cursor 到 Gemini CLI 全覆盖

五、三种工作流长什么样？

Spec-Kit：「过关斩将」式

定宪法 → 写规格 → 问清楚 → 出计划 → 拆任务 → 查一致 → 动手干
  [门]     [门]     [门]     [门]     [门]     [门]     [门]

每道门都得过。好处：质量稳定，可追溯，出了问题能精确回溯到哪个环节。坏处：小需求也得走全套流程，有点杀鸡用牛刀。

OpenSpec：「提案→执行→归档」三步走

/opsx:propose（我想干嘛）
    ↓
/opsx:apply（开始干）
    ↓
/opsx:archive（归档，下一个）

没有门控，随时可以调整提案。每个功能是独立目录，做完就归档进持久规范库。适合节奏快、需求变化多的场景。

Superpowers：「说了就自动跑」

你："帮我加个记住密码"
    ↓ [自动触发 brainstorming]
    ↓ [自动触发 writing-plans]
    ↓ [自动触发 TDD]
    ↓ [自动触发 code-review]
完成 ✅

不用记命令，不用手动推进流程。上下文触发一切。

六、别神话它们——三个工具都有短板

🚫 说句实在话，这三个项目都还在快速迭代期，没有哪个是”装上就完事”的银弹：

Spec-Kit 的 7 道门控对小团队来说过于笨重。你改个 CSS 也得走完”定宪法→查一致”？认真的吗？
OpenSpec 的团队协作功能还在开发中（🚧），多人同时修改同一个 spec 可能会出问题
Superpowers 目前深度优化的工具只有 Claude Code 等少数几个，如果你用 Cursor 或 Windsurf，体验可能打折
三个项目的社区文档质量参差不齐，遇到问题经常只能翻 Issue 或看源码
规范驱动≠万能——如果你的需求本身就很模糊，再好的规范工具也救不了

七、怎么选？看你的场景

三条路，按需选择：

你是大团队 / 企业项目 / 需要严格流程？→ 选 Spec-Kit。GitHub 官方维护，长期支持有保障，阶段门控确保每一步都可追溯。
你在改造老项目 / 需求变化快 / 想轻量上手？→ 选 OpenSpec。专为 brownfield 设计，学习曲线最平，支持的 AI 工具最多。
你是质量至上 / 信仰 TDD / 喜欢自动化流程？→ 选 Superpowers。技能触发机制让 AI 自动遵守开发纪律，不用你盯着。

如果你还是拿不定主意？ 先试 OpenSpec——它最轻、门槛最低、支持工具最多。不满意再换，迁移成本很低。

总结

一句话总结	Spec-Kit	OpenSpec	Superpowers
它是什么	企业级规范流水线	轻量活文档管理	AI 技能自动触发器
最大优势	流程严格可追溯	轻量灵活开箱用	自动强制代码质量
最大短板	小需求嫌笨重	团队协作待完善	支持工具较少
适合谁	大厂 / 多人协作	快速迭代 / 老项目	TDD 信徒 / 质量控

AI 编程工具的竞争，已经从”谁写得快”变成了”谁的流程稳”。 给你的 AI 代理立好规矩，它才能真正成为靠谱的队友，而不是一个需要你时刻盯着的实习生。