当AI编程工具从"一个"变成"一堆",选型本身就成了一个工程问题。
在上篇文章《AI编程越用越累?——从Vibe Coding到SDD的范式革命》中,我们看到了AI编程"出码率≠交付率"的残酷真相,并认识了规范驱动开发(SDD)这一新范式。SDD的核心公式是 SDD = 规范(结构化) + AI(生成) + 验证(自动化) ,但仅有理念是不够的——我们需要具体的工具来落地。
如果你对SDD的基本概念还不熟悉,建议先查看文末合集目录中的系列第一篇文章,了解从Vibe Coding到SDD的范式转变。本篇我们将深入工具层面,看看目前有哪些成熟的工具可供选择。
一、AI编程的工程化困境
1.1 从"缺工具"到"挑花眼"
2024年之前,AI编程开发者的困扰是"没有好用的工具"。2025年之后,困扰变成了"工具太多,不知道怎么选"。
GitHub Copilot带来了代码补全,Cursor带来了对话式编程,Claude Code带来了自主Agent,OpenCode带来了开源自由,Superpowers带来了流程纪律,Spec Kit带来了规范驱动……每一个工具都解决了一个特定问题,但当工具数量超过3个,选型和组合本身就成了一场新的技术债。
核心矛盾: AI编程工具的能力是碎片化的——A工具擅长代码生成,B工具擅长流程管控,C工具擅长规范定义。开发者需要在多个工具之间反复切换,上下文丢失、配置冲突、工作流割裂成为常态。
1.2 三要素模型的提出
为了解决这一困境,行业逐渐形成了 "规范定义 — 能力增强 — 行为约束" 的三要素工程化框架。

三个要素各司其职:
| 规范定义 | |||
| 能力增强 | |||
| 行为约束 |
三个要素不是孤立的,而是层层递进、相互依存的关系:规范定义决定了"目标是什么",能力增强决定了"执行有多强",行为约束决定了"边界在哪里"。三者共同构成一个完整的AI编程工程化闭环。
二、规范定义工具:给AI画好施工蓝图
规范定义工具解决的是 "做什么" 的问题。它们通过结构化的规范文档,将模糊的业务需求转化为AI可精确理解并执行的指令。
目前最主流的两个规范定义工具是 GitHub Spec Kit 和 OpenSpec。
2.1 GitHub Spec Kit:企业级规范驱动开发工具包
官方定位: Spec Kit是GitHub开源的规范驱动开发(SDD)工具包,旨在帮助开发团队在编写任何代码之前,先通过结构化的规范文档明确"要构建什么"。
核心数据: Spec Kit在GitHub上已获得超过82,000颗星,支持Claude Code、GitHub Copilot、Cursor、Gemini CLI等超过25种AI代理开箱即用。
核心工作流: Spec Kit实现了标准的SDD四阶段流程:

核心组件:
- 宪法(Constitution)
:定义项目的核心原则、技术约束和编码规范 - 规范(Specification)
:描述功能需求、用户故事和验收标准 - 计划(Plan)
:技术设计方案和实施步骤 - 任务(Tasks)
:可执行的开发任务清单
适用场景: 绿地项目、大型团队、需要严格流程管控的企业级开发。
2.2 OpenSpec:轻量级规范驱动开发框架
官方定位: OpenSpec是一个轻量级的规范驱动开发框架,核心理念是"在写任何代码之前,先让人类和AI就构建什么达成一致"。无需API密钥即可使用。
核心工作流: OpenSpec采用灵活的动作驱动(Action-based)工作流:

与Spec Kit的刚性四阶段不同,OpenSpec采用了更灵活的动作驱动模型:
- 提案(Propose)
:基于想法生成结构化规范 - 执行(Apply)
:依据规范驱动AI生成代码 - 归档(Archive)
:将完成的规范归档为项目资产
OpenSpec的核心特点是 "工件图自动跟踪状态"——所有规范工件之间的依赖关系和状态变化由系统自动管理,开发者可以随时编辑任何工件,无需担心破坏工作流的完整性。
适用场景: 棕地项目、敏捷团队、需要渐进式引入SDD的中小团队。
2.3 Spec Kit vs OpenSpec:如何选型?
| 开源 | ||
| 重量级 | ||
| 学习曲线 | ||
| 棕地支持 | ||
| 流程灵活性 | ||
| API密钥 | ||
| 团队规模 | ||
| AI代理支持 |
选型建议:
- 选Spec Kit
:如果你在做一个全新的绿地项目,团队规模较大,需要严格的流程管控和审计追踪 - 选OpenSpec
:如果你在维护一个现有系统(棕地项目),团队规模较小,希望快速上手、灵活迭代
三、能力增强工具:给AI装上"工程大脑"
规范定义工具解决了"做什么"的问题,但AI在执行时仍然可能"能力不足"——无法处理复杂的多步骤任务、缺乏工程流程意识、不知道何时该做什么。能力增强工具正是为解决这个问题而生。
3.1 Superpowers:给AI请一个"项目经理"
核心理念: "Process over Prompt"(流程大于提示词)。Superpowers不是让AI更聪明,而是让AI更守规矩——像给AI请了一个"项目经理"。
背景: Superpowers由Jesse Vincent(GitHub账号obra)开发,是Claude Code的官方插件。Jesse被认为是"最有创造力的编码Agent使用者之一",他将自己积累的大量"编程技巧"打包成了这个插件。
安装方式:
/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace
技能全景: Superpowers当前内置14个核心技能,覆盖软件开发的完整生命周期:
| 需求澄清 | ||
| 计划制定 | ||
| 执行管理 | ||
| 开发执行 | ||
| 质量保障 | ||
| 系统调试 | ||
| 代码审查 | ||
| 根因追踪 |
技术亮点: Superpowers的Skill不仅是文本指令,还包含可执行的流程图(Graphviz DOT图)——Claude Code能够直接解析这些图作为工作流指令。例如在root-cause-tracing技能中,包含了一个完整的决策流程图,指导AI判断何时追溯、何时停止。
适用场景: 已在使用Claude Code的开发者,希望为AI注入工程纪律和流程意识。
3.2 复合工程(Compound Engineering):让每一次开发都成为下一次的资产
核心理念: "让下一次更容易"(Make the next one easier)。传统开发积累技术债务——功能越加越多,代码越来越难改。复合工程反过来:今天做的每一件事,都应该让明天的事变得更容易。
背景: 复合工程由Every团队开发——这家公司同时运营6款产品(Cora、Monologue、Proof、Sparkle、Spiral和Every.to),主要靠单人工程团队支撑。这个项目就是他们在实际项目中一点点摸索出来的系统化方法。
核心数据: 复合工程插件包含 51个Agent 和 37个Skill,支持Claude Code、Cursor、Codex、GitHub Copilot等多种工具。
七步工作流循环:

核心命令:
/ce-brainstorm | |
/ce-plan | |
/ce-work | |
/ce-code-review | |
/ce-compound | |
/ce-strategy | |
/ce-debug |
与Superpowers的核心区别:
| 核心理念 | ||
| 关注点 | ||
| 技能数量 | ||
| 核心机制 | ||
| 设计哲学 |
3.3 Skillware:AI技能的"包管理器"
核心理念: 正如apt-get为Linux安装软件、pip为Python安装库,Skillware为AI代理安装"知识"。
背景: Skillware是一个开源的技能框架和注册中心,将技能视为可安装的内容,将能力与智能解耦。一个Skill在Skillware中包含了AI掌握一个领域所需的全部要素:
# Skillware Skill 的完整结构
skill/
├── manifest.yaml # 定义、Schema和宪法
├── skill.py # 可执行的Python逻辑
├── instructions.md # LLM的"认知地图"
└── test_skill.py # 单元测试与Schema验证
四大支柱:
| Logic(逻辑) | ||
| Cognition(认知) | ||
| Governance(治理) | ||
| Interface(接口) |
跨平台能力: Skillware的最大优势是模型无关——同一个Skill可以在Gemini、Claude、OpenAI、DeepSeek、Ollama等任何模型上运行。
适用场景: 需要在多个AI平台之间复用技能、希望将团队经验固化为可安装包的团队。
四、行为约束工具:给AI画好"安全红线"
能力增强工具让AI变强了,但越强的AI越需要约束。行为约束工具解决的是 "怎么做才稳" 的问题——确保AI生成的代码符合安全规范、性能指标和业务约束。
4.1 Agent Skills规范:Anthropic的开放标准
背景: Agent Skills是Anthropic于2025年12月18日发布的开放标准,由Barry Zhang、Keith Lazuka和Mahesh Murag设计。目前该规范正在多个模型提供商和Agent工具生态中积极演进。
核心机制: Agent在工作时,会加载所有可用Skill的元数据(frontmatter) 。当收到请求时,Agent根据这些元数据决定调用哪个Skill来完成任务。
安全与约束: Agent Skills规范不规定具体的凭证管理方法,但安全处理仍然是关键的安全组件。每个Skill可以通过元数据定义自己的安全边界和约束条件。
4.2 ai-rulez:统一的多平台配置管理
核心理念: ai-rulez不仅是一个配置生成器,它内置了33个领域的规则、Agent和工作流,能够立即建立一个专业的开发基线。
核心能力:
| Rules(规则) | |
| Context(上下文) | |
| MCP服务器 |
核心价值: ai-rulez让团队可以在一个地方定义规则,然后自动生成Claude Code、Cursor、Copilot等不同工具的配置文件。告别"每个工具配一遍"的重复劳动。
五、工具组合模式:从单点工具到完整工作流
单个工具解决单个问题,组合工具才能构建完整的工作流。
5.1 轻量组合:OpenSpec + 任意AI

适合谁: 个人开发者、小团队、预算有限的场景。
特点: 上手快、成本低、不绑定特定AI工具。OpenSpec无需API密钥,配合任意AI(ChatGPT、Claude.ai、Copilot等)即可工作。
5.2 标准组合:OpenSpec + Superpowers + Claude Code("薄编排"黄金组合)

适合谁: 追求工程纪律的团队、Claude Code用户。
特点: OpenSpec定义"做什么",Superpowers定义"怎么做",Claude Code负责"执行",Agent Skills/ai-rulez确保"不越界"。三要素各司其职,形成完整闭环。
5.3 企业组合:Spec Kit + 复合工程 + Skillware

适合谁: 大型团队、多项目并行、需要长期知识积累的企业。
特点: Spec Kit提供企业级的规范管理,复合工程让每一次开发都成为下一次的资产,Skillware确保这些资产可以在不同AI平台之间复用。三者形成"规范→执行→沉淀→复用"的完整闭环。
5.4 三要素组合模式全景对比
| 轻量组合 | ||||
| 标准组合 | ||||
| 企业组合 |
六、本章小结
本章我们系统梳理了AI编程工程化的工具生态:
三要素框架:规范定义(做什么)+ 能力增强(怎么做得好)+ 行为约束(怎么做才稳),三者共同构建可预测的AI编程工作流。
规范定义工具:
- Spec Kit
:GitHub官方工具,82k+ stars,支持25+ AI代理,四阶段严格流程,适合企业级绿地项目 - OpenSpec
:轻量级框架,无需API密钥,灵活动作驱动,适合棕地项目和中小团队 能力增强工具:
- Superpowers
:14个Skill,Process over Prompt,Claude Code官方插件 - 复合工程
:51 Agents + 37 Skills,七步循环,"让下一次更容易" - Skillware
:开源技能注册中心,跨平台复用,AI技能的"包管理器" 行为约束工具:
- Agent Skills
:Anthropic开放标准 - ai-rulez
:33个领域规则,统一多平台配置管理 组合模式:轻量组合(OpenSpec + 任意AI)、标准组合(OpenSpec + Superpowers + Claude Code)、企业组合(Spec Kit + 复合工程 + Skillware),按需选择。
下一章,我们将用OpenSpec从头到尾完成一个真实项目的交付——从规范编写到代码实现,全程不绑定任何特定AI工具。
📌 系列预告
- 第3章
:保姆级教程——用SDD从零到一交付一个完整项目 - 第4章
:祖传代码如何引入SDD?——存量系统改造实战指南 - 第5章
:SDD是银弹还是噱头?——规模化落地、争议与未来展望
如果对本文提到的工具选型有任何疑问,欢迎留言交流。点个关注,不错过后续精彩内容!文末有系列合集目录,可以查看本系列所有文章,建议对AI编程工程化感兴趣的读者收藏起来,方便随时查阅。
夜雨聆风