一张图看懂AI编程工程化——SDD工具、技能框架怎么选

当AI编程工具从"一个"变成"一堆"，选型本身就成了一个工程问题。

在上篇文章《AI编程越用越累？——从Vibe Coding到SDD的范式革命》中，我们看到了AI编程"出码率≠交付率"的残酷真相，并认识了规范驱动开发（SDD）这一新范式。SDD的核心公式是 SDD = 规范（结构化） + AI（生成） + 验证（自动化） ，但仅有理念是不够的——我们需要具体的工具来落地。

如果你对SDD的基本概念还不熟悉，建议先查看文末合集目录中的系列第一篇文章，了解从Vibe Coding到SDD的范式转变。本篇我们将深入工具层面，看看目前有哪些成熟的工具可供选择。

一、AI编程的工程化困境

1.1 从"缺工具"到"挑花眼"

2024年之前，AI编程开发者的困扰是"没有好用的工具"。2025年之后，困扰变成了"工具太多，不知道怎么选"。

GitHub Copilot带来了代码补全，Cursor带来了对话式编程，Claude Code带来了自主Agent，OpenCode带来了开源自由，Superpowers带来了流程纪律，Spec Kit带来了规范驱动……每一个工具都解决了一个特定问题，但当工具数量超过3个，选型和组合本身就成了一场新的技术债。

核心矛盾： AI编程工具的能力是碎片化的——A工具擅长代码生成，B工具擅长流程管控，C工具擅长规范定义。开发者需要在多个工具之间反复切换，上下文丢失、配置冲突、工作流割裂成为常态。

1.2 三要素模型的提出

为了解决这一困境，行业逐渐形成了 "规范定义 — 能力增强 — 行为约束" 的三要素工程化框架。

三个要素各司其职：

要素	核心问题	典型工具	价值
规范定义	做什么？	Spec Kit、OpenSpec	将模糊需求转化为可执行规范
能力增强	怎么做得好？	Superpowers、Compound Engineering	扩展AI的复杂任务处理能力
行为约束	怎么做才稳？	Agent Skills、ai-rulez	确保代码质量与安全合规

三个要素不是孤立的，而是层层递进、相互依存的关系：规范定义决定了"目标是什么"，能力增强决定了"执行有多强"，行为约束决定了"边界在哪里"。三者共同构成一个完整的AI编程工程化闭环。

二、规范定义工具：给AI画好施工蓝图

规范定义工具解决的是 "做什么" 的问题。它们通过结构化的规范文档，将模糊的业务需求转化为AI可精确理解并执行的指令。

目前最主流的两个规范定义工具是 GitHub Spec Kit 和 OpenSpec。

2.1 GitHub Spec Kit：企业级规范驱动开发工具包

官方定位： Spec Kit是GitHub开源的规范驱动开发（SDD）工具包，旨在帮助开发团队在编写任何代码之前，先通过结构化的规范文档明确"要构建什么"。

核心数据： Spec Kit在GitHub上已获得超过82,000颗星，支持Claude Code、GitHub Copilot、Cursor、Gemini CLI等超过25种AI代理开箱即用。

核心工作流： Spec Kit实现了标准的SDD四阶段流程：

核心组件：

宪法（Constitution）
：定义项目的核心原则、技术约束和编码规范
规范（Specification）
：描述功能需求、用户故事和验收标准
计划（Plan）
：技术设计方案和实施步骤
任务（Tasks）
：可执行的开发任务清单

适用场景： 绿地项目、大型团队、需要严格流程管控的企业级开发。

2.2 OpenSpec：轻量级规范驱动开发框架

官方定位： OpenSpec是一个轻量级的规范驱动开发框架，核心理念是"在写任何代码之前，先让人类和AI就构建什么达成一致"。无需API密钥即可使用。

核心工作流： OpenSpec采用灵活的动作驱动（Action-based）工作流：

与Spec Kit的刚性四阶段不同，OpenSpec采用了更灵活的动作驱动模型：

提案（Propose）
：基于想法生成结构化规范
执行（Apply）
：依据规范驱动AI生成代码
归档（Archive）
：将完成的规范归档为项目资产

OpenSpec的核心特点是 "工件图自动跟踪状态"——所有规范工件之间的依赖关系和状态变化由系统自动管理，开发者可以随时编辑任何工件，无需担心破坏工作流的完整性。

适用场景： 棕地项目、敏捷团队、需要渐进式引入SDD的中小团队。

2.3 Spec Kit vs OpenSpec：如何选型？

对比维度	GitHub Spec Kit	OpenSpec
开源	✅ 是（82k+ stars）	✅ 是
重量级	重（完整四阶段流程）	轻（灵活动作驱动）
学习曲线	陡（需理解宪法-规范-计划-任务）	平（提案-执行-归档三步）
棕地支持	弱（主要为绿地设计）	强（灵活适配现有项目）
流程灵活性	低（阶段严格顺序）	高（随时编辑任何工件）
API密钥	需要（依赖AI代理）	不需要
团队规模	大团队、企业级	中小团队、个人开发者
AI代理支持	25+种	Claude Code、Codex CLI等

选型建议：

选Spec Kit
：如果你在做一个全新的绿地项目，团队规模较大，需要严格的流程管控和审计追踪
选OpenSpec
：如果你在维护一个现有系统（棕地项目），团队规模较小，希望快速上手、灵活迭代

三、能力增强工具：给AI装上"工程大脑"

规范定义工具解决了"做什么"的问题，但AI在执行时仍然可能"能力不足"——无法处理复杂的多步骤任务、缺乏工程流程意识、不知道何时该做什么。能力增强工具正是为解决这个问题而生。

3.1 Superpowers：给AI请一个"项目经理"

核心理念： "Process over Prompt"（流程大于提示词）。Superpowers不是让AI更聪明，而是让AI更守规矩——像给AI请了一个"项目经理"。

背景： Superpowers由Jesse Vincent（GitHub账号obra）开发，是Claude Code的官方插件。Jesse被认为是"最有创造力的编码Agent使用者之一"，他将自己积累的大量"编程技巧"打包成了这个插件。

安装方式：

/plugin marketplace add obra/superpowers-marketplace
/plugin install superpowers@superpowers-marketplace

技能全景： Superpowers当前内置14个核心技能，覆盖软件开发的完整生命周期：

类别	Skill名称	功能描述
需求澄清	brainstorming	苏格拉底式提问，将模糊想法转化为清晰需求
计划制定	writing-plans	将需求转化为可执行的实施计划
执行管理	executing-plans	按计划逐项执行，实时更新进度
开发执行	subagent-driven-development	子代理驱动开发，并行处理多任务
质量保障	test-driven-development	强制先写测试，红-绿-重构循环
系统调试	systematic-debugging	结构化调试流程
代码审查	requesting-code-review	自动生成PR描述和审查清单
根因追踪	root-cause-tracing	系统化追溯Bug根源

技术亮点： Superpowers的Skill不仅是文本指令，还包含可执行的流程图（Graphviz DOT图）——Claude Code能够直接解析这些图作为工作流指令。例如在root-cause-tracing技能中，包含了一个完整的决策流程图，指导AI判断何时追溯、何时停止。

适用场景： 已在使用Claude Code的开发者，希望为AI注入工程纪律和流程意识。

3.2 复合工程（Compound Engineering）：让每一次开发都成为下一次的资产

核心理念： "让下一次更容易"（Make the next one easier）。传统开发积累技术债务——功能越加越多，代码越来越难改。复合工程反过来：今天做的每一件事，都应该让明天的事变得更容易。

背景： 复合工程由Every团队开发——这家公司同时运营6款产品（Cora、Monologue、Proof、Sparkle、Spiral和Every.to），主要靠单人工程团队支撑。这个项目就是他们在实际项目中一点点摸索出来的系统化方法。

核心数据： 复合工程插件包含 51个Agent 和 37个Skill，支持Claude Code、Cursor、Codex、GitHub Copilot等多种工具。

七步工作流循环：

核心命令：

命令	功能
`/ce-brainstorm`	交互式Q&A，产出需求文档
`/ce-plan`	将需求转为详细实施计划
`/ce-work`	在隔离环境中执行计划
`/ce-code-review`	多Agent并行审查（安全、性能、测试等多个维度）
`/ce-compound`	将本次学习的经验固化，供下次复用
`/ce-strategy`	维护STRATEGY.md，让战略决策贯穿所有功能
`/ce-debug`	系统化Bug调查与修复

与Superpowers的核心区别：

对比维度	Superpowers	复合工程
核心理念	Process over Prompt（流程纪律）	Make the next one easier（知识复用）
关注点	当前任务的执行质量	跨任务的知识积累
技能数量	14个Skill	37个Skill + 51个Agent
核心机制	流程编排	经验固化与复用
设计哲学	给AI套上"纪律"	给AI装上"记忆"

3.3 Skillware：AI技能的"包管理器"

核心理念： 正如apt-get为Linux安装软件、pip为Python安装库，Skillware为AI代理安装"知识"。

背景： Skillware是一个开源的技能框架和注册中心，将技能视为可安装的内容，将能力与智能解耦。一个Skill在Skillware中包含了AI掌握一个领域所需的全部要素：

# Skillware Skill 的完整结构
skill/
├── manifest.yaml        # 定义、Schema和宪法
├── skill.py             # 可执行的Python逻辑
├── instructions.md      # LLM的"认知地图"
└── test_skill.py        # 单元测试与Schema验证

四大支柱：

支柱	内容	作用
Logic（逻辑）	可执行的Python代码	确定性执行，非动态生成
Cognition（认知）	系统指令和认知地图	让AI理解"为什么"和"何时"
Governance（治理）	宪法和安全边界	规定AI"不能做什么"
Interface（接口）	标准化Schema	适配Gemini、Claude、Ollama、GPT等任何模型

跨平台能力： Skillware的最大优势是模型无关——同一个Skill可以在Gemini、Claude、OpenAI、DeepSeek、Ollama等任何模型上运行。

适用场景： 需要在多个AI平台之间复用技能、希望将团队经验固化为可安装包的团队。

四、行为约束工具：给AI画好"安全红线"

能力增强工具让AI变强了，但越强的AI越需要约束。行为约束工具解决的是 "怎么做才稳" 的问题——确保AI生成的代码符合安全规范、性能指标和业务约束。

4.1 Agent Skills规范：Anthropic的开放标准

背景： Agent Skills是Anthropic于2025年12月18日发布的开放标准，由Barry Zhang、Keith Lazuka和Mahesh Murag设计。目前该规范正在多个模型提供商和Agent工具生态中积极演进。

核心机制： Agent在工作时，会加载所有可用Skill的元数据（frontmatter） 。当收到请求时，Agent根据这些元数据决定调用哪个Skill来完成任务。

安全与约束： Agent Skills规范不规定具体的凭证管理方法，但安全处理仍然是关键的安全组件。每个Skill可以通过元数据定义自己的安全边界和约束条件。

4.2 ai-rulez：统一的多平台配置管理

核心理念： ai-rulez不仅是一个配置生成器，它内置了33个领域的规则、Agent和工作流，能够立即建立一个专业的开发基线。

核心能力：

能力	说明
Rules（规则）	AI必须做什么、不能做什么——安全标准、编码规范
Context（上下文）	AI应该知道什么——架构文档、领域知识
MCP服务器	内置35+工具的MCP服务器，让AI助手管理自己的治理

核心价值： ai-rulez让团队可以在一个地方定义规则，然后自动生成Claude Code、Cursor、Copilot等不同工具的配置文件。告别"每个工具配一遍"的重复劳动。

五、工具组合模式：从单点工具到完整工作流

单个工具解决单个问题，组合工具才能构建完整的工作流。

5.1 轻量组合：OpenSpec + 任意AI

适合谁： 个人开发者、小团队、预算有限的场景。

特点： 上手快、成本低、不绑定特定AI工具。OpenSpec无需API密钥，配合任意AI（ChatGPT、Claude.ai、Copilot等）即可工作。

5.2 标准组合：OpenSpec + Superpowers + Claude Code（"薄编排"黄金组合）

适合谁： 追求工程纪律的团队、Claude Code用户。

特点： OpenSpec定义"做什么"，Superpowers定义"怎么做"，Claude Code负责"执行"，Agent Skills/ai-rulez确保"不越界"。三要素各司其职，形成完整闭环。

5.3 企业组合：Spec Kit + 复合工程 + Skillware

适合谁： 大型团队、多项目并行、需要长期知识积累的企业。

特点： Spec Kit提供企业级的规范管理，复合工程让每一次开发都成为下一次的资产，Skillware确保这些资产可以在不同AI平台之间复用。三者形成"规范→执行→沉淀→复用"的完整闭环。

5.4 三要素组合模式全景对比

组合模式	规范定义	能力增强	行为约束	适合场景
轻量组合	OpenSpec	任意AI	人工审查	个人/小团队
标准组合	OpenSpec	Superpowers + Claude Code	Agent Skills / ai-rulez	工程化团队
企业组合	Spec Kit	复合工程	Skillware	大型企业

六、本章小结

本章我们系统梳理了AI编程工程化的工具生态：

三要素框架：规范定义（做什么）+ 能力增强（怎么做得好）+ 行为约束（怎么做才稳），三者共同构建可预测的AI编程工作流。
规范定义工具：

Spec Kit
：GitHub官方工具，82k+ stars，支持25+ AI代理，四阶段严格流程，适合企业级绿地项目
OpenSpec
：轻量级框架，无需API密钥，灵活动作驱动，适合棕地项目和中小团队

能力增强工具：

Superpowers
：14个Skill，Process over Prompt，Claude Code官方插件
复合工程
：51 Agents + 37 Skills，七步循环，"让下一次更容易"
Skillware
：开源技能注册中心，跨平台复用，AI技能的"包管理器"

行为约束工具：

Agent Skills
：Anthropic开放标准
ai-rulez
：33个领域规则，统一多平台配置管理

组合模式：轻量组合（OpenSpec + 任意AI）、标准组合（OpenSpec + Superpowers + Claude Code）、企业组合（Spec Kit + 复合工程 + Skillware），按需选择。

下一章，我们将用OpenSpec从头到尾完成一个真实项目的交付——从规范编写到代码实现，全程不绑定任何特定AI工具。

📌 系列预告
第3章
：保姆级教程——用SDD从零到一交付一个完整项目
第4章
：祖传代码如何引入SDD？——存量系统改造实战指南
第5章
：SDD是银弹还是噱头？——规模化落地、争议与未来展望

如果对本文提到的工具选型有任何疑问，欢迎留言交流。点个关注，不错过后续精彩内容！文末有系列合集目录，可以查看本系列所有文章，建议对AI编程工程化感兴趣的读者收藏起来，方便随时查阅。