本文由差异视界公众号出品,转载请注明出处。
一句话结论
AI 编程工具已经卷到「各司其职」的阶段——Claude Code 负责写,OpenSpec 负责规范,Superpowers 负责流程纪律,OpenClaw/Hermes 负责自主执行,Harness 负责企业级 CI/CD。选对组合,效率翻倍;选错组合,AI 反而添乱。
一、先认识全家桶:每个工具到底是什么?
1.1 Claude Code —— 核心编码引擎
Claude Code 定位
出品方:Anthropic
类型: 命令行 AI 编码助手(Coding Agent)
核心能力:读代码库、写代码、调试、执行命令、提交 PR
近期版本:2.1.92(2026 年 4 月)Claude Code 是整个工具链的基础执行层。你可以把它理解为一个「超级会写代码的命令行助手」——它读得懂你的整个代码库,能自己跑测试、改文件、提 PR。
但它有个问题:太自由了。你让它写个功能,它可能写得天花乱坠,但不符合你的团队规范,也没按你想要的流程来。
这就是 OpenSpec 和 Superpowers 要解决的问题。
1.2 OpenSpec —— 让 AI 按「规格说明书」写代码
OpenSpec 定位
核心概念:Spec-Driven Development(SDD,规格驱动开发)
解决问题:AI 编码的「不可预测性」
核心流程:Proposal(提案)→ Apply(执行)→ Archive(归档)OpenSpec 的本质是给 Claude Code 套上缰绳。
传统 AI 编码的痛点是:
你:帮我加个用户登录功能
AI:好的(然后写了一堆不规范的代码,没写测试,没考虑边界情况)
你:不是这样的…(重新描述,来回拉扯)用了 OpenSpec 之后:
你:写个提案,描述「用户登录功能」的规格
AI:生成 proposal.md(功能描述、接口定义、测试用例、边界条件)
你:审核 proposal.md,修改确认
AI:按 proposal.md 严格执行,生成代码 + 测试 + 文档关键差异:AI 不再「凭感觉写代码」,而是按规格说明书执行。可预测、可审核、可追溯。
1.3 Superpowers —— 给 AI 装上「工程纪律」
Superpowers 定位
出品方:Jesse Vincent(obra)
类型: AI 编程工作流框架(Skills Framework)
核心理念:Process over Prompt(流程大于提示词)
支持工具:Claude Code、Codex、Cursor
GitHub:约 4 万星Superpowers 解决的是另一个问题:AI 写代码不遵守工程最佳实践。
它内置了一套「技能库」,强制 AI 按软件工程规范来:
| Superpowers 强制技能 | 说明 |
|---|---|
| TDD(测试驱动开发) | 先写测试,再写实现,红-绿-重构循环 |
| 代码审查 | 每次改动自动触发 review |
| 任务拆分 | 大需求拆成小任务,逐步完成 |
| 系统化调试 | 不是瞎猜,而是有步骤地定位问题 |
没有 Superpowers 的 Claude Code:
你:帮我重构这个函数
AI:好的(直接改,没测试,没 review)
有了 Superpowers 的 Claude Code:
你:帮我重构这个函数
AI:
步骤 1:先写测试覆盖当前行为
步骤 2:小步重构,每步跑测试
步骤 3:重构完成后,触发代码审查
步骤 4:生成 review 报告1.4 OpenClaw(养虾)—— 多智能体编排框架
OpenClaw 定位
别称: 「龙虾」(网友戏称,Logo 是龙虾)
类型: 多智能体编排/管理框架
核心能力:调度多个 AI 智能体协同完成任务
擅长: 标准化、流程化任务
记忆: 无跨会话持久记忆OpenClaw 的定位是「管理 AI 干活的工头」。它本身不产出内容,而是编排多个 AI 智能体,让它们分工协作完成复杂任务。
OpenClaw 的典型工作流:
任务:开发一个完整的 Web 功能
→ Agent A:写后端 API(调用 Claude Code)
→ Agent B:写前端组件(调用 Claude Code)
→ Agent C:写测试(调用 Claude Code)
→ Agent D:做代码审查(调用 Superpowers 技能)
→ OpenClaw:协调四个 Agent,汇总结果1.5 Hermes Agent(养马)—— 会自我进化的自主智能体
Hermes Agent 定位
出品方:Nous Research
别称: 「爱马仕」 / 「马」(网友戏称)
类型: 开源自主 AI 智能体框架
核心特性:持久记忆 + 自我进化 + 自主行动
GitHub: 10 万+ 星标(2026 年 2 月发布,连续霸榜)Hermes 和 OpenClaw 最大的区别是:Hermes 会成长。
OpenClaw(养虾):
每次会话独立,干完就完了,下次从头开始
适合:标准化任务、一次性流程
Hermes(养马):
跨会话持久记忆,越用越懂你
从任务中自动提炼技能,自我优化
适合:长期项目、需要积累经验的复杂任务Hermes 的四层记忆系统(前文有详细介绍):
Layer 1:系统提示(冻结,每次注入)
Layer 2:会话归档(SQLite + FTS5 全文检索)
Layer 3:技能库(从任务中提炼的可复用能力)
Layer 4:扩展结构化建模(AI 主动优化记忆结构)1.6 Harness —— 企业级 CI/CD 流程管理
Harness 定位
类型: 企业级 CI/CD 和 DevOps 平台
核心能力:持续集成/持续交付、自动化部署、AI 辅助代码审查
适用场景:企业级研发流程管理、团队协作Harness 不是编码工具,而是把 AI 辅助编码接入企业研发流程的桥梁。它确保 AI 生成的代码经过完整的 CI/CD 流水线验证,才能合并到主分支。
二、工具之间的关系:一张图看懂协作方式
AI 编程工具协作架构(推荐组合)
┌─────────────────────────────────────────────────┐
│ 企业级最佳实践 │
│ OpenSpec(规范) + Superpowers(纪律) │
│ + Harness(CI/CD 流程管理) │
└────────────────┬──────────────────────────────┘
│
┌───────┴────────┐
│ Claude Code │ ← 核心执行引擎
│ (编码助手) │
└───────┬────────┘
│
┌────────────┼────────────┐
▼ ▼ ▼
OpenClaw Hermes (纯 Claude Code)
(养虾) (养马) 用户直用
多 Agent 编排 自主进化核心逻辑:
- Claude Code 是底层执行引擎,其他工具都是「套在 Claude Code 外面的增强层」
- OpenSpec 增强「可预测性」(按规格写代码)
- Superpowers 增强「纪律性」(按工程规范写代码)
- OpenClaw/Hermes 增强「自主性」(不用人盯着就能完成任务)
- Harness 增强「企业级管控」(接入 CI/CD,团队协作)
三、不同场景下的选型建议
3.1 场景一:独立开发者,管理复杂 AI 会话
推荐组合:OpenSpec + Claude Code
为什么选这个组合?
问题:AI 编码最大的痛点是「不可预测」
→ 同一句话,两次输出可能完全不一样
→ 复杂功能需要多轮对话,AI 容易「失忆」
OpenSpec 的解决方案:
→ 先把需求写成规格文档(proposal.md)
→ AI 按规格执行,每次输出可预期
→ 规格文档可以归档复用(archive)
实操示例:
# 第一步:生成提案
claude --model openrouter/anthropic/claude-opus-4-5
> /proposal 实现用户登录功能,支持邮箱+密码
# AI 生成 proposal.md,包含:
# - 功能描述
# - API 接口定义
# - 测试用例清单
# - 边界条件处理
# 第二步:审核提案(人工确认)
vim proposal.md
# 第三步:按提案执行
> /apply proposal.md
# AI 严格按照提案生成代码 + 测试 + 文档
# 第四步:归档(下次类似需求可复用)
> /archive proposal.md3.2 场景二:团队对代码质量要求极高
推荐组合:Superpowers Skills + Claude Code
为什么选这个组合?
问题:AI 生成的代码常常「能跑但不好」
→ 没写测试 or 测试覆盖了低
→ 没做边界处理
→ 代码风格不统一
→ 没有代码审查环节
Superpowers 的解决方案:
→ 强制 TDD(先写测试,再写实现)
→ 强制代码审查(每次改动触发 review)
→ 强制任务拆分(大需求拆小,降低出错概率)
→ 所有规范可定制(.superpowers/ 目录下配置)
实操示例:
# 安装 Superpowers
npm install -g @obra/superpowers
# 在项目根目录初始化
superpowers init
# 配置 Claude Code 使用 Superpowers 技能
# .claude/settings.json:
{
「skills」: [「tdd」, 「code-review」, 「task-decomposition」]
}
# 之后每次让 Claude Code 写代码:
# 它会自动:
# 1. 先写测试(TDD)
# 2. 小步实现,每步跑测试
# 3. 完成后触发代码审查
# 4. 生成审查报告3.3 场景三:需要长期自主处理任务(「数字员工」)
二选一:OpenClaw(执行型)或 Hermes(进化型)
如何选?看你的任务特征:
选 OpenClaw(养虾)的条件:
✅ 任务是标准化的(每次流程类似)
✅ 不需要跨会话记忆
✅ 需要编排多个 AI 协同
✅ 更看重「执行效率」
选 Hermes(养马)的条件:
✅ 任务是复杂、需要深度推理的
✅ 需要 AI 记住你的偏好和风格
✅ 是长期项目,越用越顺手
✅ 更看重「智能进化」两者协同使用(QClaw 模式):
QClaw v0.2.14 的「养虾又养马」模式:
OpenClaw(虾)负责:
- 标准化的子任务(格式化、跑测试、部署)
- 多 Agent 并行调度
Hermes(马)负责:
- 复杂推理和架构设计
- 记住项目上下文和你的偏好
- 从错误中学习和优化
协作流程:
用户 → Hermes(顶层设计 + 任务拆解)
→ OpenClaw(调度多个 Agent 并行执行子任务)
→ Hermes(汇总结果 + 记忆优化)3.4 场景四:企业级应用
推荐组合:OpenSpec + Superpowers + Harness
企业级 AI 辅助编码的完整流程:
1. 需求阶段
OpenSpec:写规格提案(proposal.md)
→ 人工审核规格(确保需求理解正确)
2. 编码阶段
Superpowers + Claude Code:按工程规范写代码
→ 强制 TDD
→ 强制代码审查
→ 强制任务拆分
3. CI/CD 阶段
Harness:接入企业流水线
→ 自动跑测试
→ 自动代码扫描
→ 人工审批后才能合并主分支
4. 归档阶段
OpenSpec:归档规格和实现
→ 下次类似需求可直接复用为什么需要 Harness?
没有 Harness 的风险:
AI 生成的代码 → 直接合并 → 没经过完整测试 → 线上故障
有 Harness 的保障:
AI 生成的代码
→ 提交 PR
→ Harness 自动触发 CI 流水线(编译、测试、扫描)
→ 全部通过 + 人工审批
→ 才能合并主分支四、核心区别速查表
| 维度 | Claude Code | OpenSpec | Superpowers | OpenClaw | Hermes | Harness |
|---|---|---|---|---|---|---|
| 定位 | 编码引擎 | 规格驱动 | 工程纪律 | 多 Agent 编排 | 自主进化 Agent | CI/CD 平台 |
| 核心解决问题 | 写代码 | 不可预测性 | 无工程规范 | 复杂任务编排 | 无持久记忆 | 企业流程管控 |
| 是否依赖 Claude Code | 本身 | 配合 | 配合 | 可配合 | 独立 | 独立 |
| 记忆能力 | 无 | 通过归档 | 无 | 无 | 四层持久记忆 | 无 |
| 适合人群 | 所有人 | 独立开发者 | 高质量团队 | 需要并行任务 | 长期项目 | 企业研发团队 |
| 开源 | 否 | 是 | 是 | 是 | 是 | 否(商业产品) |
| 学习成本 | 低 | 中 | 中 | 高 | 高 | 中 |
五、常见组合方案推荐
方案 A:轻量个人开发
Claude Code(纯用,不套任何其他工具)
适合:偶尔用 AI 辅助,要求不高
方案 B:规范个人开发
OpenSpec + Claude Code
适合:独立开发者,希望 AI 输出可预测
方案 C:高质量团队开发
Superpowers + Claude Code
适合:对代码质量有要求的团队
方案 D:自主任务处理
OpenClaw 或 Hermes(二选一,或都用)
适合:需要 AI 长期自主处理任务的场景
方案 E:企业级完整方案
OpenSpec + Superpowers + Harness
适合:企业研发团队,需要完整流程管控
方案 F:QClaw 双内核(养虾又养马)
OpenClaw + Hermes 并行
适合:既需要标准化执行,又需要智能进化的场景六、总结
AI 编程工具已经形成了清晰的分层体系:
底层执行层: Claude Code(编码能力)
规范层: OpenSpec(让 AI 按规格执行)
纪律层: Superpowers(让 AI 遵守工程规范)
自主层: OpenClaw / Hermes(让 AI 自主完成任务)
流程层: Harness(让 AI 接入企业研发流程)选型的核心原则:
- 如果你烦 AI 「乱写」→ 加 OpenSpec
- 如果你烦 AI 「写不规范」→ 加 Superpowers
- 如果你需要 AI 「自己干活」→ 加 OpenClaw 或 Hermes
- 如果你在企业环境 → 加 Harness
没有「最好」的工具,只有「最合适」的组合。
参考资料:OpenSpec 官方文档、Superpowers GitHub、Hermes Agent 中文社区、Claude Code 官方最佳实践指南(2026 版)
夜雨聆风