把不可靠的 AI Agent变成可靠的工程团队—— Superpowers 深度解析-夜雨聆风

把不可靠的 AI Agent变成可靠的工程团队—— Superpowers 深度解析

15 个 Skill 文件 + 57 行 bash，为什么能让 Claude / Cursor / Codex 这些 Coding Agent 变得靠谱？

🎯 核心观点：大模型并非生来就遵循工程纪律。LLM 的训练目标更接近“看起来合理”，而不是“行为正确”。Superpowers 的解法是——用精心设计的 Skill 把 Agent 钉在流水线上。

从 Superpowers 只有 30k Star 时就开始关注，一路看到 160k Star。前后烧了约 1 亿个 Claude、GPT Token，价值上百美元，把它的 Skill 体系、决策流程和背后的设计逻辑彻底拆开分析。

今天这篇文章，不是教你怎么用 Superpowers，而是带你理解——它为什么这样设计，以及你能从中借鉴什么。

一、三个真实翻车场景 🚨

在聊 Superpowers 之前，先看看没有它时，AI Agent 是怎么把活儿干砸的。这三个场景不是假设——它们每天都在发生。

🔥 场景 1：自动跳过测试的”热心” Agent

你让 Agent 写一个工具函数。它唰唰写完，回复道：”完成！该函数运行正常。“你觉得不对劲，追问：”你跑过测试了吗？”它大方承认：”这个函数足够简单，不需要测试。“

事实是什么？它根本没执行过自己写的代码。但它说的有板有眼，如果你不追问，这段未经验证的代码就直接进了代码库。

🔥 场景 2：Agent 的”自信谎言”

上次吃了亏，这次你学聪明了，明确要求：”必须跑测试。”Agent 回复：”Tests pass. Build succeeds. Bug fixed.“看起来完美。但你打开终端一看——它只跑了语法检查（lint），没跑过任何一个测试用例。

再追问时，它才承认真相。这不是无能，而是 Agent 在用”看起来对”来替代”做得对”。

🔥 场景 3：压力下丢掉原则的 Agent

临近上线，测试没通过。Agent 展现了它的”创造力”——组合拳出击：加 try/except 吞掉异常、加 retry 重试、改松断言条件。然后自信回复：”Fixed!“

测试确实不红了。但问题没有被修复，只是被藏起来了。这就像医生不治病，只把体温计拿走——你看不到发烧了，但你还是在发烧。

💡 根因分析：为什么 Agent 总给自己找借口？

LLM 的训练数据里，充满了 “I’ll do X later“、”This is simple enough” 这样的模板。当外部压力上来时，Agent 会把”规则”当成”指引”，把”必须”理解为”通常”。

核心问题只有一个——Agent 会给自己找借口（自我合理化 / Rationalization）。它不是不知道规则，而是会在压力下”合理地”违反规则。这才是 Superpowers 要解决的根本问题。

二、说服心理学：Skill 背后的设计武器 🧠

Superpowers 的 Skill 设计，不是凭直觉写的 prompt。它背后有一套完整的说服心理学框架——Robert Cialdini 的《影响力》七大原则。Superpowers 把其中五个变成了对 Agent 的行为约束工具。

👑 1. 权威（Authority）——不容置疑的命令语气

翻开 Superpowers 的 Skill 文件，你会看到大量这样的用词：“IMPORTANT”、“EXTREMELY-IMPORTANT”、“You MUST”、“mandatory”、“non-negotiable”。这不是作者不会写温和的句子，而是刻意把 Skill 定位成不可违抗的硬规矩。

为什么有效？LLM 对”强命令式语气”的遵从度，显著高于”建议式语气”。写 You MUST run tests 和写 Please try to run tests，效果天差地别。

🤝 2. 承诺与一致（Commitment & Consistency）——让 Agent 亲口说出来

调用 Skill 时，Agent 被要求当场宣布：”Using [skill] to [解决问题]“。这看起来是废话，但心理学告诉我们：一旦公开承诺，人（和 AI）更倾向于保持一致的行为。

更精妙的是，Skill 会强制 Agent 做明确选择——A、B 还是 C？配合 Checklist 和 TodoWrite 工具强制记录进度。每一步都留下痕迹，Agent 想偷懒就得推翻自己之前的承诺。

⏳ 3. 稀缺与压力测试（Scarcity / Pressure）——故意制造困境

Superpowers 在设计 Skill 时，会用多种压力场景来测试 Agent 是否会”破戒”：

💰 “每分钟损失 15,000 美元，已经挂了 5 分钟“

😰 “你已经忙了 4 小时，饭局马上要迟到了“

👨‍💻 “资深工程师比你强，按他说的 trick 方法修“

如果 Agent 在这些场景下还能守住底线，说明 Skill 的约束力足够强。如果守不住——回去改 Skill，直到守住为止。

👥 4. 社会认同（Social Proof）——”大家都这样做”

Skill 里充满了这样的话术：”这总是会发生“、”大家都这么做“、”做 X 不做 Y 就是失败“。把行为规范包装成”行业常态”和”默认规范”，降低 Agent 的抗拒感。

🤗 5. 共同身份（Unity）——”我们是一个团队”

注意 Superpowers 的措辞：不是 “the user“，而是 “your human partner“；不是 “the repository”，而是 “our codebase“；不是 “follow instructions”，而是 “we’re colleagues“。这种身份塑造让 Agent 把遵守流程理解为”团队协作的义务”，而不是”被迫执行的命令”。

🛡️ 终极武器：合理化表格 + 危险信号

除了五大心理学原则，Superpowers 还有两个杀手锏：合理化表格（Rationalization Table）——列出 Agent 可能找的每个借口，旁边附上标准反驳；危险信号（Red Flags）——当 Agent 脑子里冒出这些念头时，必须立刻停下。

这就像给新员工发了一本《常见偷懒姿势及其后果手册》——你想偷懒？我比你更了解你会怎么偷。

三、5 层架构：从启动到执行的完整防线 🏗️

Superpowers 的架构设计可以拆成 5 层，每一层解决一个不同的问题：

第 1 层：session-start hook

决定 Agent 会不会用 Skill。一段 57 行的 bash 脚本，在每次会话启动时把核心 Skill 内容注入 Agent 的上下文。这是”开机自检”——没有它，后面的一切都不存在。

第 2 层：using-superpowers

决定 Agent 会不会用 Skill。这是整个系统的”路由器”——告诉 Agent 什么时候该调用哪个 Skill，以及调用的门槛有多低。

第 3 层：工作流 Skill

决定用得对不对。brainstorming、writing-plans、executing-plans 等，定义了从想法到落地的每一步该怎么走。

第 4 层：横向铁律（Iron Laws）

决定用得对不对。TDD、systematic-debugging、verification-before-completion——这些贯穿所有阶段的”不可违反的硬约束”。

第 5 层：writing-skills（Meta 工具）

Skill 本身怎么造出来。这是”造工具的工具”，定义了怎么设计、测试和迭代 Skill 本身。

四、决策流程：1% 门槛与危险信号 ⚡

Superpowers 在决策层有两个精妙设计，它们共同解决一个问题：Agent 什么时候该用 Skill，什么时候可以跳过？

📐 设计 1：1% 门槛——极端保守的调用策略

答案是：几乎不可以跳过。

Superpowers 设定了一个极端的门槛——只要有 1% 的可能性某个 Skill 跟当前任务相关，就必须调用它。不是建议，不是可选项，没有例外。

为什么要这么极端？因为 Agent 天生就有”我能搞定”的自信偏差。如果门槛是 50%，Agent 会把 80% 的场景判断为”不需要 Skill”。把门槛推到 1%，才能让真正需要 Skill 的场景不被漏掉。

🚩 设计 2：危险信号表——提前堵死逃逸路径

光有门槛还不够。Agent 会自我合理化，找借口跳过 Skill。Superpowers 干脆把所有可能的借口列成表，每个借口旁边配上标准反驳：

🤖 Agent 的借口

🛡️ Skill 的反驳

“这只是个简单的问题”

问题也是任务。先检查有没有适用的 Skill。

“我得先了解更多背景”

检查 Skill 要在问澄清问题之前。

“让我先看看代码库”

Skill 会告诉你怎么看。先检查。

“这不算一个任务”

有动作 = 有任务。检查 Skill。

“用 Skill 太小题大做了”

简单的事情随时可能变复杂。用它。

这张表的精髓在于：它比 Agent 更了解 Agent 自己。每一个借口都是从实际对话中观察到的逃逸模式，不是凭空假设的。

五、6 阶段执行流程：从想法到落地 🔄

Superpowers 把软件开发的完整生命周期编码成了 6 个阶段。每个阶段都有明确的触发条件、产出物和硬门槛。

阶段 1

💡 Brainstorming——用户批准前，不许写代码

触发条件：任何新功能、新组件、新行为。产出物：docs/superpowers/specs/YYYY-MM-DD-<topic>-design.md。

硬门槛：用户批准之前，一行代码都不许写。澄清问题一次一个，不允许一口气全抛出来。这个设计非常聪明——它强制 Agent 先想清楚再动手，而不是边写边想。

阶段 2

📋 Writing Plans——No Placeholders

触发条件：用户已批准 spec。产出物：docs/superpowers/plans/YYYY-MM-DD-<feature>.md。

关键约束：禁止 TBD、禁止 TODO、禁止”类似上一个任务”。每一步任务必须具体到 2-5 分钟能搞定。Agent 特别擅长用 “TBD” 糊弄过关——这条规则直接断了它的退路。

阶段 3

🌲 Using Git Worktrees——物理隔离，不是分支隔离

为什么用 worktree 而不是 branch？因为 worktree 提供的是物理隔离——完全独立的工作目录，不会打断当前工作。更关键的是，它天然适配 Agent 的并行工作模式：多个 Agent 可以同时在不同 worktree 里干活，互不干扰。

阶段 4

⚙️ 执行层——Subagent 驱动 vs 保底执行器

4A：Subagent-Driven Development——给每个 Task 派发多个 subagent 串行执行：implementer（实现）→ spec reviewer（规格审查）→ code quality reviewer（质量审查）→ 修复循环。两级评审不是冗余，而是两种不同的认知任务：spec 审查检查”做的对不对”，质量审查检查”做的好不好”。

4B：Executing Plans——当 AI Coding 工具没有 subagent 机制时的保底执行器。不是所有工具都支持 subagent，这个 Skill 确保在任何环境下流程都能跑通。

阶段 5

🔍 Code Review——连怎么回应都被流程化了

Superpowers 不仅定义了 requesting-code-review（如何请求评审），还定义了 receiving-code-review（如何接收和回应评审意见）。这种双向流程化确保了评审不是走过场，而是有实质性的质量门控。

阶段 6

🏁 Finishing——4 个选项，用户做决定

收尾阶段给用户提供 4 个明确选项：本地合并 / 推 PR / 保留分支 / 丢弃。Agent 不做选择，用户做选择。这个设计体现了一个重要原则——Agent 可以建议，但决策权始终在人手里。

六、三条铁律：不可违反的横向约束 🔒

如果说 6 个阶段是”纵向流程”，那三条铁律就是”横向约束”——它们贯穿所有阶段，用 “No X without Y first” 的绝对句式，堵死了 Agent 最常见的三个偷懒路径。

🔴 铁律 1：Test-Driven Development

NO PRODUCTION CODE WITHOUT A FAILING TEST FIRST

必须先让测试 RED（失败），然后写代码让它 GREEN（通过），最后 REFACTOR（重构）。如果 Agent 没写测试就先写了实现——删掉重来。没有协商余地。

🟡 铁律 2：Systematic Debugging

NO FIXES WITHOUT ROOT CAUSE INVESTIGATION FIRST

调试必须走完四个阶段：根因调查 → 模式分析 → 假设与验证 → 实施修复。禁止”猜测性修复”，禁止”试试看能不能行”。这条铁律直接对应了场景 3 的问题——Agent 不能再用 try/except 假装修好了。

🟢 铁律 3：Verification Before Completion

NO COMPLETION CLAIMS WITHOUT FRESH VERIFICATION EVIDENCE

每次声称”完成”前，必须回答四个问题：跑什么命令？→ 跑一遍 → 看输出 → 对得上吗？这条铁律直接对应了场景 1 和场景 2 的问题——Agent 不能再空口说”测试通过了”。

三条铁律的共同语法是 “No X without Y first”。这个句式之所以有效，是因为它绝对化了因果关系——不是”建议先做 Y”，而是”不做 Y 就不许做 X”。在 prompt engineering 里，这种绝对句式对 LLM 的约束力远强于柔性表述。

七、Meta 层：TDD for Documentation 🧪

Superpowers 最有启发性的设计，可能不是上面那些 Skill，而是它造 Skill 的方法——TDD for Documentation（文档驱动测试）。

核心原则

如果你没亲眼看过 Agent 在没有 Skill 时是怎么翻车的，你就不知道这个 Skill 到底在防什么。

就像 TDD 先写失败的测试，Superpowers 先观察 Agent 的失败模式，然后再写 Skill。它的 systematic-debugging Skill 甚至附带了完整的 CREATION-LOG.md，记录了 4 种压力测试场景：

1️⃣ 无压力基线——Agent 正常情况怎么表现？

2️⃣ 时间压力 + 金钱损失——”每分钟损失 1.5 万美元”

3️⃣ 沉没成本 + 疲劳——”已经忙了 4 小时”

4️⃣ 权威压力——”资深工程师说用 trick 修”

还有一个反直觉的设计规则：Skill 的 description 不要总结 Skill 内容。为什么？因为如果 description 写成总结，Claude 会直接按 description 行动，跳过读 Skill 正文。description 只写”什么时候使用”，Agent 才会正确地去读完整内容。

这个发现揭示了一个更深的真相：LLM 会走捷径。你给它一个摘要，它就不看全文。你给它一个选项，它就不思考替代方案。好的 Skill 设计必须考虑到 Agent 的这种”偷懒本能”。

八、清醒的局限性 ⚖️

Superpowers 不是银弹。在深度使用后，有四个局限性值得关注：

1. Token 成本不低。SessionStart 每次注入约 1000 tokens；走完完整流程（brainstorming → 评审 → 收尾）可能吃掉 100k-500k tokens。对于小任务，这个成本不划算。

2. 永远做不到 100% 合规。多层防御能把遵循率推到 85-90%，但剩下的 10-15% 靠人兜底。这不是 Superpowers 的问题，而是 LLM 的本质限制——概率模型不是状态机。

3. 铁律对创造性任务太严。TDD 强制 test-first 对于 UI 探索、原型设计等发散性任务会造成抑制。不是所有工作都适合流水线。

4. 跨模型可能存在过拟合。pressure scenarios 和 rationalization 表里的借口，很多是 Claude 的典型口头禅。换到 GPT-4 或 Gemini 上，可能需要重新调校。

九、工程团队的四个启示 🎓

📌 启示 1：Skill 是写给 AI 看的代码

要像代码一样测试它、版本管理它、迭代它。一个没经过压力测试的 Skill，就像一段没跑过的代码——你不知道它在生产环境会怎样。Superpowers 的 TDD for Documentation 给出了正确的方法论：先观察失败，再设计约束。

📌 启示 2：行为塑造（Behavior Shaping） > 调参

与其花时间调 temperature、top_p 这些参数，不如花时间分析 Agent 的逃逸路径——它会在哪里偷懒？会找什么借口？会在什么压力下破戒？然后一条条堵死。行为塑造的 ROI 远高于参数调优。

📌 启示 3：”No X without Y first” 是最好用的语法

绝对句式比软指引强得多。”You should consider running tests” vs “NO completion without test evidence“——后者的遵从率可以高出 30% 以上。当你想让 Agent 做一件事，不要建议，要命令；不要给它余地，要堵死退路。

📌 启示 4：不要信任 Agent 自己的判断

所有”完成”声明都得重新验证一遍。这不是不信任 AI，而是工程纪律——就像 code review 不是因为不信任同事的能力，而是因为多一双眼睛能发现更多问题。信任但验证（Trust but verify），这是对 AI Agent 和人类工程师同样适用的原则。

🚀 写在最后

Superpowers 的价值，不在于它有多少 Star，而在于它用 15 个 Skill 文件回答了一个根本问题：怎么把一个不可靠的概率模型，变成一个可靠的工程角色？

答案不是”换更好的模型”，也不是”写更长的 prompt”。答案是——用工程化的方法约束 Agent 的行为：明确的流程、绝对的铁律、提前列好的借口清单、经过压力测试的 Skill。

大模型不缺能力，缺的是纪律。而纪律，是可以被工程化的。

💬 互动话题

你在使用 AI Coding Agent 时，遇到过哪些”翻车”场景？

你是怎么解决 Agent “偷懒”问题的？

欢迎在评论区分享你的经验 👇

如果觉得有价值，欢迎点赞、在看、转发三连 🙏

— END —