乐于分享
好东西不私藏

开源 17 万 Star:这个插件让你的 AI 变成你的员工

开源 17 万 Star:这个插件让你的 AI 变成你的员工

AI 工具深度解析

🧠

你雇了个天才程序员但他每天上班第一件事是把昨天的记忆全删了

Superpowers 深度解析 · 17万 Star 的 AI 编程方法论读完你会彻底改变用 AI 写代码的方式

想象一个场景。

你公司来了个新程序员,天才级别的那种。

第一天,你跟他聊了整整一天:项目背景、代码规范、历史遗留坑、你们团队踩过的所有雷……他全部理解,给你一个完美的方案。

你高兴地回家睡觉。

第二天早上,你走进办公室。

他站在门口,笑容满面地伸出手——

天才程序员

您好,我是新来的,请问咱们公司做的是什么业务?

你以为这是段子。

但如果你每天在用 Claude、GPT 或者任何 AI 编程助手写代码,这就是你的真实处境。

每。次。对话。它都在从零认识你。

先说说这有多荒谬

我认识一个后端工程师,他每次打开 Claude Code 的第一件事,是粘贴一段 800 字的”项目背景说明”。

他做了个小本本,专门记这段文字。

他叫这个过程”喂饭”。

他说:“感觉不是 AI 在帮我,是我在伺候 AI。”

这不是他个人问题,这是 AI 大模型的先天架构缺陷。

❗ 技术真相:大语言模型(LLM)本质上是一个无状态函数。你给它输入,它给你输出。会话结束,记忆清零。它不知道你是谁,不记得昨天,不知道项目背景,不知道你踩过哪些坑。每次对话,都是它出生后第一次睁眼。

上下文窗口(Context Window)就是它的”短期记忆”——有多大,能记多少东西。Claude 最大 200K tokens,GPT-4 128K,听起来不少?

但窗口一关,全没了。

这就是为什么你总感觉:跟 AI 聊越久越好用,但第二天又回到原点。

不是 AI 变蠢了。是它又失忆了。

然后呢?大家都是怎么”凑合”的?

面对这个问题,普通用户有三种应对方式:

第一种:忍着。每次重新解释,当成日常,苦中作乐。

第二种:堆上下文。把项目文档、README、代码全丢进去,让 AI 自己看。问题是——token 贵,速度慢,还容易”信息过载”(没错,AI 也会被一堆垃圾信息带跑偏)。

第三种:写个 CLAUDE.md。在项目根目录放一个说明文件,告诉 AI 这个项目的基本规则。稍微好一点,但还是很原始,完全靠人工维护。

然后,有人决定把这个问题彻底解决。

他叫 Jesse Vincent。

一个程序员被逼出来的”超能力系统”

Jesse 是个老程序员,做过键盘(对,就是那种机械键盘)、做过开源项目,是个对工具极其挑剔的人。

2024 年底,他开始认真用 Claude Code 写东西。然后他发现了同样的问题:AI 很强,但用起来像在训练一只每天都会失忆的猫。

他没有选择忍。

他花了几个月时间,写出了 Superpowers。

然后把它开源了。

然后……它在 GitHub 上涨到了 17 万 Star

这是什么概念?很多知名开源项目一辈子都没到这个数。

🚀 截至写稿,Superpowers 在 GitHub 上有 172,000+ Star,支持 Claude Code、OpenAI Codex、Cursor、GitHub Copilot CLI、Gemini CLI 等几乎所有主流 AI 编程工具。

但它到底是什么?

说出来可能让你有点意外——

它不是一个插件,不是一个 App,不是一行神奇的代码。

它是一套方法论。

更准确地说:它是一套”让 AI 像资深工程师一样工作”的完整工作流。

先说 AI 写代码,到底烂在哪里

你有没有遇到过这种情况——

你告诉 AI:”帮我写一个用户登录功能。”

它唰唰唰,给你写了 200 行代码。

你复制粘贴,运行,报错。

你把报错发给它,它修,又报错,它又修……

半小时后,你的代码成了一锅粥,比你自己写还乱。

为什么会这样?

因为 AI 在模拟一个没有任何工程素养的”冲动程序员”。问它什么,它就答什么。让它写代码,它就直接写代码。没有设计,没有验证,没有测试,没有”你确定要这样做吗”的灵魂追问。

⚠️ 真正的软件开发,80% 的时间在思考,20% 的时间在打字。而 AI 默认用 100% 的时间在打字,然后让你用 200% 的时间来救火。

这就是 Superpowers 要解决的核心问题。

它不是让 AI 更聪明,而是让 AI 学会先想清楚再动手

Superpowers 的核心:给 AI 装上”职业素养”

Superpowers 的核心机制叫 Skills(技能)

你可以把它理解成:给 AI 装上了一系列”专业工作手册”。当 AI 要做某件事的时候,它会先查手册,按照手册里规定的流程来,而不是凭直觉乱干。

听起来简单?来看它具体规定了什么——

1

🧠 先聊清楚,再动手(brainstorming)

你让 AI 帮你做功能,它不会直接写代码。它会先问你:你真正想要的是什么?有没有考虑过 A 方案 B 方案?边界条件是什么?就像一个有经验的架构师,会先跟你对齐需求,再动手。

2

📋 给你看得懂的计划(writing-plans)

需求确认后,它会列出实现计划。每个任务 2-5 分钟粒度,有明确的文件路径、代码细节、验证步骤——细到”一个不了解项目背景的初级工程师也能执行”的程度。

3

🔴 先写测试,再写代码(test-driven-development)

这是整个系统的灵魂。强制要求:先写失败的测试,确认它是红的,再写最少的代码让它变绿,再重构。如果发现有代码是在测试之前写的——删掉重写

4

🤖 并行子 Agent 干活(subagent-driven-development)

计划列好了,它会派出多个子 Agent,每人负责一个任务,并行推进。完成后还有两轮审查:一轮查”是否符合规格”,一轮查”代码质量”——像个真正的工程团队。

5

🔍 每步都要 Code Review(requesting-code-review)

每个任务完成后,触发代码审查。问题按严重级别分类,Critical 问题直接阻断——不通过审查,不往下走。

最恐怖的是什么?

这些都是自动触发的。

你不需要记住什么时候该用什么技能,AI 自己会判断:现在该用哪本手册了。

“测试驱动”这件事,为什么这么重要?

很多人听到”先写测试”会皱眉:这不是多此一举吗?我又不是在写航天软件,搞那么严格干什么?

让我说个反直觉的事。

AI 写代码,和人写代码,有一个本质区别:

人写错了,会有点不舒服,会停下来思考。

AI 写错了,它不难受。它会继续写,信心满满地把错误堆成山。

🧪 真实案例

AI 是怎么把 Bug 越修越多的?

有个开发者分享过:他让 AI 帮他修一个 API 接口的返回格式问题。AI 修了,他没测试,继续让 AI 做下一个功能。AI 在新功能里依赖了那个”已修复”的接口……然后两个小时后,他发现接口根本没修好,而新功能已经完全基于错误的假设写完了。推倒重来的时间,是直接修好它的 6 倍。

测试驱动开发(TDD)解决的就是这个问题。

红灯(测试失败)→ 绿灯(测试通过)→ 重构(优化代码)。

每一步都有明确的验证。AI 自己骗不了自己,因为测试结果是客观的

Superpowers 强制执行这个流程。不是建议,是强制。如果 AI 在没有测试的情况下先写了代码?手册里写得很清楚:删掉。重写。

最让人上头的设计:用 Git Worktree 做并行开发

这里有个细节,很多人没注意到,但我觉得是整个系统里最精彩的部分。

普通 AI 编程:在你的工作目录里直接改文件。改坏了?你的代码也坏了。

Superpowers 的做法:每次开始新任务,先创建一个独立的 Git 分支和工作区。AI 在那个隔离的环境里做实验,不影响你的主代码。

而且在开始干活之前,它还会做一件事:

跑一遍所有现有测试,确认基线是干净的。

就像外科手术前要确认手术台是无菌的。

💡 这个设计背后的逻辑:任何工程改动都有副作用。把改动隔离在独立环境里,出了问题随时可以丢弃,不污染主线。多个 Agent 并行工作也不会互相干扰。

它支持的平台,多到有点夸张

你以为 Superpowers 只支持 Claude Code?来看看它的兼容列表:

🤖

Claude Code

官方插件市场直接安装

🟢

OpenAI Codex

CLI 版和 App 版都支持

Cursor

Plugin Marketplace 安装

🐙

GitHub Copilot CLI

命令行直接安装

Gemini CLI

Google 的 AI 命令行

OpenCode

新兴 AI 编程工具

不管你用哪个,装上去,它都能工作。

它不站队,它给所有人用。这也是它能爆到 17 万 Star 的原因之一。

安装有多简单?

如果你用 Claude Code,两行命令:

# 方法一:官方插件市场(最简单)

/plugin install superpowers@claude-plugins-official

# 方法二:Superpowers 自己的市场

/plugin marketplace add obra/superpowers-marketplace

/plugin install superpowers@superpowers-marketplace

安装完,重启,就完事了。你不需要学习任何新的命令,不需要改变任何习惯。

你该怎么跟 AI 说话还怎么说,Superpowers 在背后自动判断:现在该用哪个技能了。

✅ 真实用户反馈(来自 GitHub Issues 和 Discord):装了 Superpowers 之后,Claude 第一次能连续自主工作两个小时而不偏离方向。而之前,它平均 15 分钟就开始”漂移”了。

说说最被低估的功能

大部分人关注 Superpowers 的工作流,但我觉得最被低估的,是它的调试技能:systematic-debugging

普通 AI 调试 Bug 是什么风格?给它一个报错,它给你一个修法,试一下,没好,再给它,它给另一个修法……像在抽盲盒。

Superpowers 规定的调试流程是这样的:

🔎 四阶段根因分析:第一阶段:重现问题。先确认 Bug 是真实存在且可重现的,不要凭印象修。第二阶段:缩小范围。用二分法、日志、断点,一层层定位问题出在哪个模块。第三阶段:根因追踪。不只找表象,要找”为什么会这样”的深层原因。第四阶段:防御性修复。修好了还不够,要想想同类问题在哪里可能还存在,一并处理。

这个流程,不是 AI 发明的。这是软件工程几十年总结出来的最佳实践。Superpowers 把它写成了 AI 的”工作手册”,让 AI 强制执行。

你以为在用 AI 调 Bug,其实 AI 在用高级工程师的思路帮你调 Bug。

它的本质是什么?讲点真话

说到这里,我想说一个可能让你有点意外的结论。

Superpowers 的本质,不是一个技术产品。

它是一种软件工程哲学的落地实现。

TDD(测试驱动开发)——有几十年历史了。YAGNI(你不需要它)——极限编程的核心原则。DRY(不要重复自己)——每个程序员都背过的口诀。

这些东西,人类程序员学了几十年,还是经常犯错。

但 AI 不一样。AI 没有情绪,没有惰性,没有”这次凑合一下”的心态。你告诉它规则,它就严格执行规则。

Jesse 做的事情,是把人类几十年积累的最佳实践,翻译成 AI 能理解和遵守的语言,然后让 AI 帮你执行。这才是真正厉害的地方。

🤔 换个角度想:过去我们一直在让 AI 变得更聪明,但 Superpowers 走了一条完全不同的路——不改变 AI 的能力上限,只改变 AI 的工作方式。结果发现,这条路反而更有效。

最后,一个让你后背发凉的问题

2023 年,AI 编程助手刚出现的时候,大家的问题是:AI 能帮我写代码吗?

2024 年,问题变成了:AI 写的代码靠谱吗?

2025 年,问题变成了:我怎么让 AI 按照工程师的方式工作?

你发现了吗?这个问题的演进,其实是在说:AI 的能力已经不是瓶颈了。

真正的瓶颈,是我们用 AI 的方式。

Superpowers 爆到 17 万 Star,不是因为它做了什么技术奇迹,而是因为它提前回答了一个大多数人还没想清楚的问题:

当 AI 有能力做到 80 分的时候,那最后的 20 分,靠什么?

靠工程素养。靠流程规范。靠验证机制。靠”慢下来想清楚”的习惯。

这些东西,人类程序员练了一辈子。

而现在,你可以把它们装进 AI,两行命令,免费的。

那些用 AI 用得比你好的人不是因为他们的 AI 更聪明是因为他们给 AI 装上了更好的工作方式

📌 一句话说清楚 Superpowers

它不是让 AI 更聪明的工具它是让 AI 像一个真正有经验的工程师一样工作的方法论TDD + 需求对齐 + 计划驱动 + 并行 Agent + 代码审查全部自动触发,你只需要告诉它你想做什么

工具从来都不是差距的来源用工具的方式,才是。

关注:给点知识 公众号,每天学点新知识 🧠

公众号战略合作作者:人工智能研究院-李博士