gstack 确实很强,但我卸载了

大家好，我是飞飞。

gstack 我用了几周，今天卸了。

不是因为它不好——恰恰相反，它太强了，强到把我的 Claude Code 拖慢了。

装上 gstack 的第一天

Garry Tan，YC 的 CEO，把自己用 Claude Code 写了 60 万行代码的工作流开源了。

23 个 slash commands，每个对应一个角色——CEO、设计师、工程经理、QA、安全官、发布经理。

你装上 gstack，相当于在终端里养了一个虚拟团队。

GitHub 68,000 多个 star。社区里到处在讨论。我看了一圈文档，觉得这个思路很对——让 AI 不只是写代码，而是从产品决策开始介入。

装完之后我跑了第一个任务：用 /office-hours 讨论一个新功能的需求。

体验确实好。

它会从 CEO 视角问你"这个功能的用户价值是什么"，然后切到工程视角问"技术上有什么约束"，最后从 QA 视角问"上线后怎么验证"。

一套下来，需求比我自己想的清楚多了。

问题是后来出现的。

我的 Claude Code 开始变慢了

装 gstack 之前，我已经有 superpowers 的 14 个 skill，加上自己写的十几个 content 类 skill。

加上 gstack 的 23 个，总数直接到了 50+。

第一个信号是 /context 命令。跑了一下，Skills 那一行从 1k tokens 变成了 4.2k。

加上 System tools、Memory files、Custom agents，开局就吃掉了 30k tokens。200k 的 context 窗口，还没开始干活就去了 15%。

第二个信号是响应速度。以前一个简单任务——改个 CSS、加个字段——Claude 直接动手，两三秒给方案。装了 gstack 之后，它开始犹豫了。

终端里经常看到它在"思考"该调用哪个 skill。

一个改按钮颜色的需求，它先跑了 /office-hours 的判断流程，然后考虑要不要跑 /design-consultation，最后才开始写代码。

三十秒的活变成了三分钟。

第三个信号是 skill 冲突。superpowers 有一个 brainstorming skill，gstack 有一个 /office-hours。两个都想在任务开始时介入。

Claude 有时候先跑 brainstorming 再跑 /office-hours，有时候反过来，有时候两个都跑一遍。结果是同样的问题被问了两次。

Claude Code 的文档里有一句话：Skills and subagents override by name: when the same name exists at multiple levels, one definition wins based on priority. 名字不同的 skill 不会被优先级覆盖——它们会同时生效，然后打架。

一个研究者的 GitHub Issue 让我彻底想明白了

GitHub Issue #39686，标题是：claude.ai Skills and Cowork plugins silently injected into Claude Code context — no opt-out, ~6k tokens wasted per session。

发帖人是一个 AI 意识研究者，他有 80 多个 custom skills。

他发现 claude.ai 上的 skills 和 Cowork 插件被静默注入到了 Claude Code 的 context 里。

他没装、没选、没同意，每个 session 凭空多了 69 个 skill 定义，6000 个 tokens 就这么没了。

他说了一句话让我印象很深：

"Every token of context matters. Losing 6,000 tokens per session to uninvited duplicates is not a minor annoyance — it's a material impact on my ability to work."

Claude Code 创始人 Boris Cherny 也公开承认了这个问题的一个维度：性能退化的原因之一是

"People pulling in a large number of skills, or running many agents or background automations, which sometimes happens when using a large number of plugins."

Reddit 上有人更直接：

"I just wonder how many users with these problems use these 600 skill 463 custom slash command 74 custom Agent framework plugins."

600 个 skill。这不是夸张，是真的有人装到了这个数字。

Skill 是怎么吃 token 的

理解这个问题需要知道 Claude Code 的 skill 加载机制。

每个 skill 有两部分。第一部分是 description。

一行描述，大约 10 个 tokens，每次你发消息都会被包含在 context 里。

50 个 skill 的 description 就是 500 tokens，每条消息都在。

第二部分是 skill 正文。当 Claude 判断需要使用某个 skill 时，会读取完整内容。一个 skill 正文通常 500 到 2000 tokens。

gstack 的某些角色 skill 内容更长，因为它要注入完整的角色 prompt 和决策框架。

一个执行层 skill 消耗 10K+ tokens 的情况在 gstack 里不少见。

MindStudio 有一篇文章专门讲了 Context Rot——上下文腐烂。

核心观点是：即使你没超过 200K token 的窗口限制，skill 文件的膨胀也会导致注意力稀释。

研究表明，模型处理 context 中间位置的信息不如边缘位置可靠。

你塞进去的 skill 越多，每个 skill 被正确理解和执行的概率就越低。

这就解释了为什么我装了 50+ skill 之后，Claude 经常在两个功能相近的 skill 之间犹豫。它的注意力被稀释了。

我的 30 skill 原则

卸载 gstack 之后，我重新整理了自己的 skill 列表。

superpowers 的 14 个 skill 保留了——brainstorming、planning、TDD、debugging、code review 这些都是执行层的刚需。

我自己写的 content 类 skill 保留了 7 个——researcher、writer、polisher、training、artist、distributor、director。

这是我的博客流水线，每个 skill 都在频繁使用。

gstack 的 23 个 skill 全部卸载。

总数从 50+ 降到了 28 个。

效果立竿见影。/context 显示 Skills 回到了 1.2k tokens。响应速度恢复了。

Claude 不再在多个决策 skill 之间犹豫了。一个改按钮颜色的需求，它直接改，不绕弯。

我不是说 gstack 不好。gstack 的 /office-hours 和 /plan-ceo-review 确实能帮你在动手前想清楚。

但对我来说，superpowers 的 brainstorming 已经覆盖了这个需求。两套决策框架叠在一起，结果不是 1+1=2，是 1+1=0.5。

什么时候该装，什么时候该拆

如果你是独立开发者或者小团队创始人，需要 AI 帮你从产品决策层面思考，gstack 确实值得试。/office-hours 一个人就够用。

但如果你已经有了自己的工作流——已经有了 brainstorming skill、有了 planning skill、有了 code review skill——再装 gstack 大概率是减分。

因为你引入了 23 个新的决策点，每个都在争夺 Claude 的注意力和你的 token 预算。

我的建议是这样：

把你所有 skill 的数量控制在 30 个以下。打开 /context 看一眼 Skills 占了多少 tokens。如果超过 2k，你该开始做减法了。

每个 skill 问自己一个问题：过去一周我用过它吗？如果没有，卸载。

如果两个 skill 功能相近——比如都是在任务开始时做需求澄清——只留一个。

Claude 在两个相似 skill 之间做选择的成本，比你自己选一个然后坚持用它的成本高得多。

skill 的价值在于"教 AI 一个工作流"。但教得太多，AI 反而不知道该先听谁的。

就像一个实习生，你给他三页纸的操作手册他能记住，给他三十页他就开始翻来翻去了。

gstack 很强。但我的 Claude Code 只需要一支精锐小队，不需要一个完整的虚拟公司。

你装了多少个 skill？跑过 /context 看过 token 占用吗？评论区聊聊你的 skill 管理经验。