OpenClaw 实战:用 gstack 方法论技能给你的 AI Agent 装上"思考框架"
OpenClaw 实战:用 gstack 方法论技能给你的 AI Agent 装上”思考框架”
你的 AI Agent 能写代码、能读文档,但能不能帮你做商业判断、做根因分析?gstack 四件套就是干这个的。
运行在家庭服务器上的 OpenClaw 是我的 AI 管家。但大部分人仍把它当成一个“能连工具的 ChatGPT”。实际上,普通人早已让它渗透到家庭生活的缝隙里——管理日程、解答疑惑、协调琐事,甚至成为家人之间无声的协作纽带。
思考一个问题:
如果你的 AI 助手不只是”执行命令”,而是能像 YC 合伙人一样帮你拷问产品想法、像 CTO 一样审视架构风险、像资深工程师一样做根因分析——那会是什么体验?
这就是今天要介绍的 gstack 方法论技能四件套。
什么是 gstack?
gstack 是 Garry Tan(YC 现任 CEO,前 Palantir 工程师、Posterous 创始人)开源的一套 Claude Code 技能栈。原话是:
“23个有观点有立场的工具,相当于你的 CEO、设计师、工程经理、发布经理、文档工程师和QA。”
Garry 用这套工具在 60 天内发布了 3 个生产级服务、40+ 功能——兼职,同时全职运营 YC。2026 年的产出是他 2013 年的 810 倍(按逻辑代码变化量计算)。
核心思路很简单: AI 很聪明,但你需要给它一个思考框架,否则它只会说你想听的话。
gstack 开源了 23 个技能,覆盖 6 个角色能力。而下面要介绍的这四套,是被移植到 OpenClaw 平台的版本,通过 ClawHub 可以直接安装使用。
安装:一行命令
要让 OpenClaw 用上这些技能,在终端里运行:
clawhub install gstack-openclaw-office-hours gstack-openclaw-ceo-review gstack-openclaw-investigate gstack-openclaw-retro
这条命令会从 ClawHub[1] 下载四个技能包,自动安装到你的 OpenClaw 技能目录。
装完之后,在飞书/Telegram/Discord 里直接对你的 Agent 说:
/office-hours 我想做一个 AI 技术公众号
它就会自动调用对应的技能。
如果你想用 Garry Tan 的原版,去他的 GitHub[2] 按照 Claude Code 的 setup 配置就行。OpenClaw 版是社区移植,交互方式不一样但方法论一致。
四件套详解
① 🎯 Office Hours(产品追问)
一句话:让你的 AI 变成 YC 合伙人。
当你有了一个产品想法,想找人聊聊,一般的 AI 会怎么说?
“听起来不错,你可以试试……”
好的 AI 会怎么做?gstack-office-hours 会问你六个问题:
-
需求真实性 — 这东西真的有人需要吗? -
现状诊断 — 用户现在怎么解决这个问题的? -
最痛的点 — 你最确定的用户是谁?他有多痛? -
最小切口 — 第一个版本的最小功能集是什么? -
观察验证 — 你怎么判断你做对了? -
未来匹配 — 你的能力为什么适合做这件事?
它有两个模式:
-
创业模式 — 犀利的六问,适合想认真做产品的人 -
构建者模式 — 温和的头脑风暴,适合兴趣项目、黑客松
适用场景: 你想做一个新产品/公众号/工具,但不确定方向对不对
在飞书里说: “/office-hours 帮我想想这个想法”
② 👑 CEO Review(战略审视)
一句话:给你的计划做一次”压力测试”。
当你有了初步方案,想看看有没有漏洞——普通的 AI 会说”方案看起来不错”。gstack-ceo-review 会怎么做?
它会以四种模式审你的计划:
|
|
|
|
|---|---|---|
| 扩张(EXPANSION) |
|
|
| 选择性扩张 |
|
|
| 维持范围 |
|
|
| 缩减范围 |
|
|
不管哪种模式,它都会挑战你的前提假设——”为什么你觉得用户会付钱?””这个时间表你有数据支撑吗?”
适用场景: 方案写好了,发之前让 AI 帮你审视一遍
在飞书里说: “/plan-ceo-review 帮我审一下这个计划”
③ 🔍 Investigate(根因分析)
一句话:你的 AI 调试工程师。
代码出 bug 了,系统崩了,数据对不上了——你问 AI 为什么,它通常会:
“看起来像是 XXX 的问题,你可以试试 YYY。”
gstack-investigate 用的是四阶段调试法,不猜、不跳步:
阶段 1:现场还原 → 明确症状:什么坏了?什么时候坏的?影响范围多大?阶段 2:假设生成 → 列出所有可能的原因,不急着排除任何一个阶段 3:验证 → 逐个排除假设,用数据说话,不靠直觉阶段 4:修复+验证 → 最小的改动,确认修复,防止复发
这个技能的核心价值:它不会让你”试试重启”。 它会带着你一步步推理,直到找到真正的根因。
适用场景: 遇到线上故障、数据异常、用户反馈的 bug
在飞书里说: “/investigate 这个接口最近总是超时”
④ 📊 Retro(工程复盘)
一句话:每周自动生成的工程周报。
这个技能会自动分析你的 Git 提交历史、工作模式、代码质量指标,生成结构化的复盘报告。
它能发现什么?
-
这周提交了多少代码?节奏稳定吗? -
有哪些反复出现的 bug 模式? -
代码审查质量怎么样? -
团队协作有没有瓶颈?
适用场景: 每个周五的工程复盘
在飞书里说: “/retro 帮我看一下这周的代码回顾”
实际使用感受
我在家庭服务器上跑了这几套技能一段时间,最深的感受是:
AI 的能力上限不是由模型决定的,是由交互框架决定的。
同样的 DeepSeek V4 / Claude Opus,你直接问”这个想法怎么样”,和通过 /office-hours 调用结构化追问,得到的回答质量完全是两个层次。
前者给你一堆”听起来不错”的正确废话,后者会逼你思考自己都没想过的问题。
安装之后
装完四件套之后,推荐你做一个动作:
在你的 OpenClaw 工作目录的 AGENTS.md 里加上路由规则,这样你的 Agent 看到相关问题时会自动调用对应的技能:
## Skill routing- 产品想法/头脑风暴 → /office-hours- 计划/战略审视 → /plan-ceo-review- 故障/调试 → /investigate- 周复盘 → /retro
不用记命令,自然语言触发就行。
尾巴
gstack 这套方法论让我重新理解了”AI 技能”的意义。技能不只是”能做什么”,更是”怎么思考”。
当你给 AI 装上了结构化思考的框架,它就不再只是一个”更快的搜索引擎”,而是一个真的能帮你做决策的伙伴。
从 ClawHub 装一套试试,花不了五分钟。
发自我的家庭服务器 🦉
#OpenClaw #gstack #AI技能 #城里城外
引用链接
[1]ClawHub: https://clawhub.ai
[2]GitHub: https://github.com/garrytan/gstack
夜雨聆风