乐于分享
好东西不私藏

让 Hermes 做 AI 开发监工:把 Claude Code 从“问一步做一步”变成“按清单持续交付”|笔记

让 Hermes 做 AI 开发监工:把 Claude Code 从“问一步做一步”变成“按清单持续交付”|笔记

📢 免责声明         

本文所述技术仅用于合法授权的安全研究、教学演示及防御机制开发。作者及发布平台不承担因读者误用、滥用本内容所导致的任何法律责任。请严格遵守《中华人民共和国网络安全法》及相关法律法规。

用 Hermes 监工 Claude Code:项目结构理清之后,让 AI 自动把代码写完

适读人群:有 Claude Code 使用经验的开发者 / 网络安全与取证工程师
核心工具:Claude Code · Hermes Agent · tmux


问题:AI 写一半就停下来等你

当你用 Claude Code 开发一个稍微复杂的项目时,会发现一个很现实的问题——

它写一半就停下来等你。

我已经完成了第一部分,是否继续?
建议下一步运行测试,是否执行?
以下是我的 next steps,请问需要我实现吗?
... ...

这不是 Claude Code 的 bug,是它的默认行为——做完一步确认一步,避免越权。

但如果你的项目结构已经想清楚了,需求和模块划分都定好了,剩下的工作是执行——那反复确认会极大拖慢进度。

我的解法是:用 Hermes 当监工,让它盯着 Claude Code,普通确认自动续推,真实阻塞才来找我。


整体思路:三层结构

不要只对 Claude Code 说”继续做完”,这种方式迟早会失效。

真正有效的方式是建立一个三层结构:

┌─────────────────────────────────────┐
│              你                      │
│  定方向 · 定边界 · 处理真实阻塞        │
└──────────────┬──────────────────────┘
               │
┌──────────────▼──────────────────────┐
│           Hermes(监工)              │
│  监控会话状态 · 普通确认自动续推        │
│  要求按 checklist 持续执行            │
│  遇到真实阻塞才通知你                  │
└──────────────┬──────────────────────┘
               │
┌──────────────▼──────────────────────┐
│         Claude Code(施工)           │
│  读代码 · 写代码 · 跑测试 · 修失败     │
│  更新文档 · 更新 checklist            │
└──────────────┬──────────────────────┘
               │
┌──────────────▼──────────────────────┐
│      complete-checklist.md(图纸)    │
│  决定做什么 · 做到什么算完成           │
│  提供验收标准                         │
└─────────────────────────────────────┘

一句话总结:你定方向,Hermes 当监工,Claude Code 当施工队,Checklist 当施工图。


前期准备(简略版)

在让 Hermes 开始监工之前,需要先把两个文件准备好。

文件一(自定义):docs/plans/complete-checklist.md

目录参考:/home/kali/.hermes/hermes-agent/docs/plans/

这是 Claude Code 执行的唯一主线

关键要求:

  • • 按 Wave(阶段)拆分,每个 Wave 包含若干最小闭环
  • • 每个条目必须有:目标 · 涉及文件 · 验收标准 · 验证命令
  • • 只有整个 checklist 完成才算完成,不是”某个功能写好了”就算完

Wave 结构参考:

Wave 0 ── 执行规则与基线落地
Wave 1 ── 核心架构闭环
Wave 2 ── 功能扩展闭环
Wave 3 ── 产品化与 UI / API 收口
Wave 4 ── 报告、导出与文档
Wave 5 ── 全量回归与最终收口


文件二(自定义):CLAUDE.md(项目根目录)

约束 Claude Code 行为的规则文件,核心只有两条

  1. 不要停在普通进度更新,按 checklist 一直执行
  2. 只有缺凭据、需要危险操作、需求冲突时才停下
    参考:
## Execution Rules1. Do not stop for intermediate progress updates.2. Only stop and ask when blocked by one of these:   - missing credentials / device access / external service access   - destructive or irreversible operations   - truly conflicting requirements3. If you write "next steps" or "I suggest", execute those steps   immediately instead of waiting.4. After completing one checklist item, continue to the next unchecked item.5. Stop only when the entire checklist is complete, or a real blocker appears.

Hermes 是什么

Hermes Agent by Nous Research

Hermes Agent[1] 是 Nous Research 开发的开源自主 AI Agent

它的几个关键特性使它非常适合做监工:

特性
说明
Terminal 访问能力
可直接执行 shell 命令,包括 tmux 操作
跨会话持久记忆
记住项目上下文,不需要每次重新解释
自动化调度
支持自然语言 cron,可设定定时轮询
多平台接入
CLI · Telegram · Discord · Slack · WhatsApp
多模型支持
OpenAI · Anthropic · OpenRouter 等,无锁定

安装一行搞定:

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

支持 Linux · macOS · WSL2,安装后运行 hermes setup 配置模型。
详细安装步骤见 官方文档[1],本文不重复介绍。

我用 GPT 模型驱动 Hermes,让它独立监控 Claude Code 的 tmux 会话。两个 AI 会话完全独立,互不干扰。


核心:Hermes 监工 Prompt(仅供参考,根据自己的想法进行更改)

这是整篇文章最重要的部分。直接复制,填入项目信息,发给 Hermes 即可。

你现在负责监控一个 Claude Code 开发会话,持续推进项目直到完成。

项目信息:
- 项目路径:[PROJECT_PATH]
- claudecode 会话你自己自行创建
- 执行主文档:docs/plans/complete-checklist.md
- 行为规则文件:项目路径/CLAUDE.md


你的工作流程:

【正在工作中】
→ 不要打断,稍后再次查看。

【等待普通确认(是否继续 / 是否运行测试 / 是否修改文件)】
→ 用 tmux send-keys 发送:
  "继续。普通仓库文件修改已批准。按 checklist 和 CLAUDE.md 执行,完成后继续下一个未完成项。"

【写出了 next steps 但没有执行】
→ 用 tmux send-keys 发送:
  "请直接执行刚才列出的 next steps,补测试,跑验证,修复合理失败,然后继续下一个未完成项。"

【完成了一个 checklist 项后停下】
→ 用 tmux send-keys 发送:
  "不要停。立即读取 checklist,定位下一个未完成项并继续。只有整个 checklist 完成、
   真实阻塞或危险操作才停。"

【遇到真实阻塞】
→ 停止监工,按下方格式向我报告。

【整个 checklist 已全部完成】
→ 停止监工,输出收口总结。
---


关键判断:普通确认 vs 真实阻塞

这是整套流程最重要的判断点。

![自动化监控流程]

这个方法解决Hermes 可以直接续推的(属于常规暂停)

Claude Code 的表现
Hermes 的动作
“是否继续?”
发送:继续
“是否运行测试?”
发送:继续
“是否应用这个补丁?”
发送:继续,普通文件修改已批准
写出 next steps 未执行
发送:直接执行 next steps
完成一项后停住等待
发送:继续下一个未完成项

这个方法不解决–停下来通知你的(属于权限申请)这种类型也有绕过方式

情况
原因
缺少 API key
无法降级处理
需要删除数据库 / rm -rf
不可逆
需要访问真实设备或外部服务
权限不在范围内
需求出现冲突
需要你做判断

💬 常见场景续推话术

遇到 Claude Code 停住,Hermes 用以下话术处理:

场景 1:写完一个小功能就停

不要停在当前项。完成当前 checklist item 后,立即读取 checklist,
定位下一个未完成项并继续。
只有整个 checklist 完成、真实阻塞或危险操作需要批准时才停。

场景 2:给了建议但没有执行

你刚才列出的 next steps 不需要等待确认。
请直接执行这些 next steps,补测试,跑验证,修复合理失败,
然后继续下一个未完成项。

场景 3:批准普通文件修改

Approval granted for all normal repository file edits in this Claude session.
Continue implementing the current checklist item, run relevant tests,
fix reasonable failures, then proceed to the next unchecked item.

场景 4:文档和实现状态不一致

继续,不要停。先把当前实现状态、README、checklist 和测试结果对齐。
如果整个 checklist 实际已完成,就整理最终状态并给出 completed/blockers 结论。
否则继续下一个未完成项。


完成标准

不要以”Claude Code 说完成了”作为完成标准。

用这四条验收:

  • •  checklist 全部条目标记 [x]
  • •  核心测试通过(pytest / npm test
  • •  README / docs 与当前实现一致
  • •  当前无已知真实 blocker

Hermes 收口报告模板

checklist 全部完成后,让 Hermes 输出以下格式:

# 项目监工收口报告

## 结论
- 当前状态:已完成 / 存在阻塞
- 完成全部 checklist:是 / 否
- 真实 blocker:无 / [说明]

## 本轮完成范围
- Wave 0:执行规则落地 ✓
- Wave 1:核心架构闭环 ✓
- ...

## 关键文件变更
- src/...
- tests/...

## 验证结果
命令:pytest
结果:X passed, 0 failed

## 文档状态
- README:已更新 ✓
- checklist:全部标记完成 ✓
- 运行说明:已与实现对齐 ✓

## 剩余风险
- [如有,说明]

## 下一步建议
如继续开发,新建:
  docs/plans/YYYY-MM-DD-next-roadmap.md
不要在已完成的 checklist 上无限追加。

最后

这套方法解决的核心问题不是”让 AI 更聪明”,而是:

建立一套结构,让 AI 的执行过程是可持续、可接管、可验收的。

项目方向你来定,真实阻塞你来决策。中间所有的普通推进,交给这套结构去跑。

欢迎各位大佬指点分享经验!!!


工具链接

  • • 🔗 Hermes Agent 官方文档[1]
  • • 🔗 Hermes Agent GitHub[2]
  • • 🔗 Claude Code 文档[3]

引用链接

[1] Hermes Agent: https://hermes-agent.nousresearch.com/docs/getting-started/quickstart
[2] Hermes Agent GitHub: https://github.com/NousResearch/hermes-agent
[3] Claude Code 文档: https://docs.anthropic.com/claude-code

2026 年第六届 FIC 全国网络空间取证大赛初赛解题思路|二进制程序部分|Hermes自动化分析Hermes 
老在开发中打断你?问题可能不在权限,而在协作方式
为什么到处都有人在卖 Token?以及如何 0 成本搭建你自己的 AI 中转站