
大家最近都在被 Agent 刷屏吧,可能很多朋友已经用上了 Hermes、OpenClaw 这样的 Agent,或者 Codex 和 Claude Code 来编程。
我用了一段时间 Agent,有个问题越来越明显:
现在很多 AI 编码工具都很强,但它们经常不是“不会做”,而是不按流程做。
一、AI 不是不会做,而是不按流程做
你让它先规划,它可能直接开写。
你让它找子 Agent,它可能自己偷偷干完。
你让它验证,它可能口头说“测试通过”。
你让它按阶段交付,它可能做到一半就开始自由发挥。
这类问题靠一句提示词很难根治。

所以我做了一个小项目,叫 HTE:Hermes Team Engine。
它的标准名称是:HTE 多Agent协作开发框架。
更准确地说,它是一个面向 Hermes Agent 的轻量级多 Agent 文件协议工作流框架,用来让 AI 团队像工程团队一样按阶段规划、执行、审计、返工和放行。
项目已经开源:
https://github.com/mohammedabdalmonim411-afk/hmte
二、我的解法:让 AI 像工程团队一样干活
HTE 的目标,就是让多个 AI Agent 按工程团队的方式协同起来。
它把复杂任务拆成三个核心角色:
- •
Leader:负责拆解任务、规划阶段、控制流程; - •
Worker:负责执行具体阶段,提交证据; - •
Verifier:负责独立审计,判断 PASS / FAIL / BLOCK。

简单说,就是把以前“一个 AI 自己规划、自己写、自己验收”的模式,拆成一套更接近真实工程团队的协作分工:
用户目标
↓
Leader 拆阶段
↓
Worker 执行
↓
生成 evidence
↓
Verifier 审计
↓
phase_gate 放行
↓
进入下一阶段
这里需要说清楚一点:HTE 当前不是一个把所有 Agent 都装进黑箱里的重型运行时,它更像是一套轻量文件协议和流程门禁。真实的 Worker / Verifier 运行,仍然依赖 Hermes 的 delegate_task 或外部 Agent 执行环境。
下面这张图,是 HTE 当前的整体架构:

三、核心不是复杂,而是“可检查”
HTE 不要求 AI 只说“我完成了”,它要 AI 留下东西:
- •
phases.json - •
command log - •
evidence bundle - •
verdict JSON - •
phase_gate 结果 - •
final-check 结果

有文件、有日志、有证据、有裁决,才算真的走完一遍。
它要解决的,不是“让 AI 永不犯错”,而是把原本藏在聊天记录里的协作过程,变成更容易检查、复盘和打回的工程流程。
Leader 应该负责规划和调度,而不是一边当项目经理,一边当执行者,一边又当验收员。
所以 HTE 会通过 Leader Jail、Goalpost Lock、Instruction Lint、Evidence Claim Verification、Verifier Minimum Audit、Final Check 等机制,把低成本偷懒路径尽量堵住。
但这些治理机制不是项目的目的。它们只是为了服务一个更核心的目标:
让 Leader、Worker、Verifier 真正像一个工程团队那样协作。
四、HTE 背后的四个设计哲学
这个项目背后有四个设计哲学。
1. 可证伪性(波普尔式)
结论必须可检查、可质疑、可打回。
在 HTE 里,PASS 不是“AI 自己说通过了”,而是当前阶段在证据与审计下暂时成立。
2. 闭环反馈(控制论)
复杂任务不应该一次性赌结果,而应该形成:
计划 → 执行 → 观察 → 审计 → 反馈 → 修正
通过就进入下一阶段,失败就回到对应阶段返工。
3. 轻量工程(YAGNI / KISS)
HTE 不做重平台,不堆复杂概念,只保留真正必要的机制。
它尽量用文件协议、脚本和门禁解决问题,保持轻、稳、可读、可维护。
4. 最小阻力合规(费马式)
AI Agent 在长任务里会自然寻找省事路径。
所以 HTE 不只靠提醒它自律,而是把偷懒路径变得更麻烦,把合规流程变成最低阻力路径。
简单说:
让绕流程比按流程更累。
五、为什么这对新手特别重要
前面说的那些翻车,根子大多不在模型本身,而在没人立规矩、没人验收。
HTE 要解决的核心问题其实就几个:
- •
谁负责规划; - •
谁负责执行; - •
谁负责审计; - •
什么叫完成; - •
什么时候能进入下一步; - •
失败以后应该回到哪里返工。
很多人刚开始玩 Agent,会陷入一个误区:总想找更强模型、更大框架、更多工具。
但真正用起来会发现,最先需要解决的往往不是模型智商,而是流程纪律。
一个不守流程的强模型,照样会把项目带偏;一个有清晰分工和验收机制的 Agent 团队,反而更容易稳定产出。
六、写在最后
HTE 的设计原则说白了很简单:
让 AI 少靠自觉,多靠流程。
让协作少靠口头承诺,多靠证据交付。
让系统少靠复杂功能,多靠必要闭环。
它不是为了做一个沉重的平台,也不是为了堆一堆花哨概念。
我更希望它是一套轻量、透明、容易接入的多 Agent 协作开发框架:让 AI 像工程队一样分工,像工程流程一样留痕,像质量门禁一样放行。
如果你也在研究 Agent 编程、多 Agent 协作,或者经常被 AI “嘴上说完成、实际没按流程做”折磨,HTE 可能会给你一个新的思路。
先让 AI 像一个守规矩的工程队,再谈更复杂的智能协作。
项目地址:
https://github.com/mohammedabdalmonim411-afk/hmte
你在用 Agent 编程时,最头疼的是哪一步?欢迎在评论区聊聊。
夜雨聆风