我做了一个让 AI 团队真正按流程干活的小工具:HTE

大家最近都在被 Agent 刷屏吧，可能很多朋友已经用上了 Hermes、OpenClaw 这样的 Agent，或者 Codex 和 Claude Code 来编程。

我用了一段时间 Agent，有个问题越来越明显：

现在很多 AI 编码工具都很强，但它们经常不是“不会做”，而是不按流程做。

一、AI 不是不会做，而是不按流程做

你让它先规划，它可能直接开写。

你让它找子 Agent，它可能自己偷偷干完。

你让它验证，它可能口头说“测试通过”。

你让它按阶段交付，它可能做到一半就开始自由发挥。

这类问题靠一句提示词很难根治。

所以我做了一个小项目，叫 HTE：Hermes Team Engine。

它的标准名称是：HTE 多Agent协作开发框架。

更准确地说，它是一个面向 Hermes Agent 的轻量级多 Agent 文件协议工作流框架，用来让 AI 团队像工程团队一样按阶段规划、执行、审计、返工和放行。

项目已经开源：

https://github.com/mohammedabdalmonim411-afk/hmte

二、我的解法：让 AI 像工程团队一样干活

HTE 的目标，就是让多个 AI Agent 按工程团队的方式协同起来。

它把复杂任务拆成三个核心角色：

•
Leader：负责拆解任务、规划阶段、控制流程；
•
Worker：负责执行具体阶段，提交证据；
•
Verifier：负责独立审计，判断 PASS / FAIL / BLOCK。

简单说，就是把以前“一个 AI 自己规划、自己写、自己验收”的模式，拆成一套更接近真实工程团队的协作分工：

用户目标

↓

Leader 拆阶段

↓

Worker 执行

↓

生成 evidence

↓

Verifier 审计

↓

phase_gate 放行

↓

进入下一阶段

这里需要说清楚一点：HTE 当前不是一个把所有 Agent 都装进黑箱里的重型运行时，它更像是一套轻量文件协议和流程门禁。真实的 Worker / Verifier 运行，仍然依赖 Hermes 的 delegate_task 或外部 Agent 执行环境。

下面这张图，是 HTE 当前的整体架构：

三、核心不是复杂，而是“可检查”

HTE 不要求 AI 只说“我完成了”，它要 AI 留下东西：

•
phases.json
•
command log
•
evidence bundle
•
verdict JSON
•
phase_gate 结果
•
final-check 结果

有文件、有日志、有证据、有裁决，才算真的走完一遍。

它要解决的，不是“让 AI 永不犯错”，而是把原本藏在聊天记录里的协作过程，变成更容易检查、复盘和打回的工程流程。

Leader 应该负责规划和调度，而不是一边当项目经理，一边当执行者，一边又当验收员。

所以 HTE 会通过 Leader Jail、Goalpost Lock、Instruction Lint、Evidence Claim Verification、Verifier Minimum Audit、Final Check 等机制，把低成本偷懒路径尽量堵住。

但这些治理机制不是项目的目的。它们只是为了服务一个更核心的目标：

让 Leader、Worker、Verifier 真正像一个工程团队那样协作。

四、HTE 背后的四个设计哲学

这个项目背后有四个设计哲学。

1. 可证伪性（波普尔式）

结论必须可检查、可质疑、可打回。

在 HTE 里，PASS 不是“AI 自己说通过了”，而是当前阶段在证据与审计下暂时成立。

2. 闭环反馈（控制论）

复杂任务不应该一次性赌结果，而应该形成：

计划 → 执行 → 观察 → 审计 → 反馈 → 修正

通过就进入下一阶段，失败就回到对应阶段返工。

3. 轻量工程（YAGNI / KISS）

HTE 不做重平台，不堆复杂概念，只保留真正必要的机制。

它尽量用文件协议、脚本和门禁解决问题，保持轻、稳、可读、可维护。

4. 最小阻力合规（费马式）

AI Agent 在长任务里会自然寻找省事路径。

所以 HTE 不只靠提醒它自律，而是把偷懒路径变得更麻烦，把合规流程变成最低阻力路径。

简单说：

让绕流程比按流程更累。

五、为什么这对新手特别重要

前面说的那些翻车，根子大多不在模型本身，而在没人立规矩、没人验收。

HTE 要解决的核心问题其实就几个：

•
谁负责规划；
•
谁负责执行；
•
谁负责审计；
•
什么叫完成；
•
什么时候能进入下一步；
•
失败以后应该回到哪里返工。

很多人刚开始玩 Agent，会陷入一个误区：总想找更强模型、更大框架、更多工具。

但真正用起来会发现，最先需要解决的往往不是模型智商，而是流程纪律。

一个不守流程的强模型，照样会把项目带偏；一个有清晰分工和验收机制的 Agent 团队，反而更容易稳定产出。

六、写在最后

HTE 的设计原则说白了很简单：

让 AI 少靠自觉，多靠流程。

让协作少靠口头承诺，多靠证据交付。

让系统少靠复杂功能，多靠必要闭环。

它不是为了做一个沉重的平台，也不是为了堆一堆花哨概念。

我更希望它是一套轻量、透明、容易接入的多 Agent 协作开发框架：让 AI 像工程队一样分工，像工程流程一样留痕，像质量门禁一样放行。

如果你也在研究 Agent 编程、多 Agent 协作，或者经常被 AI “嘴上说完成、实际没按流程做”折磨，HTE 可能会给你一个新的思路。

先让 AI 像一个守规矩的工程队，再谈更复杂的智能协作。

项目地址：

https://github.com/mohammedabdalmonim411-afk/hmte

你在用 Agent 编程时，最头疼的是哪一步？欢迎在评论区聊聊。