两个 AI Agent 怎么"搭班子"?
一篇看懂 Codex × Hermes 的分工哲学
这不是一次小升级,而是一次"分工宣言"。
最近 AI 圈有个很有意思的转向:大家不再追问"哪个 Agent 最强",而是开始问"几个 Agent 怎么一起干活"。
一个流传很广的玩法是——你只需要说一句话,就能让 AI 自己写好一篇文章、配好所有设置、直接丢进公众号草稿箱。听起来像魔法,但它背后的逻辑其实特别朴素:让不同的 Agent 各干各擅长的事,再用一套规则把它们粘在一起。
今天就用一篇文章,带你把这套"多 Agent 协同"讲明白。主角是两位:OpenAI 的 Codex,和 Nous Research 的 Hermes。

▲ 全局架构:一图看懂分工、共享文件层与闭环流程
一、先认识两位主角
Codex,可以理解成"那个很会写代码、很会做判断的工程师型 Agent"。
它是 OpenAI 推出的编程智能体,能读懂你整个项目的代码结构、调用关系,做跨文件重构、复杂调试、代码评审。它有几个关键能力:会先读项目根目录里的 AGENTS.md(相当于"这个项目的工作说明书")再动手;支持 Skills(把一套可复用的工作流打包好,需要时自动加载,这个能力 2025 年 12 月正式上线);还支持 Automations(让它按你设的节奏定时回来看项目)。
简单说,Codex 贵、强、稳,适合干"出错代价高"的活儿。
Hermes,则是"那个不知疲倦、便宜又听话的执行型 Agent"。
它来自 Nous Research,2026 年 6 月刚发布了跨平台桌面版 Hermes Desktop(Windows / macOS / Linux 都能用,目前还偏预览阶段,MIT 开源)。它最大的特点是:有持久记忆(自己记住项目事实和你的偏好)、能自动生成技能、支持定时任务(cron)、还能派生子代理去并行干活。而且它能接各种便宜的大模型——比如接上 DeepSeek,选 deepseek-v4-pro、把 Base URL 填成 https://api.deepseek.com,一分钟就配好,跑大量杂活成本极低。
简单说,Hermes 便宜、能跑腿、不会忘,适合干"重复、可调度、低风险"的活儿。

▲ 两位主角分工:Codex 动脑,Hermes 跑腿
二、核心理念:不是"谁管谁",而是"分工协议"
很多人第一反应是:那是不是让一个强 Agent 去"管理"另一个弱 Agent?
恰恰相反。 这套玩法最聪明的地方,是不让任何一个 Agent 去当另一个的"老板",而是把它们放进同一套工作协议里。就像一个靠谱的团队,不是靠某个人盯着所有人,而是靠清晰的职责、共享的文档和明确的交接。
更关键的是分工的依据。一个常见的误解是"Codex 只做架构、Hermes 只执行"——这其实太僵硬了。Codex 也能执行,Hermes 也能写代码。真正合理的切分标准是两个词:
按"风险"和"复杂度"分工而不是按"工具身份"分工
· 出错代价高、需要深度理解、改了不好回滚的 → 交给 Codex 动脑。
· 便宜、可重复、可调度、即使错了也容易兜底的 → 交给 Hermes 跑腿。
这个视角一旦建立,后面所有的安排都顺理成章了。
三、具体怎么分?一张"交接单"讲清楚
我们用一个真实的开发场景走一遍。
第一步,Codex 动脑。 你对它说:"读一下项目说明,设计这个功能的实现方案,列出风险、测试命令和回滚方案,先别部署。" Codex 产出设计、补丁、测试方法和回滚预案。
第二步,生成一张"交接单"。 这是整套协同的灵魂。Codex 把这次改动整理成一份结构化的交接文档,里面写清楚:目标是什么、涉及哪些文件、要跑哪些命令、成功的信号长什么样、出了问题怎么回滚、Hermes 干完要把什么写回来。
第三步,Hermes 跑腿。 你对 Hermes 说:"执行那张标记为'可执行'的交接单,部署到测试环境,完成后把结果记到运行日志里,别碰生产环境。" Hermes 照着 checklist 一步步做,做完把结果写回共享文件。
第四步,闭环。 下次 Codex 再来,先读这些共享文件,基于"最新真实发生了什么"继续判断。
你看,没有谁指挥谁,只有一份份有输入、有输出、有验证、有回滚的交接单在两个 Agent 之间流转。这才是工程上靠得住的协作。

▲ 交接单的流转闭环:设计 → 交接 → 执行写回 → 再读
四、把它们"粘"在一起的,不是超级 App,而是几个 Markdown 文件
这里有个反直觉但特别重要的点。
你可能会以为,要让两个 Agent 协同,得装一个高大上的"统一 Agent 操作系统"。但更稳的做法,是用一层朴素的共享文件。在每个项目里建这么几样东西就够了:
AGENTS.md — 项目级的"事实源"和工作规则,Codex 干活前先读它。
.ai/handoff/ — Codex 和 Hermes 之间的交接单都放这儿。
.ai/decisions/ — 架构决策记录下来,而不是聊着聊着就丢了。
.ai/runbooks/ — Hermes 照着执行的标准操作手册(SOP)。
.ai/memory/ — 可人工审阅的项目记忆,而非塞进某个 Agent 黑箱。
.ai/logs/ — Hermes 每次自动跑完留下的、可审计的运行历史。
这套结构的妙处在于:所有上下文都是人类看得见、改得动、能追溯的纯文本。 不依赖任何一个工具的私有数据库,换工具也不丢上下文。这是它比"全押在某个中控平台"更稳的根本原因。

▲ 共享文件层:两个 Agent 共读共写的事实源
而把两个 Agent 真正"接通"的,也未必需要什么花哨平台。实测下来,最稳的一种连接方式特别朴素:Hermes 自带一个 MCP 服务,一条命令就能让 Codex 把 Hermes 当成自己的一个"工具"直接调用,而不是让两个桌面应用互相"看见对方的会话"。换句话说,真正解决问题的,往往是这种"直接连一根线"的笨办法,而不是某个号称"统一大脑"的中控大平台。这也再次印证了那句话——协议和连接是地基,平台只是锦上添花。
五、安全边界:哪些能自动,哪些必须人来拍板
让 AI 自动干活,最怕的就是它"自作主张"把生产环境搞挂、或者乱花钱。所以这套协议里有一条铁律——把动作分成两类。
✅ 可以放心自动执行:读文件、做汇总、生成报告、跑只读检查、监控 URL / 日志 / 工单状态、创建测试环境的部署草稿、甚至提个 PR(但不自动合并)。
⛔ 必须人类点头:生产部署、数据库迁移、删除或批量移动文件、旋转或暴露密钥、购买充值开通付费 API、任何钱包 / 交易 / 链上动作、改 CI/CD 权限。
说白了:便宜模型可以满世界跑杂务,但所有"不可逆、花钱、碰生产"的动作,都要留一道人类闸门。 这一条,比任何花哨功能都重要。

▲ 安全闸门:低风险自动放行,高风险必须人类批准
六、那些"中控工具",可选,但别神化
围绕 Hermes 和 Codex,社区里冒出来一批第三方工具,经常被吹成"必装神器"。理性看,它们确实存在、也有用,但现阶段更适合渐进接入,而不是一上来就全盘押注:
· Oh My Hermes——给 Hermes 加一层项目工作流的开源项目,带多角色、多技能、甚至"CTO loop"。适合在非核心项目先试点低风险技能。
· HivemindOS——定位是跨机器的 Agent 控制台、共享知识库、任务看板。已有人在 Windows 上实测跑通,但要做些兼容处理,建议只当可选看板,别把"唯一的记忆"和"唯一的调度"都塞进去。
· CC Switch——统一管理 Codex、Hermes、Claude Code 等工具的 provider、MCP、技能配置的桌面控制台。它不是任务编排器,更像"配置面板",适合经常切换多个 API 的人。
一句话:它们能提升体验,但真正让系统稳的核心永远是——清晰分工、共享 Markdown、显式交接、可审计日志、人类批准高风险动作。 工具是锦上添花,协议才是地基。
七、关于"效率 10 倍"的冷静提醒
你一定在各种帖子里见过"用了这套效率提升 3-5 倍 / 10 倍""这是最前沿共识"之类的说法。
实话实说:这些数字目前没有可验证的工程证据。 它们可以当作营销参考、当作"值得一试"的信号,但不该被当成事实写进你的工作制度。
这套多 Agent 协同方法的真正价值,不在于某个夸张的倍数,而在于一件更朴素的事:让你能放心地用便宜模型跑掉大量琐碎杂务,同时把真正需要高判断力的部分,留给最强的那个 Agent。 省下来的,是你自己的注意力。
写在最后
回到开头那句话——"不是一次小升级,而是一次分工宣言"。
它宣告的不是某个模型变强了,而是我们使用 AI 的方式变了:从"找一个全能 Agent",转向"组建一个有分工、有协议、有边界的 Agent 班子"。
在这个班子里,Codex 是那个做高质量工程判断和落地的资深工程师,Hermes 是那个不知疲倦、便宜可靠的执行者,几个 Markdown 文件是它们共同遵守的规则,而你——是那个定义边界、握着最后一道闸门的人。
这套方式的关键,从来不是"谁更强",而是每一个动作都有边界、有输入、有输出、有回滚。 这才是能让人睡得着觉的自动化。
本文技术信息核验于 2026 年 6 月。Hermes Desktop、Codex 的 AGENTS.md / Skills / Automations、DeepSeek 集成路径等均来自官方文档;文中所涉第三方工具均有公开仓库。涉及"效率倍数"的表述无可验证证据,仅供参考。
夜雨聆风