AI翻译局· 特别篇01· 双神对决:开源 Agent 的架构暗战
DUEL OF THE OPEN AGENTS · 2026
双神对决:开源 Agent 的架构暗战
🦞 OpenClaw · vs · 🐎 Hermes Agent
深度技术拆解 · 2026.05.01
01 · 哲学之争 · Gateway-first vs Agent-first
OpenClaw 的核心是 Gateway——一个长驻进程(默认端口 18789),充当所有消息(WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Teams、Google Chat…)的唯一控制面。Gateway 接到消息后,决定路由给哪个 agent、加载哪个 session、调用哪些工具,再回写到原渠道。这是“流量入口即上帝”的设计哲学——网关存在的那一刻,agent 才存在。
Hermes Agent 走的是另一条路:把 Agent loop 本身当作产品。它的核心循环是“do · learn · improve”——执行任务、读 trace、改 prompt、保留前沿,下一次就更快。Hermes 不在乎你从哪个渠道来——你给它一个 CLI / Webhook / Slack bot 都行,但它所有的优化都围绕”那个核心 agent”。
▲ 图 1 · OpenClaw 是”中央广场”,Hermes 是”独居修行者”
02 · 技术规格硬对比
|
|
|
|
|
|
|
|
|
|
|
128K
|
|
|
162
|
118
|
|
|
|
|
|
|
|
GEPA + DSPy
|
|
|
|
|
|
|
|
curl install · Linux/macOS/WSL2 |
|
|
|
MIT |
|
|
|
|
03 · 记忆架构 · 文件家族 vs 三层栈
OpenClaw 的记忆系统是”文件即记忆“——所有知识都存在 markdown 文件里:
SOUL.md
— agent 人格、价值观、口吻、边界(每个 session 起点必读) AGENTS.md
— 多 agent 分工与路由规则 TOOLS.md
— 可调用工具清单 MEMORY.md
— 长期记忆(项目结束时手工沉淀) HEARTBEAT.md
— 定时任务与 cron 配置
这套设计的最大优点是透明可控:所有 agent 状态都可以 git 跟踪、人类直接编辑;缺点也明显——没有自动学习,agent 不会从错误里”长出”新行为,新经验需要你手工写进 MEMORY.md。
Hermes Agent 走的是三层数据栈:
|
|
|
|
|
SQLite + FTS5
|
|
|
|
每完成一次任务,Hermes 会自动总结到 L2/L3——这意味着它跟你越久,越聪明。但代价是:当出问题时,状态藏在 SQLite 二进制里,调试与导出都不如 Markdown 直观。
04 · GEPA 自演化机制 · Hermes 真正的杀手锏
Hermes 最有学术分量的部分是 GEPA(Genetic-Pareto,ICLR 2026 Oral 接受)——这是它和”普通 Agent 框架”的根本区别。
GEPA 的工作流分 5 步:
▲ 图 2 · GEPA 不是”让 LLM 自我反思”那种玄学,而是有约束的进化算法
几个关键工程细节值得展开:
- Trace 不是日志
——它包含每一步 tool call 的输入、输出、耗时、错误码,是结构化的”复盘材料”,比单纯 print 日志信息密度高得多。 - DSPy 来 mutate
——不是 LLM 自己写 prompt 改 prompt(那样会发散),而是用 DSPy 的有约束 prompt 编程框架做”定向变异“,候选 prompt 必须通过签名校验。 - Pareto 过滤
——评分维度通常是”准确度 / 延迟 / token 成本”三轴,新候选必须在至少一轴前沿才能保留,避免过拟合。 - Skill 是 markdown
——产出的”skill”本质是一份 markdown 文档,记录”做这类任务时应该用哪个工具序列、注意哪些 edge case”,下次直接当作”额外 system prompt 段”复用。
▌点评 GEPA 的”40% 加速”不是噱头,它的可信度来自三件事:① ICLR 2026 Oral 同行评议;② 评测在公开 benchmark 上跑(不是厂商自定基准);③ 开源 全部代码(hermes-agent-self-evolution)。这是 2026 年开源 Agent 第一次把”自演化“从 PPT 变成可复现工程。
05 · 消息渠道与多模型生态
渠道广度上 OpenClaw 完胜。它原生支持 8+ 主流消息平台(WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Microsoft Teams、Google Chat),加上社区 bridge 还能接 LINE、企微、飞书。所有渠道都汇聚到 Gateway,可以把”WhatsApp 来的家庭事务”和”Slack 来的工作请求”路由到同一个 agent,也可以路由到不同的 workspace agent,互相隔离。
多模型支持上 Hermes 更激进。它默认跑 Hermes 3(Llama 3.1 微调),但 hermes model 一行命令就能切到:Nous Portal、OpenRouter(200+ 模型)、NVIDIA NIM(Nemotron 3 Nano Omni)、小米 MiMo、智谱 GLM、月之暗面 Kimi、MiniMax、Hugging Face、OpenAI——零代码、零厂商锁定。这种”模型路由器“哲学让它在国内外开源生态里都能跑。
06 · 6 类典型场景选型直判
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
▌ 终判 · “网关的优雅 vs 进化的诱惑”
广度选 OpenClaw——你需要”人去哪 agent 就到哪“,需要把多 agent 装进同一个团队的工作流,需要一切配置都看得见摸得着。它的胜负手是统一控制面 + 模板生态。
深度选 Hermes Agent——你的工作有极强的重复性,你愿意让 agent”跟你越久越聪明“,你想看到”自演化”在生产环境的真实效果。它的胜负手是 GEPA 闭环 + 三层记忆。
趋势:终将合流。 Hermes 已经支持安装 OpenClaw 社区 skill(ClawHub),从 OpenClaw 到 Hermes 的官方迁移工具也已存在。未来 12 个月会出现”OpenClaw + Hermes 混合部署“的最佳实践——OpenClaw 当前端聚合器、Hermes 当后端”会学习的执行核”。
对开发者:2026 下半年值得投入时间学的不是”再多一个 Langchain Agent”,而是这两个产品中至少一个的架构思维——Gateway 思维、或 Self-evolving 思维。
AI 行业日报 · 产品深度拆解系列 · 仅供研究参考
数据来源:openclaw/openclaw GitHub · NousResearch/hermes-agent · ICLR 2026 · 各厂商官方文档
2026.05.01
夜雨聆风