乐于分享
好东西不私藏

AI翻译局· 特别篇01· 双神对决:开源 Agent 的架构暗战

AI翻译局· 特别篇01· 双神对决:开源 Agent 的架构暗战

DUEL OF THE OPEN AGENTS · 2026

双神对决:开源 Agent 的架构暗战

🦞 OpenClaw  ·  vs  ·  🐎 Hermes Agent

深度技术拆解 · 2026.05.01

 2026 年开源 Agent 阵营的两个最重要产品——OpenClaw(345K stars,以”the lobster way”为口号)与 Hermes Agent(110K stars,10 周内冲到第一名,致敬希腊神使爱马仕)——代表了完全不同的两种世界观:一个押注”消息流量入口即网关“,一个押注”Agent 自己迭代自己“。这篇文章把它们的架构、记忆、学习闭环、消息渠道、模型支持逐层拆开比较,并给出 6 类典型场景的选型直判。 

01 · 哲学之争 · Gateway-first vs Agent-first

 OpenClaw 的核心是 Gateway——一个长驻进程(默认端口 18789),充当所有消息(WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Teams、Google Chat…)的唯一控制面。Gateway 接到消息后,决定路由给哪个 agent、加载哪个 session、调用哪些工具,再回写到原渠道。这是“流量入口即上帝”的设计哲学——网关存在的那一刻,agent 才存在。 

 Hermes Agent 走的是另一条路:把 Agent loop 本身当作产品。它的核心循环是“do · learn · improve”——执行任务、读 trace、改 prompt、保留前沿,下一次就更快。Hermes 不在乎你从哪个渠道来——你给它一个 CLI / Webhook / Slack bot 都行,但它所有的优化都围绕”那个核心 agent”。 

架构哲学对比 · Architecture Philosophy🦞 OpenClaw · Gateway-firstGATEWAY:18789💬Telegram🟣Slack📱WhatsApp🔷DiscordAGENT₁AGENT₂单控制面 · 多 Agent 路由Workspaces · SOUL.mdVS🐎 Hermes · Agent-firstAGENTLOOPdolearnimprovestore单 Agent 闭环 · GEPA 自演化3-Layer Memory · Skill Library

▲ 图 1 · OpenClaw 是”中央广场”,Hermes 是”独居修行者”

02 · 技术规格硬对比

维度
🦞 OpenClaw
🐎 Hermes Agent
默认模型
Anthropic Claude Sonnet
Nous Research Hermes 3(Llama 3.1 微调)
上下文 / 多模型
遵循接入模型上限
128K

 · 支持 OpenRouter 200+ / NVIDIA NIM / GLM / Kimi / MiniMax 等
内置 Skill / Template
162

 模板(社区 awesome-openclaw-agents)
118

 skill(v0.10.0 内置)+ 可生成新 skill
消息渠道
WhatsApp · Telegram · Slack · Discord · Signal · iMessage · Teams · Google Chat (8+)
Slack · Telegram · Discord 等 6 集成
学习闭环
无原生学习层
GEPA + DSPy

(ICLR 2026 Oral 论文)
记忆方式
SOUL.md / AGENTS.md / TOOLS.md / MEMORY.md / HEARTBEAT.md(纯 Markdown)
三层记忆栈(Session + SQLite/FTS5 + Preference)
部署方式
Gateway 长驻进程(容器或宿主机)
单条 curl install · Linux/macOS/WSL2
许可
Apache 2.0
MIT
GitHub Stars(截至 2026-05-01)
~ 345K(Token 用量 #1 · 19.9T OpenRouter)
~ 110K(10 周冲到,最快增长)

03 · 记忆架构 · 文件家族 vs 三层栈

OpenClaw 的记忆系统是”文件即记忆“——所有知识都存在 markdown 文件里: 

  • SOUL.md
     — agent 人格、价值观、口吻、边界(每个 session 起点必读)
  • AGENTS.md
     — 多 agent 分工与路由规则
  • TOOLS.md
     — 可调用工具清单
  • MEMORY.md
     — 长期记忆(项目结束时手工沉淀)
  • HEARTBEAT.md
     — 定时任务与 cron 配置

 这套设计的最大优点是透明可控:所有 agent 状态都可以 git 跟踪、人类直接编辑;缺点也明显——没有自动学习,agent 不会从错误里”长出”新行为,新经验需要你手工写进 MEMORY.md。 

Hermes Agent 走的是三层数据栈: 

L1SESSION
当前对话上下文(标准 LLM context window 管理)
L2PERSISTENT
SQLite + FTS5

 全文检索 · 跨会话事实/偏好/学到的上下文
L3SKILL / PREFERENCE
可复用 skill 文档(捕获”做某类事的最佳套路”)+ 用户偏好画像

 每完成一次任务,Hermes 会自动总结到 L2/L3——这意味着它跟你越久,越聪明。但代价是:当出问题时,状态藏在 SQLite 二进制里,调试与导出都不如 Markdown 直观。 

04 · GEPA 自演化机制 · Hermes 真正的杀手锏

 Hermes 最有学术分量的部分是 GEPA(Genetic-Pareto,ICLR 2026 Oral 接受)——这是它和”普通 Agent 框架”的根本区别。 

 GEPA 的工作流分 5 步: 

“do · learn · improve” · GEPA Self-Evolution① EXECUTE跑任务 · 留 trace② REFLECT读 trace · 找因③ MUTATEDSPy 改 prompt④ PARETO 过滤保留前沿 · 弃劣解⑤ SAVE TO SKILL LIBRARY下次跑相同类型任务直接复用— 下一次执行同类任务时,agent 已经”知道怎么做” —20+ skills 后 → 重复任务 +40% 加速ICLR 2026 Oral · DSPy + GEPA · MIT 开源

▲ 图 2 · GEPA 不是”让 LLM 自我反思”那种玄学,而是有约束的进化算法

 几个关键工程细节值得展开: 

  • Trace 不是日志
    ——它包含每一步 tool call 的输入、输出、耗时、错误码,是结构化的”复盘材料”,比单纯 print 日志信息密度高得多。
  • DSPy 来 mutate
    ——不是 LLM 自己写 prompt 改 prompt(那样会发散),而是用 DSPy 的有约束 prompt 编程框架做”定向变异“,候选 prompt 必须通过签名校验。
  • Pareto 过滤
    ——评分维度通常是”准确度 / 延迟 / token 成本”三轴,新候选必须在至少一轴前沿才能保留,避免过拟合。
  • Skill 是 markdown
    ——产出的”skill”本质是一份 markdown 文档,记录”做这类任务时应该用哪个工具序列、注意哪些 edge case”,下次直接当作”额外 system prompt 段”复用。

▌点评   GEPA 的”40% 加速”不是噱头,它的可信度来自三件事:① ICLR 2026 Oral 同行评议;② 评测在公开 benchmark 上跑(不是厂商自定基准);③ 开源 全部代码(hermes-agent-self-evolution)。这是 2026 年开源 Agent 第一次把”自演化“从 PPT 变成可复现工程。 

05 · 消息渠道与多模型生态

渠道广度上 OpenClaw 完胜。它原生支持 8+ 主流消息平台(WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Microsoft Teams、Google Chat),加上社区 bridge 还能接 LINE、企微、飞书。所有渠道都汇聚到 Gateway,可以把”WhatsApp 来的家庭事务”和”Slack 来的工作请求”路由到同一个 agent,也可以路由到不同的 workspace agent,互相隔离。 

多模型支持上 Hermes 更激进。它默认跑 Hermes 3(Llama 3.1 微调),但 hermes model 一行命令就能切到:Nous Portal、OpenRouter(200+ 模型)、NVIDIA NIM(Nemotron 3 Nano Omni)、小米 MiMo、智谱 GLM、月之暗面 Kimi、MiniMax、Hugging Face、OpenAI——零代码、零厂商锁定。这种”模型路由器“哲学让它在国内外开源生态里都能跑。 

06 · 6 类典型场景选型直判

使用场景
推荐
理由
家庭/个人助理 · 多渠道触达
OpenClaw
8+ 渠道原生支持 + 162 模板生态
单人重复工作流 · 每天跑同样任务
Hermes Agent
20+ skills 后 +40% 速度
企业多团队多 Agent 编排
OpenClaw
workspaces 隔离 + 单控制面运维
研究 self-improving Agent
Hermes Agent
GEPA 论文级开源 · 可复现
配置敏感 · 完全 git-tracked
OpenClaw
全 markdown 文件 · diff 友好
最小依赖 · 一行 curl 跑起来
Hermes Agent
curl install 单脚本即装即用

▌ 终判 · “网关的优雅 vs 进化的诱惑”

广度选 OpenClaw——你需要”人去哪 agent 就到哪“,需要把多 agent 装进同一个团队的工作流,需要一切配置都看得见摸得着。它的胜负手是统一控制面 + 模板生态

深度选 Hermes Agent——你的工作有极强的重复性,你愿意让 agent”跟你越久越聪明“,你想看到”自演化”在生产环境的真实效果。它的胜负手是 GEPA 闭环 + 三层记忆

趋势:终将合流。 Hermes 已经支持安装 OpenClaw 社区 skill(ClawHub),从 OpenClaw 到 Hermes 的官方迁移工具也已存在。未来 12 个月会出现”OpenClaw + Hermes 混合部署“的最佳实践——OpenClaw 当前端聚合器、Hermes 当后端”会学习的执行核”。

对开发者:2026 下半年值得投入时间学的不是”再多一个 Langchain Agent”,而是这两个产品中至少一个的架构思维——Gateway 思维、或 Self-evolving 思维。

AI 行业日报 · 产品深度拆解系列 · 仅供研究参考

数据来源:openclaw/openclaw GitHub · NousResearch/hermes-agent · ICLR 2026 · 各厂商官方文档

2026.05.01