AI翻译局· 特别篇01· 双神对决:开源 Agent 的架构暗战

DUEL OF THE OPEN AGENTS · 2026

双神对决：开源 Agent 的架构暗战

🦞 OpenClaw · vs · 🐎 Hermes Agent

深度技术拆解 · 2026.05.01

2026 年开源 Agent 阵营的两个最重要产品——OpenClaw（345K stars，以”the lobster way”为口号）与 Hermes Agent（110K stars，10 周内冲到第一名，致敬希腊神使爱马仕）——代表了完全不同的两种世界观：一个押注”消息流量入口即网关“，一个押注”Agent 自己迭代自己“。这篇文章把它们的架构、记忆、学习闭环、消息渠道、模型支持逐层拆开比较，并给出 6 类典型场景的选型直判。

01 · 哲学之争 · Gateway-first vs Agent-first

OpenClaw 的核心是 Gateway——一个长驻进程（默认端口 18789），充当所有消息（WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Teams、Google Chat…）的唯一控制面。Gateway 接到消息后，决定路由给哪个 agent、加载哪个 session、调用哪些工具，再回写到原渠道。这是“流量入口即上帝”的设计哲学——网关存在的那一刻，agent 才存在。

Hermes Agent 走的是另一条路：把 Agent loop 本身当作产品。它的核心循环是“do · learn · improve”——执行任务、读 trace、改 prompt、保留前沿，下一次就更快。Hermes 不在乎你从哪个渠道来——你给它一个 CLI / Webhook / Slack bot 都行，但它所有的优化都围绕”那个核心 agent”。

▲ 图 1 · OpenClaw 是”中央广场”，Hermes 是”独居修行者”

02 · 技术规格硬对比

维度	🦞 OpenClaw	🐎 Hermes Agent
默认模型	Anthropic Claude Sonnet	Nous Research Hermes 3（Llama 3.1 微调）
上下文 / 多模型	遵循接入模型上限	128K · 支持 OpenRouter 200+ / NVIDIA NIM / GLM / Kimi / MiniMax 等
内置 Skill / Template	162 模板（社区 awesome-openclaw-agents）	118 skill（v0.10.0 内置）+ 可生成新 skill
消息渠道	WhatsApp · Telegram · Slack · Discord · Signal · iMessage · Teams · Google Chat （8+）	Slack · Telegram · Discord 等 6 集成
学习闭环	无原生学习层	GEPA + DSPy （ICLR 2026 Oral 论文）
记忆方式	SOUL.md / AGENTS.md / TOOLS.md / MEMORY.md / HEARTBEAT.md（纯 Markdown）	三层记忆栈（Session + SQLite/FTS5 + Preference）
部署方式	Gateway 长驻进程（容器或宿主机）	单条 `curl install` · Linux/macOS/WSL2
许可	Apache 2.0	MIT
GitHub Stars（截至 2026-05-01）	~ 345K（Token 用量 #1 · 19.9T OpenRouter）	~ 110K（10 周冲到，最快增长）

03 · 记忆架构 · 文件家族 vs 三层栈

OpenClaw 的记忆系统是”文件即记忆“——所有知识都存在 markdown 文件里：

SOUL.md

— agent 人格、价值观、口吻、边界（每个 session 起点必读）
AGENTS.md

— 多 agent 分工与路由规则
TOOLS.md

— 可调用工具清单
MEMORY.md

— 长期记忆（项目结束时手工沉淀）
HEARTBEAT.md

— 定时任务与 cron 配置

这套设计的最大优点是透明可控：所有 agent 状态都可以 git 跟踪、人类直接编辑；缺点也明显——没有自动学习，agent 不会从错误里”长出”新行为，新经验需要你手工写进 MEMORY.md。

Hermes Agent 走的是三层数据栈：

L1SESSION

当前对话上下文（标准 LLM context window 管理）

L2PERSISTENT

SQLite + FTS5

全文检索 · 跨会话事实/偏好/学到的上下文

L3SKILL / PREFERENCE

可复用 skill 文档（捕获”做某类事的最佳套路”）+ 用户偏好画像

每完成一次任务，Hermes 会自动总结到 L2/L3——这意味着它跟你越久，越聪明。但代价是：当出问题时，状态藏在 SQLite 二进制里，调试与导出都不如 Markdown 直观。

04 · GEPA 自演化机制 · Hermes 真正的杀手锏

Hermes 最有学术分量的部分是 GEPA（Genetic-Pareto，ICLR 2026 Oral 接受）——这是它和”普通 Agent 框架”的根本区别。

GEPA 的工作流分 5 步：

▲ 图 2 · GEPA 不是”让 LLM 自我反思”那种玄学，而是有约束的进化算法

几个关键工程细节值得展开：

Trace 不是日志

——它包含每一步 tool call 的输入、输出、耗时、错误码，是结构化的”复盘材料”，比单纯 print 日志信息密度高得多。
DSPy 来 mutate

——不是 LLM 自己写 prompt 改 prompt（那样会发散），而是用 DSPy 的有约束 prompt 编程框架做”定向变异“，候选 prompt 必须通过签名校验。
Pareto 过滤

——评分维度通常是”准确度 / 延迟 / token 成本”三轴，新候选必须在至少一轴前沿才能保留，避免过拟合。
Skill 是 markdown

——产出的”skill”本质是一份 markdown 文档，记录”做这类任务时应该用哪个工具序列、注意哪些 edge case”，下次直接当作”额外 system prompt 段”复用。

▌点评 GEPA 的”40% 加速”不是噱头，它的可信度来自三件事：① ICLR 2026 Oral 同行评议；② 评测在公开 benchmark 上跑（不是厂商自定基准）；③ 开源全部代码（hermes-agent-self-evolution）。这是 2026 年开源 Agent 第一次把”自演化“从 PPT 变成可复现工程。

05 · 消息渠道与多模型生态

渠道广度上 OpenClaw 完胜。它原生支持 8+ 主流消息平台（WhatsApp、Telegram、Slack、Discord、Signal、iMessage、Microsoft Teams、Google Chat），加上社区 bridge 还能接 LINE、企微、飞书。所有渠道都汇聚到 Gateway，可以把”WhatsApp 来的家庭事务”和”Slack 来的工作请求”路由到同一个 agent，也可以路由到不同的 workspace agent，互相隔离。

多模型支持上 Hermes 更激进。它默认跑 Hermes 3（Llama 3.1 微调），但 hermes model 一行命令就能切到：Nous Portal、OpenRouter（200+ 模型）、NVIDIA NIM（Nemotron 3 Nano Omni）、小米 MiMo、智谱 GLM、月之暗面 Kimi、MiniMax、Hugging Face、OpenAI——零代码、零厂商锁定。这种”模型路由器“哲学让它在国内外开源生态里都能跑。

06 · 6 类典型场景选型直判

使用场景	推荐	理由
家庭/个人助理 · 多渠道触达	OpenClaw	8+ 渠道原生支持 + 162 模板生态
单人重复工作流 · 每天跑同样任务	Hermes Agent	20+ skills 后 +40% 速度
企业多团队多 Agent 编排	OpenClaw	workspaces 隔离 + 单控制面运维
研究 self-improving Agent	Hermes Agent	GEPA 论文级开源 · 可复现
配置敏感 · 完全 git-tracked	OpenClaw	全 markdown 文件 · diff 友好
最小依赖 · 一行 curl 跑起来	Hermes Agent	curl install 单脚本即装即用

▌ 终判 · “网关的优雅 vs 进化的诱惑”

广度选 OpenClaw——你需要”人去哪 agent 就到哪“，需要把多 agent 装进同一个团队的工作流，需要一切配置都看得见摸得着。它的胜负手是统一控制面 + 模板生态。

深度选 Hermes Agent——你的工作有极强的重复性，你愿意让 agent”跟你越久越聪明“，你想看到”自演化”在生产环境的真实效果。它的胜负手是 GEPA 闭环 + 三层记忆。

趋势：终将合流。 Hermes 已经支持安装 OpenClaw 社区 skill（ClawHub），从 OpenClaw 到 Hermes 的官方迁移工具也已存在。未来 12 个月会出现”OpenClaw + Hermes 混合部署“的最佳实践——OpenClaw 当前端聚合器、Hermes 当后端”会学习的执行核”。

对开发者：2026 下半年值得投入时间学的不是”再多一个 Langchain Agent”，而是这两个产品中至少一个的架构思维——Gateway 思维、或 Self-evolving 思维。

AI 行业日报 · 产品深度拆解系列 · 仅供研究参考

数据来源：openclaw/openclaw GitHub · NousResearch/hermes-agent · ICLR 2026 · 各厂商官方文档

2026.05.01