乐于分享
好东西不私藏

Hermes vs OpenClaw:Agent 框架卷到头了?

Hermes vs OpenClaw:Agent 框架卷到头了?

深度拆解 Hermes Agent vs OpenClaw:AI Agent 框架卷到头了?

原创 小谢小哥 2026-05-23

最近 Hermes Agent 在技术社区里火了一把。作为 Nous Research(也就是训练了 Hermes、Nomos 等模型的那个 AI 实验室)的开源新作,它带着”自我进化的 AI Agent”的标签杀入战场,不少朋友跑来问我:

“Hermes 能不能干翻 OpenClaw?要不要切换?”

我花了一整天认真研究了 Hermes 的完整文档,和现有的 OpenClaw 做了深度逐项对比,最终结论是:继续用 OpenClaw,定期观察 Hermes

下面是我的完整思考过程。希望能给同样在观望的朋友一个参考。

一、Hermes Agent 是什么?

Hermes Agent 是由 Nous Research 开源的自主 Agent 框架,MIT 协议。它最核心的设计理念是“闭合学习闭环(Closed Learning Loop)”——Agent 能从使用经历中自动学习、积累知识、持续进化。

核心能力一览:

  • 持久记忆系统
    :维护 MEMORY.md(约 2200 字符)记录环境事实,USER.md(约 1375 字符)记录用户偏好,所有会话存储在 SQLite(FTS5 全文检索),支持跨 session 回溯
  • 6 种运行环境
    :本地、Docker、SSH、Daytona、Singularity、Modal。Daytona/Modal 支持无服务器持久化,空闲休眠成本几乎为零
  • 15+ 平台消息网关
    :Telegram、Discord、Slack、WhatsApp、Signal、WeCom、Feishu……一个 gateway 统一管理
  • Skills 生态
    :遵循 agentskills.io 开放标准,渐进式披露加载,先拉摘要列表,需要时再加载全文,节省 token
  • 47 个内置工具
    、19 个 toolset、MCP 支持、语音模式、浏览器自动化、子 Agent 并行委托、IDE 集成(VS Code / Zed / JetBrains)

从功能清单来看,这确实是一个野心不小、功能完整的项目

二、Hermes vs OpenClaw:硬核逐项对比

先说结论:在基础能力层面,两者的差距比很多人想象的要小得多。

我画了一张对比表,一目了然:

对比维度
Hermes Agent
OpenClaw
记忆系统
MEMORY.md + USER.md + SQLite FTS5
MEMORY.md + 每日笔记 + 混合语义搜索 + Dreaming 自动整合
消息平台
15+ 平台
10+ 平台(可插件扩展)
技术栈
Python
Node.js
运行环境
6 种(含 Daytona/Modal 无服务器)
本地 / Docker / SSH / Tailscale
技能生态
agentskills.io + skills.sh + 多 Hub
ClawHub + LobeHub + 自定义
MCP 支持
✅ 支持
✅ 支持
定时任务
✅ Cron
✅ Cron + Heartbeat
子 Agent
✅ 子 Agent 委托
✅ Sub-agent + ACP 协议
IDE 集成
VS Code / Zed / JetBrains
VS Code 插件
最大差异 技能自动创建

:自动从使用经历创建 Skill 文档
需手动编写 Skill

看到这个表格,你会发现:两者在核心能力上高度趋同。记忆系统、MCP、子 Agent、技能生态……这些你有的我也有。

唯一的结构性差异,就是 Hermes 的技能自动创建。这也是它最值得讨论的地方。

三、唯一差异:技能自动创建——天使还是魔鬼?

什么是技能自动创建?

Hermes 的技能系统有两层:

  • 安装层
    :从社区 Hub 安装现成 Skill
  • 创造层
    :Agent 在使用过程中自动创建新 Skill

自动创建的触发条件包括:完成复杂任务(5+ 次工具调用)、成功排坑、被用户纠正做法、发现非显式工作流。触发后,Agent 会通过 skill_manage 工具把这个”走通了的路”结构化为 Skill 文档,保存在 ~/.hermes/skills/ 下。

这本质上是把用户的使用经历转化为 Agent 的能力增量。普通 Agent 每次遇到复杂任务都是从零推理,而 Hermes 积累的 Skill 库能直接加载已验证的流程,效率叠加速度非常可观。

优点:正向飞轮

  • 能力随时间增长
    ——用得越多,Skill 越多,效率越高
  • 知识可复用可分享
    ——开放标准,社区可沉淀经验
  • 降低重复推理成本
    ——相当于给 Agent 装了一本操作手册

缺点:三大隐患

  1. 数量膨胀
    :长期重度使用后,自动创建的 Skill 可能积累到数百甚至上千。同类任务反复创建相似 Skill,冗余严重,难以维护。
  2. 质量稀释
    :自动创建的 Skill 未必通用——可能记录了”当时恰好走通但并不通用”的路径,未来反而误导 Agent。
  3. 系统提示臃肿
    :Skill 通过系统提示注入,即便渐进式披露,随着数量增长系统提示仍会越来越臃肿,影响 context 利用效率。

目前文档中提到的缓解措施主要是渐进式三级加载,并没有提到 LRU 淘汰或自动清理机制。这意味着 Skill 膨胀问题是真实存在的、尚未被完全解决的。

四、Agent 框架的标配化浪潮

评估 Hermes 时,有一个背景值得关注:主流 Agent 框架在核心模块层面已经高度趋同

横向对比 Hermes、OpenClaw、Claude Code、Cursor、Aider,它们的核心能力几乎都是同一套矩阵:

  • LLM 接入(多 provider + 本地模型)
  • Skills / 知识文档(SKILL.md、CLAUDE.md、AGENTS.md)
  • 工具集(文件、终端、Web、浏览器)
  • MCP(已成事实标准)
  • 跨 session 记忆
  • 上下文文件注入(SOUL.md 人格定义)
  • 定时任务调度
  • 安全机制(命令审批、沙箱、allowlist)
  • 多渠道消息网关

这个核心列表在过去一两年已经基本稳定下来,成为”现代 Agent 框架”的标配。各家差异越来越体现在执行质量、生态成熟度、还有少数几个差异化特性上。

这意味着,当你看到一个新 Agent 宣称某项”独特能力”时,第一个问题应该是:这真的是结构性的差异化,还是别人还没做但很快会跟进的功能?

五、我的选择:不切换,但不等于不关注

综合以上分析,我决定继续使用 OpenClaw,四个理由

1. 稳定性和安全性需要时间验证

Hermes 是相对较新的项目。Agent 框架运行在你的机器上、访问你的文件、执行终端命令——稳定性和安全的门槛比普通工具高得多。我倾向于等它在社区跑过足够真实场景后再评估。

2. 最大差异点可以人工弥补

“技能自动创建”我可以用手动方式实现:完成复杂任务后,自己整理工作流程写一个 Skill 文档。不够自动化,但够用。为了一个可人工替代的功能承受切换成本和稳定性风险,不值得。

3. 技能自动创建自身的问题还没解决好

如第三节分析,Skill 膨胀、质量稀释、系统提示臃肿——这些副作用目前没有有效的自动清理机制。一个有明显未解决问题的新功能,不值得着急用。

4. 这一差距其他 Agent 很快就能补齐

这是最关键的一点。“技能自动创建”从技术实现看门槛并不高:检测复杂任务→触发写文件 prompt→保存到磁盘。任何已有文件读写工具的 Agent 今天就能实现。

Claude Code 已经有 CLAUDE.md,距离完整自动创建只差”自动触发创造”和”跨项目技能库”两步。OpenClaw 同理。

这意味着 Hermes 在这个功能上的先发优势窗口期不会太长。我没理由为了一个竞品很快会跟进的特性,现在就切换。

六、实用建议:如何评估一个新 Agent 工具

把这个思考框架分享给所有正在观望的朋友:

  1. 列出现有工具的完整能力清单
    ——别只看宣传页,看文档和源码
  2. 找出新工具的真正差异化能力
    ——它有没有你现有工具完全做不到的事?
  3. 判断差异化是否可持续
    ——这是技术壁垒还是先发优势?其他人复制成本有多高?
  4. 评估切换成本
    ——配置迁移、习惯改变、社区依赖、生态成熟度
  5. 给新工具留出成熟期
    ——让社区替你踩坑,6个月再评估一次

写在最后

Hermes Agent 是一个认真做的项目,来自有真实技术积累的团队,方向正确。”技能自动创建”也是让 Agent 进化的正确方向。

一个工具值得关注,和值得立刻切换,是两件不同的事

我的结论:继续用 OpenClaw,定期观察 Hermes 的社区反馈和版本迭代。等稳定性验证了、Skill 膨胀问题有了解法、或者出现了无法替代的功能——再切换不迟。

如果你也在观望,建议关注 Nous Research 的 GitHub releases 和 Discord 社区,大概半年内就能看出它是否到了值得切换的成熟度。

工具是手段,不是目的。选最稳的那个,持续输出才是王道。🛠️


关于我:技术博客作者,10年全栈开发,关注 AI Agent、云原生、后端架构。分享实战经验,不整虚的。