Hermes vs OpenClaw:Agent 框架卷到头了?
深度拆解 Hermes Agent vs OpenClaw:AI Agent 框架卷到头了?
原创 小谢小哥 2026-05-23
最近 Hermes Agent 在技术社区里火了一把。作为 Nous Research(也就是训练了 Hermes、Nomos 等模型的那个 AI 实验室)的开源新作,它带着”自我进化的 AI Agent”的标签杀入战场,不少朋友跑来问我:
“Hermes 能不能干翻 OpenClaw?要不要切换?”
我花了一整天认真研究了 Hermes 的完整文档,和现有的 OpenClaw 做了深度逐项对比,最终结论是:继续用 OpenClaw,定期观察 Hermes。
下面是我的完整思考过程。希望能给同样在观望的朋友一个参考。
一、Hermes Agent 是什么?
Hermes Agent 是由 Nous Research 开源的自主 Agent 框架,MIT 协议。它最核心的设计理念是“闭合学习闭环(Closed Learning Loop)”——Agent 能从使用经历中自动学习、积累知识、持续进化。
核心能力一览:
- 持久记忆系统
:维护 MEMORY.md(约 2200 字符)记录环境事实,USER.md(约 1375 字符)记录用户偏好,所有会话存储在 SQLite(FTS5 全文检索),支持跨 session 回溯 - 6 种运行环境
:本地、Docker、SSH、Daytona、Singularity、Modal。Daytona/Modal 支持无服务器持久化,空闲休眠成本几乎为零 - 15+ 平台消息网关
:Telegram、Discord、Slack、WhatsApp、Signal、WeCom、Feishu……一个 gateway 统一管理 - Skills 生态
:遵循 agentskills.io 开放标准,渐进式披露加载,先拉摘要列表,需要时再加载全文,节省 token - 47 个内置工具
、19 个 toolset、MCP 支持、语音模式、浏览器自动化、子 Agent 并行委托、IDE 集成(VS Code / Zed / JetBrains)
从功能清单来看,这确实是一个野心不小、功能完整的项目。
二、Hermes vs OpenClaw:硬核逐项对比
先说结论:在基础能力层面,两者的差距比很多人想象的要小得多。
我画了一张对比表,一目了然:

|
|
|
|
|---|---|---|
| 记忆系统 |
|
|
| 消息平台 |
|
|
| 技术栈 |
|
|
| 运行环境 |
|
|
| 技能生态 |
|
|
| MCP 支持 |
|
|
| 定时任务 |
|
|
| 子 Agent |
|
|
| IDE 集成 |
|
|
| 最大差异 | 技能自动创建
|
|
看到这个表格,你会发现:两者在核心能力上高度趋同。记忆系统、MCP、子 Agent、技能生态……这些你有的我也有。
唯一的结构性差异,就是 Hermes 的技能自动创建。这也是它最值得讨论的地方。
三、唯一差异:技能自动创建——天使还是魔鬼?
什么是技能自动创建?
Hermes 的技能系统有两层:
- 安装层
:从社区 Hub 安装现成 Skill - 创造层
:Agent 在使用过程中自动创建新 Skill
自动创建的触发条件包括:完成复杂任务(5+ 次工具调用)、成功排坑、被用户纠正做法、发现非显式工作流。触发后,Agent 会通过 skill_manage 工具把这个”走通了的路”结构化为 Skill 文档,保存在 ~/.hermes/skills/ 下。
这本质上是把用户的使用经历转化为 Agent 的能力增量。普通 Agent 每次遇到复杂任务都是从零推理,而 Hermes 积累的 Skill 库能直接加载已验证的流程,效率叠加速度非常可观。

优点:正向飞轮
- 能力随时间增长
——用得越多,Skill 越多,效率越高 - 知识可复用可分享
——开放标准,社区可沉淀经验 - 降低重复推理成本
——相当于给 Agent 装了一本操作手册
缺点:三大隐患
- 数量膨胀
:长期重度使用后,自动创建的 Skill 可能积累到数百甚至上千。同类任务反复创建相似 Skill,冗余严重,难以维护。 - 质量稀释
:自动创建的 Skill 未必通用——可能记录了”当时恰好走通但并不通用”的路径,未来反而误导 Agent。 - 系统提示臃肿
:Skill 通过系统提示注入,即便渐进式披露,随着数量增长系统提示仍会越来越臃肿,影响 context 利用效率。
目前文档中提到的缓解措施主要是渐进式三级加载,并没有提到 LRU 淘汰或自动清理机制。这意味着 Skill 膨胀问题是真实存在的、尚未被完全解决的。
四、Agent 框架的标配化浪潮
评估 Hermes 时,有一个背景值得关注:主流 Agent 框架在核心模块层面已经高度趋同。
横向对比 Hermes、OpenClaw、Claude Code、Cursor、Aider,它们的核心能力几乎都是同一套矩阵:
-
LLM 接入(多 provider + 本地模型) -
Skills / 知识文档(SKILL.md、CLAUDE.md、AGENTS.md) -
工具集(文件、终端、Web、浏览器) -
MCP(已成事实标准) -
跨 session 记忆 -
上下文文件注入(SOUL.md 人格定义) -
定时任务调度 -
安全机制(命令审批、沙箱、allowlist) -
多渠道消息网关

这个核心列表在过去一两年已经基本稳定下来,成为”现代 Agent 框架”的标配。各家差异越来越体现在执行质量、生态成熟度、还有少数几个差异化特性上。
这意味着,当你看到一个新 Agent 宣称某项”独特能力”时,第一个问题应该是:这真的是结构性的差异化,还是别人还没做但很快会跟进的功能?
五、我的选择:不切换,但不等于不关注
综合以上分析,我决定继续使用 OpenClaw,四个理由:
1. 稳定性和安全性需要时间验证
Hermes 是相对较新的项目。Agent 框架运行在你的机器上、访问你的文件、执行终端命令——稳定性和安全的门槛比普通工具高得多。我倾向于等它在社区跑过足够真实场景后再评估。
2. 最大差异点可以人工弥补
“技能自动创建”我可以用手动方式实现:完成复杂任务后,自己整理工作流程写一个 Skill 文档。不够自动化,但够用。为了一个可人工替代的功能承受切换成本和稳定性风险,不值得。
3. 技能自动创建自身的问题还没解决好
如第三节分析,Skill 膨胀、质量稀释、系统提示臃肿——这些副作用目前没有有效的自动清理机制。一个有明显未解决问题的新功能,不值得着急用。
4. 这一差距其他 Agent 很快就能补齐
这是最关键的一点。“技能自动创建”从技术实现看门槛并不高:检测复杂任务→触发写文件 prompt→保存到磁盘。任何已有文件读写工具的 Agent 今天就能实现。
Claude Code 已经有 CLAUDE.md,距离完整自动创建只差”自动触发创造”和”跨项目技能库”两步。OpenClaw 同理。
这意味着 Hermes 在这个功能上的先发优势窗口期不会太长。我没理由为了一个竞品很快会跟进的特性,现在就切换。
六、实用建议:如何评估一个新 Agent 工具
把这个思考框架分享给所有正在观望的朋友:
- 列出现有工具的完整能力清单
——别只看宣传页,看文档和源码 - 找出新工具的真正差异化能力
——它有没有你现有工具完全做不到的事? - 判断差异化是否可持续
——这是技术壁垒还是先发优势?其他人复制成本有多高? - 评估切换成本
——配置迁移、习惯改变、社区依赖、生态成熟度 - 给新工具留出成熟期
——让社区替你踩坑,6个月再评估一次

写在最后
Hermes Agent 是一个认真做的项目,来自有真实技术积累的团队,方向正确。”技能自动创建”也是让 Agent 进化的正确方向。
但一个工具值得关注,和值得立刻切换,是两件不同的事。
我的结论:继续用 OpenClaw,定期观察 Hermes 的社区反馈和版本迭代。等稳定性验证了、Skill 膨胀问题有了解法、或者出现了无法替代的功能——再切换不迟。
如果你也在观望,建议关注 Nous Research 的 GitHub releases 和 Discord 社区,大概半年内就能看出它是否到了值得切换的成熟度。
工具是手段,不是目的。选最稳的那个,持续输出才是王道。🛠️
关于我:技术博客作者,10年全栈开发,关注 AI Agent、云原生、后端架构。分享实战经验,不整虚的。
夜雨聆风