乐于分享
好东西不私藏

Hermes Agent vs OpenClaw:2026 年开源 AI代理深度对比

Hermes Agent vs OpenClaw:2026 年开源 AI代理深度对比

#Hermes #HermesAgent #OpenClaw

📅 2026-05-06 | 基于官方文档、实测文章、社区反馈和安全报告综合分析

引言

2026 年初,开源 AI代理领域涌现两个明星项目:Hermes Agent(Nous Research)和 OpenClaw。两者均定位为持久化、自托管的 AI代理框架,但设计哲学、技术架构和核心能力存在根本差异。

Hermes Agent 于 2026 年 2 月 25 日发布,7 周内 GitHub 星标突破 95.6K。OpenClaw 作为先行者,已积累 345K+ 星标,ClawHub 技能市场超过 13,000 个技能。

背景:2026 年 2 月 OpenClaw 单周吸引 200 万访客,创始人 Peter Steinberger 于 2 月 15 日加入 OpenAI,项目移交非营利基金会治理。Hermes Agent 由 Nous Research(Hermes/Nomos/Psyche 开源模型实验室)打造,走”自我进化”路线。

一、平台基本信息

维度
Hermes Agent
OpenClaw
出品方
Nous Research(开源模型实验室)
OpenClaw 开源社区(非营利基金会)
Slogan
“The Agent That Grows With You”
持久化 AI代理运行时
首次发布
2026-02-25
2025 年(原名 Clawdbot,2026-01-27 更名)
GitHub Stars
95.6K+
345K+
许可证
MIT
Apache 2.0
编程语言
Python(核心 ~13,700 行)
Node.js/TypeScript
企业版
无(纯开源)
NVIDIA NemoClaw
开发节奏
极快(v0.9.0 两周 209 PR)
稳定迭代

二、架构哲学:认知驱动 vs 执行驱动

2.1 Hermes Agent:自我进化的认知核心

架构:Agent-first(网关围绕代理构建)

核心理念:Harness Engineering, Productized

Harness Engineering 是 2026 年初 AI代理领域最重要的方法论。LangChain 实验表明,保持模型不变,仅调整周围的”Harness”(指令、约束、反馈循环、记忆、编排),基准分数从 52.8% 提升至 66.5%,排名从 30 名外跃升至前 5。

Hermes 将 Harness 五组件全部内置:

Harness 层
手动实现
Hermes 内置
指令
手写 CLAUDE.md
技能系统(自动创建 + 自我改进)
约束
Hooks / Linters / CI
工具权限 + 沙箱执行
反馈
人工审查
自我改进学习循环
记忆
手工维护知识库
三层记忆 + Honcho 用户建模
编排
自建多代理管道
子代理 + Cron 调度

左边是高级工程师 6 个月的项目,右边是 curl install.sh | bash+ 编辑一个 YAML。

2.2 OpenClaw:重型有状态沙箱

架构:Gateway-first(代理围绕消息网关构建)

核心理念:Skills-first——通过技能市场(ClawHub)提供预构建能力,而非让代理自我进化。核心能力:重型沙箱、持久化状态、物理执行、崩溃后自动恢复。

比喻:Hermes 像超级聪明的”大脑”——善于推理、学习和适应;OpenClaw 像全能的”身体”——善于执行、操作和持久工作。

三、核心技术能力对比

维度
Hermes Agent
OpenClaw
设计哲学
Agent-first(网关围绕代理)
Gateway-first(代理围绕消息)
自我改进
内置学习循环,自动创建/改进技能
静态技能,由提示驱动
记忆架构
三层记忆 + FTS5 + Honcho + 8 种外部插件
文件式 + 原生向量记忆层(v1.4)
技能系统
agentskills.io 标准,渐进式加载,代理自管理
SKILL.md 标准,ClawHub 市场,13,000+ 技能
工具数量
61 个工具,52 个工具集
100+ AgentSkills
执行环境
7 种终端后端(本地/Docker/SSH/Daytona/Modal/Singularity/Vercel)
有状态沙箱(终端 + 文件系统 + 浏览器)
消息平台
20 个(含飞书/钉钉/企微/iMessage)
24+(含 WeChat/LINE/Teams 等)
子代理
隔离子代理(最多 3 并发),并行工作流
持久化代理团队,跨会话状态共享
定时任务
内置 Cron(一等公民)
Cron + 心跳系统
MCP 支持
✅ 完整支持,触达 6,000+ MCP 应用
✅ 深度集成
语音模式
✅ 实时语音(CLI/Telegram/Discord/Discord VC)
通过技能扩展
IDE 集成
ACP 协议(VS Code/Zed/JetBrains)
通过技能/插件
模型灵活性
按技能路由,OpenRouter 200+ 模型
需修改多个代理定义
多模态输入
通过技能扩展
✅ GA(PDF/图片/屏幕录制,v1.4)
浏览器自动化
v0.8.0 新增 Browser Use + Firecrawl
内置浏览器工具
Git 并行
✅ git worktree 并行分支
通过技能

四、核心亮点深度解析

4.1 Hermes 的闭式学习循环

每次完成非平凡任务时,自动执行五步学习循环:

用户完成任务
    ↓
1. 整理记忆(Curate Memory)—— 哪些内容值得保留?
    ↓
2. 创建技能(Create Skill)—— 这是重复模式吗?
    ↓
3. 改进技能(Refine Skill)—— 已有技能是否出错?
    ↓
4. FTS5 检索(FTS5 Recall)—— 按需检索相关历史
    ↓
5. 用户建模(User Modeling)—— Honcho 从行为模式推断特征
    ↓
下一次会话(效果叠加)

实际效果:第一次让 Hermes 写 Python 爬虫,生成的脚本能用但风格不对——变量命名、错误处理都不符合你的习惯。到第十次,它知道你偏好 httpx 而非 requests,知道你喜欢把错误日志写入文件而非 stderr,知道你的项目结构和测试约定。没有人教过它——它自己学会了。

Nous Research 内部基准测试显示,拥有 20+ 个自创建技能的代理完成类似任务的速度**快 40%**(节省 token 和时间,而非提升质量)。

4.2 Honcho:辩证用户建模

Honcho 是 Hermes 最独特的记忆后端,提供辩证推理深度用户建模

  • 不是简单的键值存储:维护一个关于”你是谁”的持续模型——偏好、沟通风格、目标、行为模式
  • 事后推理:对话结束后分析交流内容,推断你未明确表达的需求
  • 多轮推理:支持多轮辩证推理,逐步深化用户画像
  • 热/冷记忆:区分近期活跃记忆和历史沉淀记忆

与 OpenClaw 对比:OpenClaw 的记忆是三个纯文本文件(SOUL.md、MEMORY.md、USER.md),跨会话记忆需要用户手动配置。Hermes 的分层持久化架构是自动的。

4.3 记忆架构对比

核心设计理念

Hermes 的记忆系统对应认知科学的三种人类记忆类型:

层级
类型
机制
回答的问题
会话记忆
情景记忆(Episodic)
SQLite + FTS5(10K+ 条目 ~10ms)
“发生了什么?”
持久记忆
语义记忆(Semantic)
提炼状态:偏好、习惯、工具链
“你是谁?”
技能记忆
程序记忆(Procedural)
Markdown 文件(~/.hermes/skills/)
“怎么做 X?”

关键设计:按需检索,非全量加载。新会话启动时仅拉取相关片段,避免将历史对话全量塞入上下文窗口。

插件架构

Memory Provider:通过 MemoryProviderABC 接口实现生命周期钩子:

  • prefetch()—— 模型调用前预取
  • sync_turn()—— 每轮对话后同步
  • shutdown()—— 会话结束时清理

召回模式支持 hybrid/context/tools,其中工具模式允许模型自主决定查询时机。

外部记忆插件(8 种):Honcho、OpenViking、Mem0、Hindsight、Holographic、RetainDB、ByteRover、Supermemory。提供知识图谱、语义搜索、自动事实提取等能力。

安全机制

记忆条目注入系统提示前,执行注入和泄露模式扫描,防御:

  • 提示注入攻击
  • 凭证泄露
  • SSH 后门
  • 不可见 Unicode 字符

OpenClaw 记忆方案

文件式 + 原生向量记忆层(v1.4),完全透明可读/可编辑/可审计,配合心跳系统定期维护。v1.4 向量记忆层将上下文开销降低 30%。

实测经验:让 OpenClaw 起草跟进邮件,它拉入了两天前研究代理的上下文(有用),但也带入了完全不同客户的 Telegram 对话和未完成的 Slack 草稿——输出第二段提到了错误的公司名。更多记忆 ≠ 更好记忆,有时意味着模型带着旧垃圾进入新任务。Hermes 的分层检索更自律,不会用不相关记忆打断自己。

实际场景对比:Python 爬虫开发

场景一:首次开发(单次任务)

步骤
Hermes Agent
OpenClaw
代码生成
生成 Python 代码,输出到终端
写入文件 scraper.py
执行环境
通过终端工具执行
在沙箱中执行
结果读取
读取标准输出
读取标准输出和错误日志
错误调试
根据错误信息重新生成代码
读取错误日志,自动修改代码
依赖管理
终端执行 pip install
沙箱内执行 pip install
调试循环
依赖 LLM 推理,手动重复
REPL 模式,自动循环直到成功

场景二:跨会话复用(长期演进)

维度
Hermes Agent
OpenClaw
状态持久化
会话结束后状态丢失,依赖记忆系统恢复
文件系统和环境状态持久保留
技能沉淀
自动生成技能文件,下次直接调用
需手动保存或编写技能
偏好学习
第十次调用时已掌握你的编码习惯
每次需重新指定或依赖记忆检索
复用效率
高(自进化技能加速)
中(依赖手动维护)

场景三:企业级数据管道(多步骤复杂任务)

假设场景:每天从 5 个数据源抓取数据,清洗后写入数据库,生成报告发送到飞书群。

维度
Hermes Agent
OpenClaw
任务编排
父代理拆分任务,子代理并行执行
单代理顺序执行,或配置 Cron 定时任务
错误恢复
子代理失败后父代理重新调度
沙箱状态保留,可从断点继续
中间状态
依赖外部存储(如 S3)保存中间结果
文件系统直接保存,天然持久化
监控告警
通过 Cron + 飞书/Slack 通知
心跳系统主动检查 + 消息推送
配置变更
修改技能文件,自动生效
修改配置,重启代理

场景四:个人研究助手(知识积累型)

假设场景:跟踪某个技术领域的最新论文、开源项目、社区讨论,定期生成研究简报。

维度
Hermes Agent
OpenClaw
知识积累
Honcho 自动建模你的研究兴趣
手动维护 MEMORY.md 中的研究偏好
信息检索
FTS5 快速检索历史笔记
向量记忆层语义搜索
内容生成
基于自创建技能自动生成简报
通过 ClawHub 技能或手动编写
长期演进
越用越懂你的研究品味
需要持续手动调优提示词

关键差异:Hermes 的”学习循环”让它在第十次写爬虫时已掌握你的偏好;OpenClaw 的”有状态沙箱”让它在同一次任务中就能完成完整调试循环。两者各有所长——Hermes 擅长跨会话持续改进,OpenClaw 擅长单次任务深度执行。

4.4 OpenClaw 的技能市场

ClawHub 技能市场超过 13,000 个技能,涵盖 Notion 同步、Linear 工单分类、日历解析、Gmail 标签等。2026 年 3 月起,标记为”生产就绪”的技能需要 eval harness 文件才能进入注册表。

五、多代理与编排对比

5.1 架构对比

维度
Hermes Agent
OpenClaw
多代理模式
父代理 + 隔离子代理(最多 3 并发)
持久化代理团队,跨会话状态共享
子代理通信
无(完成工作,汇报后消失)
代理间可通信、共享状态
多通道绑定
可能但非重点
原生支持(每通道独立代理)
后台执行
轻量,$5 VPS 友好
较重,本地机器导向
零上下文成本
✅ 子代理独立对话/终端/Python RPC
部分

比喻:OpenClaw 像一家公司——多个代理协作。Hermes 像一个操作员带着临时承包商——快速并行执行。

5.2 典型编排模式

Hermes Agent:并行探索模式

父代理(GPT-5.4)
    ├── 子代理 1(MiniMax M2.7)→ 方案 A
    ├── 子代理 2(Qwen 35B)→ 方案 B
    └── 子代理 3(Claude)→ 方案 C
父代理汇总评估,选择最优方案

OpenClaw:流水线模式

代理 1(数据收集)→ 代理 2(数据分析)→ 代理 3(报告生成)→ 代理 4(发布推送)
        ↓                    ↓                    ↓                    ↓
    共享状态池(文件系统 + 数据库)

六、安全对比:关键分歧

6.1 CVE 记录

维度
Hermes Agent
OpenClaw
代理专属 CVE
零个
9+ 个(2026 年 3 月 4 天内披露)
最高 CVSS 评分
N/A
9.9

6.2 OpenClaw 重大安全事件

CVE-2026-25253(CVSS 8.8):跨站 WebSocket 劫持。/api/export-auth端点缺少认证,允许提取所有 API Token。

135,000+ 暴露实例:安全研究者在 82 个国家发现 135,000+ 个暴露的 OpenClaw 实例。

根本原因:架构性的。OpenClaw 被设计为消费级本地工具,后来成长为网络化代理。安全假设(信任本地网络、信任市场提交、暴露无认证的管理 API)对个人工具合理,规模化时变得危险。

6.3 ClawHavoc:大规模技能投毒攻击

指标
数据
攻击名称
ClawHavoc(Koi Security 命名)
初始审计
2,857 个技能中发现 341 个恶意条目
后续更新
市场 10,700+ 技能时,恶意技能升至 824+
Bitdefender 分析
近 900 个恶意技能,约占 20%
攻击手法
类型混淆、自动化突袭(单用户上传 354 个恶意包)
恶意载荷
Atomic macOS Stealer 变体、凭证窃取工具

6.4 Hermes 的安全优势

  • 零 CVE:截至 2026 年 4 月,零个代理专属 CVE
  • 容器加固:子代理命名空间隔离
  • 凭证轮换:v0.7.0 可插拔记忆提供商
  • 自生成技能:完全规避供应链攻击
  • 记忆安全扫描:注入/泄露模式检测 + Unicode 检测

⚠️ 注意:Hermes 较年轻(2026 年 2 月发布),暴露时间更短。零 CVE 令人鼓舞,但不是保证。

七、部署、成本与模型

7.1 部署选项

部署方式
Hermes Agent
OpenClaw
本地安装
Linux/macOS/WSL2,60 秒
npx openclaw

一键安装
Docker
✅(65% 用户采用)
无服务器
Daytona/Modal(空闲休眠)
托管服务
Hermify(社区)
DigitalOcean ~$24/月
企业版
NVIDIA NemoClaw

最低成本:Hermes 5-24/月 VPS

7.2 成本对比

成本项
Hermes Agent
OpenClaw
框架
免费(MIT)
免费(Apache 2.0)
VPS 托管
$5-10/月
$5-24/月
API 费用
$15-80/月
$15-80/月
总成本
$20-90/月
$20-104/月

7.3 模型支持与高性价比推荐

模型
上下文窗口
SWE-Bench
成本
最佳用途
Qwen 3.6 Plus

(阿里)
1M tokens
~70.6%
~$0.50/M tokens
轻量部署、预算优先
Kimi K2.5

(月之暗面)
256K tokens
~43.8%
~$2-4/M tokens
探索任务、多模态
GLM 5.1

(智谱 AI)
200K tokens
~42.1%
~$3/月 API
全面可靠、日常使用
MiniMax M2.7
1M tokens
~39.6%
单价最低但实际贵
编码挑战

建议:大多数团队从 GLM 5.1 或 Qwen 3.6 Plus 开始。Hermes 的按技能路由能力让你可以把廉价任务路由给小模型,保留昂贵模型用于推理。

八、真实使用场景

8.1 Hermes Agent 社区案例

来自 Hermes 官方用户故事页面(99 个故事,15 个类别):

场景
描述
开发工作流
TwitterDev 团队每天并行运行 12 个 Hermes 实例构建 Hermes Agent
多代理构建
主代理(GPT-5.4)规划 → 编码代理(MiniMax M2.7)实现 → QA 代理(Qwen 35B)测试
研究简报
每天通过 Discord/Slack/Notion/Obsidian 交付 AI 研究简报
交易
自学习天气交易机器人,48 小时 216
全家使用
一个 Hermes 实例服务全家 3 口人,通过 WhatsApp
自动化 streak
第 297 天:900,000+ 秒计算时间,50 亿+ tokens,$100K+ 客户工作价值
视频制作
使用 Browser-Use + Seedance 2.0 自动生成电影
看门狗
用 Hermes 监控和修复 OpenClaw
代码库理解
“第 10 天:它比我还了解我的代码库”

8.2 OpenClaw 社区案例

场景
描述
内容自动化
12,000 订阅者 Substack,200+ 信息源,人类编辑 30 分钟(原 6-8 小时)
社交媒体
自由营销者 6 个客户,减少 70% 工作量
SEO 博客
辅助文章 4-6 周排名(手动 8-12 周)
竞品情报
追踪 15 个竞品,提前 48 小时发现价格变动
视频摘要
每天处理 40+ YouTube 视频
个人谈判
研究定价 + 起草还价,省 $4,200 买车

九、社区声音与性能特征

9.1 Reddit 1,300+ 评论分析

基于 25 个最高参与度线程:

  • ~35%坚持使用 OpenClaw(生态成熟度)
  • ~25%已迁移到 Hermes(自我改进 + 安全性)
  • ~20%同时运行两者
  • ~20%仍在评估或已放弃自托管

最大痛点:不是选择哪个代理——而是自己运行它们。

用户反馈

  • “Hermes 的 token 消耗真的很疯狂——单次传递可能燃烧大量 token。但也许这就是它感觉更强大的原因。”
  • “OpenClaw 经常需要来回沟通,有时感觉它试图强加自己的解释。”

9.2 Token 效率与性能

维度
Hermes Agent
OpenClaw
Token 效率
较低(学习循环额外消耗)
较高(静态技能)
上下文开销
按需检索,精益
v1.4 后降低 30%
长任务恢复
更优
中等
响应速度
中等
较快
每任务 LLM 调用
10-20 次
5-15 次

权衡:Hermes 用更多 token 换取自我改进;OpenClaw 用更少 token 提供稳定性能。如果工作流高度重复,Hermes 的额外 token 消耗会在长期使用中通过技能加速收回。

十、失败模式与迁移

10.1 失败模式对比

失败模式
Hermes Agent
OpenClaw
如何失败
学习环可能产生错误技能
记忆膨胀导致上下文噪音
表现症状
代理用错误方式做熟悉的事
输出中混入不相关信息
供应链风险
极低(自生成技能)
较高(~20% 恶意率)
恢复难度
低(删除/编辑技能文件)
中等(审查和清理记忆)
透明度
高(UI 显示上下文用量)
低(需查看日志)

选择不应基于炒作,而应基于你能容忍的失败模式。

10.2 平台间迁移

方向
难度
说明
OpenClaw → Hermes
简单
内置迁移工具,技能自动映射
Hermes → OpenClaw
手动
核心配置可迁移,学习数据需重建

十一、适用场景与决策框架

选择 Hermes Agent 如果你:

  • 需要长期运行的个人 AI 助手,重视自我改进
  • 重复性工作多(日报、内容管道、研究循环)
  • 关注安全和供应链风险
  • 需要语音交互、IDE 集成、飞书/钉钉/企微
  • 经常测试不同模型,需要按技能灵活路由
  • 预算有限($5/月 VPS)

选择 OpenClaw 如果你:

  • 需要跨多通道管理多个代理
  • 需要代理之间的协作和状态共享
  • 重视有状态执行和沙箱环境
  • 需要团队大规模部署
  • 偏好丰富的社区技能生态(13,000+ 技能)
  • 需要透明可审计的记忆系统(合规要求)
  • 需要心跳主动检查、多模态输入

核心决策框架

需求
推荐
长期个人助手,重视自我进化
🧠 Hermes Agent
大规模团队部署,重视平台集成
🦞 OpenClaw
安全优先,控制攻击面
🧠 Hermes Agent
有状态执行,代码调试自动化
🦞 OpenClaw
多代理协作
🦞 OpenClaw
快速并行执行
🧠 Hermes Agent
模型灵活路由
🧠 Hermes Agent
预构建技能生态
🦞 OpenClaw
供应链安全
🧠 Hermes Agent
企业级托管支持
🦞 OpenClaw
  • 问题是编排(Orchestration)?→ OpenClaw
  • 问题是自动化且需要随时间改进?→ Hermes Agent
  • 需要管理多个代理?→ OpenClaw
  • 需要训练一个代理?→ Hermes Agent
  • 感觉像在管理系统?→ OpenClaw
  • 感觉像在训练系统?→ Hermes Agent
  • 安全是首要考量?→ Hermes Agent
  • 需要最广泛的平台覆盖?→ OpenClaw

**最佳实践**:未来成功的平台很可能采用混合架构——用 Hermes 式的认知核心进行快速分类和推理,用 OpenClaw 式的沙箱处理繁重的有状态执行。社区中已有用户将两者结合使用:OpenClaw 作为主代理,Hermes 作为”看门狗”代理监控和修复。两个平台都是开源许可,没有供应商锁定,随时可以迁移。

参考资料

官方文档

  • Hermes Agent 官方文档:https://hermes-agent.nousresearch.com/docs/
  • Hermes Agent Honcho Memory:https://hermes-agent.nousresearch.com/docs/user-guide/features/honcho
  • Hermes Agent 用户故事:https://hermes-agent.nousresearch.com/docs/user-stories
  • OpenClaw 文档:https://docs.openclaw.ai

深度对比文章

  • Composio: OpenClaw vs Hermes Agent:https://composio.dev/content/openclaw-vs-hermes-agent
  • Flowtivity: OpenClaw vs Hermes Agent – Complete 2026 Comparison:https://flowtivity.ai/blog/openclaw-vs-hermes-agent-comparison/
  • The New Stack: OpenClaw vs Hermes Agent:https://thenewstack.io/persistent-ai-agents-compared/
  • Epsilla: Hermes vs. OpenClaw – Architectural Schism:https://www.epsilla.com/blogs/2026-04-21-hermes-vs-openclaw-architectural-schism
  • NxCode: Hermes Agent vs OpenClaw 2026:https://www.nxcode.io/resources/news/hermes-agent-vs-openclaw-2026-which-ai-agent-to-choose

安全报告

  • Bitdefender: OpenClaw Exploitation in Enterprise Networks:https://businessinsights.bitdefender.com/technical-advisory-openclaw-exploitation-enterprise-networks
  • Antiy Labs: ClawHavoc Analysis:https://www.antiy.net/p/clawhavoc-analysis-of-large-scale-poisoning-campaign-targeting-the-openclaw-skill-market-for-ai-agents/
  • Sangfor: OpenClaw Security Risks:https://www.sangfor.com/blog/cybersecurity/openclaw-ai-agent-security-risks-2026

使用案例

  • TL; DR: OpenClaw Use Cases 2026:https://www.tldl.io/blog/openclaw-use-cases-2026
  • Hostinger: Hermes Agent Use Cases:https://www.hostinger.com/tutorials/hermes-agent-use-cases

本文基于 2026 年 5 月官方文档、实测文章、社区反馈和安全报告综合整理。