OpenClaw vs Hermes 架构深度拆解
Part 01 / 现象
两只「龙虾」引爆全球开发者社区
2026 年的 AI Agent 赛道,没有人能绕过 OpenClaw 和 Hermes Agent 这两个名字。
先说 OpenClaw。这个由奥地利开发者 Peter Steinberger 发起的「周末项目」,2025 年 11 月以 Clawdbot 之名低调上线,72 小时内 Star 从不到 1 万暴涨到 6 万,两天突破 10 万,单日最高新增 17,830 颗 Star——直接打破了 GitHub 的历史记录。中文社区管它叫「养龙虾」,腾讯云、阿里云、京东云迅速跟进提供一键部署,国内甚至出现了 Kimi Claw、MaxClaw、QClaw 等一系列套壳产品。
Hermes Agent 则在 2026 年 2 月底由 Nous Research 发布,10 周内拿下 11 万 Star。到 5 月中旬,NVIDIA 官方博客为其专门撰文,标题直接喊出「self-evolving agents」。在 OpenRouter 的全球日活排行榜上,Hermes 以 224B 日 Token 消耗量反超 OpenClaw,登顶全球第一。
社区的讨论也极度两极化。有人说 Hermes 是「2026 年最强 Agent Harness」,有人反驳「不过是又一个 OpenClaw 仿品」。但当我们拆开引擎盖看底层架构,会发现这两个项目从根子上就走了完全不同的路——这才是真正值得深挖的东西。
Part 02 / 身世
一张表读懂两个项目的来龙去脉
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
一句话概括二者的本质差异:CSDN 上有人总结得很精炼——OpenClaw 是打通大模型与业务的「AI 网关」,Hermes Agent 是让智能体自主进化的「AI 引擎」。接下来,我们从架构层面把这个差异展开讲。
Part 03 / 架构
「Hub-and-Spoke 网关」 vs 「五支柱引擎」
OpenClaw: Gateway 中心化控制平面
OpenClaw 的架构围绕一个 单进程 Gateway 构建——一个长期运行的 Node.js 进程,是整个系统的大脑和路由器。所有的消息渠道(WhatsApp、Telegram、Slack 等)、CLI 客户端、移动端 Node、Web 界面,都通过 WebSocket 连接到这个 Gateway。这是一个典型的 Hub-and-Spoke(中心辐射) 架构。

Gateway 的职责非常集中:维护 Provider 连接、对入站帧做 JSON Schema 校验、广播 agent / chat / presence / heartbeat / cron 等事件,同时也是唯一能开启 WhatsApp Session 的进程。远程节点(比如你的 Mac、Linux 服务器、手机)通过 WebSocket 以 role: node 身份连接,经过设备配对后获得执行权限。
这个设计带来的好处是:统一入口、多端协同。一个 Gateway 管所有渠道,你在 WhatsApp 上聊到一半,换到 Telegram 继续,上下文不丢。同时,代码执行可以分布到不同 Node 上——你的 Mac 跑浏览器自动化,Linux 服务器编译代码,手机拍照——都通过同一个 Gateway 协调。
OpenClaw Gateway 启动
# 前台开发模式openclaw gateway# 后台守护进程(生产模式)openclaw gateway --daemon# 远程 Node 连接到 Gatewayopenclaw node run --host--port 18789
但弱点也很明显:Gateway 是单点,安全研究人员发现有超过 4 万个暴露在公网的 Gateway 实例。2026 年 1 月还出过一个 WebSocket Origin Bypass 导致远程代码执行的 CVE(CVE-2026-25253)。社区的技能市场 ClawHub 也遭遇过恶意技能投毒事件。
Hermes Agent: 五支柱自进化架构
Hermes 走了一条截然不同的路。如果说 OpenClaw 是在回答「怎样把 AI 连接到一切」,Hermes 要回答的问题是「怎样让 AI 越用越聪明」。它的架构围绕 五根支柱 构建:
🧠 Memory 记忆
四层记忆架构:MEMORY.md(环境知识)、USER.md(用户画像)、Skills(程序性记忆)、SQLite FTS5(全文检索历史会话)
🔧 Skills 技能
Agent 完成复杂任务后,自动提炼流程写入 SKILL.md。下次遇到类似任务直接调用,无需从头推理
👤 Soul 灵魂
SOUL.md 定义 Agent 的身份人格、语气风格、行为边界。多 Agent 共享底座模型但各有灵魂
⏰ Crons 定时任务
自然语言设定定时任务,内置调度器,不需要额外搭 crontab 或外部调度系统
而第五根支柱——Self-Improvement 自我改进闭环,是 Hermes 最核心的差异化能力,也是社区争论最多的地方。我们在下一节展开。

Hermes Agent 安装与启动
# 一键安装(自动检测环境、安装依赖)curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash# 交互式配置向导hermes setup# 选择/切换模型hermes model# 创建隔离的多 Agent 实例hermes profile create designer --clonehermes profile create programmer --clone
Part 04 / 核心差异
自我进化闭环:Hermes 真正的护城河
大多数 Agent 框架的执行循环是:接收任务 → 规划 → 执行 → 返回结果 → 会话结束。下一次任务启动时,从相同的基线重新开始。
Hermes 在执行完成之后,额外加了一层:Agent 会自动回顾刚刚完成的任务,评估哪些步骤有效、哪些失败,然后把成功的模式蒸馏成一份结构化的 SKILL.md 文件写入磁盘。下次遇到类似任务时,这份技能会被自动加载到系统提示词中,Agent 直接按照已有的流程执行,无需重新摸索。
DEV 社区 / 认知科学视角分析
「Hermes 的记忆架构几乎映射了人脑的四种经典记忆系统——身份记忆、语义记忆、程序性记忆、情景记忆,外加工作记忆和记忆巩固。这不只是聪明的工程,更像是一篇论文。」
到了 v0.12 Curator 版本,Hermes 更进一步——引入了一个 Curator 自治系统,它会持续监控技能的使用频率和质量,自动识别退化的技能,基于评分标准进行重构或优化。相当于给 Agent 配了一个专职的「技能管理员」。
作为对比,OpenClaw 的 Skill 体系依赖人工编写或从 ClawHub 社区市场安装。成熟度高、现成可用的技能数量多(13,700+),但 Agent 本身不会从经验中自动生成新技能。用社区的话说:在 OpenClaw 上跑同一类任务 100 次,Agent 不会变好——每次都是从零开始。
学习闭环的实际运作
1用户下发一个复杂任务(如「部署 Next.js 到 Coolify」)
2Agent 多步推理 + 工具调用完成任务,全程记录到 SQLite
3任务完成后触发反思:提取成功模式、失败教训
4调用 skill_manage 工具,自动写入 ~/.hermes/skills/deploy-nextjs-coolify/SKILL.md
5下次类似任务,技能被注入 system prompt,Agent 直接按流程执行
6Curator 定期审查技能质量,退化的技能会被自动重构
Part 05 / 记忆
记忆系统:记住发生了什么 vs 记住什么有效
记忆是 Agent 能否长期使用的关键。两个项目在这件事上的设计哲学差异巨大。
OpenClaw 使用 SQLite + Markdown 文件做持久化,支持跨会话的上下文保持。记忆主要是被动的:用户告诉它记住什么,它才记。Session 结束时,上下文写入存储;下次启动时加载回来。这对于简单的任务路由和上下文延续已经够用。
Hermes 的记忆则是分层的、主动的。它借鉴了认知科学中的多系统记忆模型:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
关键区别在于:MEMORY.md 和 USER.md 会作为冻结快照注入到每轮对话的 system prompt 中。当记忆使用量达到约 80% 时,Agent 被迫进行信息浓缩——丢弃不重要的,保留核心的。这种机制迫使记忆始终保持高信噪比,而不是无限膨胀拉高 Token 成本。
Composio 评测
「OpenClaw 在编排(Orchestration)上更成熟,Hermes 在学习(Learning)上更有野心。我的建议:用 OpenClaw 当指挥官,Hermes 当执行专家。」
Part 06 / 安全
安全模型:两种截然不同的信任边界
安全性是自托管 Agent 绕不开的话题。两个项目的安全哲学反映了架构上的根本差异。
OpenClaw 采用 操作者显式授权 模型:所有操作需要人工批准,文件驱动身份系统(SOUL.md、AGENTS.md 定义规则),Node 节点通过设备配对 + 命令白名单限制执行权限。安全边界由人定义,Agent 在边界内执行。但 OpenClaw 已经积累了真实的 CVE 记录——包括 2026 年 1 月的远程代码执行漏洞,以及 ClawHub 技能市场的投毒事件。安全研究人员还发现了超过 4 万个暴露在公网的 Gateway 实例。
Hermes 默认标配了 Docker 容器隔离:每个 Agent 实例运行在独立容器中,拥有自己的 .env 文件、API Key、记忆和技能,容器之间不共享凭据或上下文。此外还支持 SSH、Daytona、Modal 等远程执行后端,让代码执行和宿主机之间有清晰的隔离层。截至 2026 年 5 月,Hermes 尚未出现公开的安全 CVE——但这更多反映的是暴露时间短,而非经过充分验证的安全加固。
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
值得注意的是,2026 年 3 月中国相关部门限制国企和政府机构在办公电脑上运行 OpenClaw,理由是潜在的安全风险。这从侧面说明,自托管 Agent 的安全性已经不仅仅是技术问题,正在进入政策监管的视野。
Part 07 / 生态
生态之争:13,700 个现成技能 vs 自动生长的技能库
OpenClaw 的 ClawHub 是一个类似 npm 的技能市场,目前有 13,700+ 社区贡献的技能包,覆盖邮件处理、日程管理、代码审查、浏览器自动化等场景。装上就能用,生态成熟度远超 Hermes。国内也有营赛 AI 等商业团队系统性地贡献 Skills。
Hermes 目前没有等量级的第三方技能市场,它的设计思路本身就不依赖外部技能——Agent 从自己的工作经验中生成技能。最新版本支持与 agentskills.io 开放标准兼容,也能直接导入 OpenClaw 的 Skills 配置,迁移成本很低。
在消息渠道覆盖上,OpenClaw 以 50+ 原生渠道的优势遥遥领先,包括 WhatsApp、iMessage、Signal 等 Hermes 尚未覆盖的平台。不过 Hermes 覆盖了国内开发者最关心的飞书、企微、钉钉,甚至支持微信和 QQ Bot,这在国内场景下是一个加分项。
两个项目都支持 Cron 定时任务,但实现方式不同:OpenClaw 的 Heartbeat 机制每 30 分钟唤醒一次 Agent 检查待办;Hermes 支持用自然语言设定调度规则,内置调度器,不需要额外配置。
Part 08 / 总览
全维度对比一览表
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
Part 09 / 结论
选谁?或者…都要?
经过全面拆解,答案其实已经浮出水面:这两个项目并不是非此即彼的关系,而是在 Agent 的两个不同维度上各自做到了极致。
选择建议
选 OpenClaw 如果你需要…
最广的渠道覆盖(50+),成熟的技能生态(13,700+),多端协同执行(Mac/iOS/Android/Linux 节点统一编排),以及「一个入口管所有」的平台化体验。适合团队级部署和需要快速落地的场景。
选 Hermes 如果你需要…
长期使用越来越懂你的个人助手,自动沉淀工作 Know-how,灵活的模型选择(400+),更好的执行隔离(Docker 默认),以及对国内平台(飞书/企微/钉钉)的原生支持。适合深度个人用户和开发者。
而中文社区正在流行的一种「互补打法」可能是最聪明的选择:OpenClaw 做指挥官负责广泛的平台集成和任务路由,Hermes 做执行专家负责深度个人化和自动技能沉淀。Hermes 官方也支持直接导入 OpenClaw 的 Skills 和记忆配置,迁移和共存的成本很低。
从更宏观的视角看,OpenClaw 和 Hermes 代表了 AI Agent 进化的两个阶段:第一阶段是连接一切——把 AI 接入尽可能多的消息渠道和工具;第二阶段是持续进化——让 Agent 从工作经验中自主学习、自主改进。前者解决的是「覆盖面」问题,后者解决的是「深度」问题。
2026 年下半年,这场「网关 vs 引擎」之争的走向,可能将决定整个开源 Agent 赛道的技术路线。而对于我们这些使用者来说,真正值得关注的不是谁的 Star 更多——而是谁能在你的真实工作流中,持续、稳定、安全地创造价值。
夜雨聆风