乐于分享
好东西不私藏

Hermes vs OpenClaw :开源 AI Agent 两大阵营,我两个都装了

Hermes vs OpenClaw :开源 AI Agent 两大阵营,我两个都装了

上一篇 Hermes 满配指南发出去之后,后台陆续收到一些消息。

问得最多的一个问题:OpenClaw 呢。

想了想,确实该聊一下。不是评测,是把两条路摆出来看看。看看它们各自在解决什么问题。然后动手跑起来。

先说 OpenClaw。

OpenClaw 原名 Clawdbot。后来改过一次名叫 Moltbot,再改成现在这个。名字换了三次,方向没变过:连接一切。

GitHub 上 16 万星。MIT 协议。核心团队在奥地利,社区遍布全球。它支持 50 多个消息渠道。Telegram、Discord、Slack、WhatsApp、Signal、飞书、iMessage。所有渠道的消息汇入同一个 Agent 实例。

一个大脑,多个触点。

架构上是网关优先。它的核心能力不是推理,是路由。消息从哪来。发到哪去。怎么分发。怎么隔离。这些是它最擅长的事。

你可以把它理解为一个消息总线。各个平台的用户发消息进来,OpenClaw 统一接收。统一处理,统一回复。对用户来说,他在 Telegram 上跟你聊天。对你来说,所有平台的对话都在一个地方管理。

再说 Hermes。

Hermes 走的是另一条路:记住一切。

10 万星。同样 MIT 协议。单 Agent 运行时。跨会话记忆,自进化 skill。它不是调度器,是学习者。

我在满配指南里写过它的核心机制。这里再简单说一下。

它观察自己做过的事,识别值得保留的模式。写成可复用的 skill。下次遇到类似问题,直接加载。

用得越久,越懂你。

这个「懂」不是客套话。它真的会记住你上次让它用什么格式写代码。记住你偏好哪种错误处理方式。记住你讨厌冗长的注释。这些东西存在本地,跨会话持续生效。

一句话概括区别:OpenClaw 像一个能接入所有平台的调度中心。Hermes 像一个会自己学习的私人助手。

OpenClaw 解决的问题是「我的用户在十个平台上找我」。

Hermes 解决的问题是「我希望 AI 记住我是谁」。

有人在 GitHub 上做了一个双 Agent 架构的原型。OpenClaw 做编排层,接收各渠道消息统一路由。Hermes 做执行层,负责思考和记忆。

逻辑上说得通。OpenClaw 缺的恰好是 Hermes 有的:持久记忆、skill 合成、自我改进的反馈环。Hermes 缺的恰好是 OpenClaw 有的:多渠道接入、消息路由、团队协作。

互补关系很清晰。

但我自己没有这么用。原因是复杂度。两个系统对接需要额外的配置和维护。对个人用户来说,收益不够大。对团队来说,可能值得投入。

我的选择:个人用户选 Hermes,团队选 OpenClaw 做底座。

原因很简单。我是个人用户。不需要五十个消息渠道。需要的是一个越用越懂我的助手。它记得我的偏好,记得上次任务的上下文。记得哪些方法对我有效。

如果我是一个团队,需要在 WhatsApp 上做客服、在 Discord 上做社区、在 Slack 上做内部协作。我会选 OpenClaw。一个实例覆盖所有渠道。统一知识库,统一响应逻辑。

道理讲完了。下面是落地。

两个项目我都跑过。把过程记下来,省得你踩我踩过的坑。

怎么 5 分钟跑起来一个 Hermes。

一行命令:

npx hermes-agent@latest

向导会问你两个问题。用什么模型,用什么终端。

模型选 OpenAI 最简单。填入你的 API key。终端选 terminal。回车。它就跑起来了。

第一次对话之后,你会在项目目录下看到一个 .hermes 文件夹。里面是它的记忆和 skill 文件。别删。这是它「越用越聪明」的基础。

试着跟它聊几轮。然后关掉,重新打开。你会发现它记得上次的对话内容。不是因为有什么云端同步,是因为记忆存在本地。

这一点很重要。你的数据不会离开你的机器。所有记忆、所有 skill、所有上下文,都在那个 .hermes 文件夹里。想删就删,想备份就备份。完全可控。

怎么 5 分钟跑起来一个 OpenClaw。

四行命令:

git clone https://github.com/openclaw/openclaw.git
cd openclaw
npm install
npm start

打开 localhost:3000。你会看到一个 dashboard。左边是菜单,右边是主面板。

第一件事是配置你的消息渠道。点「Channels」,选一个你常用的平台。Telegram 最容易上手。去 BotFather 那里创建一个 bot,拿到 token。填进去。

填完点 Save。OpenClaw 会自动验证连接。绿色对勾表示成功。之后你在 Telegram 上给这个 bot 发消息,dashboard 里就能看到。

整个过程不需要写一行代码。全是界面操作。这是 OpenClaw 对新手最友好的地方。

两个都跑起来之后,怎么判断哪个适合你。

这个问题我被问了很多次。答案其实取决于你的使用场景。

如果你主要在终端工作,一个人用。选 Hermes。它会记住你的习惯,越用越顺手。你不需要每次都重复告诉它你的偏好。

如果你需要接 Telegram、Discord、Slack 多个渠道。选 OpenClaw。它天生就是干这个的。一个后台管理所有对话。

如果你两个都需要。OpenClaw 接消息,Hermes 做执行。在 OpenClaw 的 dashboard 里把 Hermes 配置为后端 Agent 即可。消息从各渠道进来,经过 OpenClaw 路由。交给 Hermes 处理。Hermes 带着记忆去思考,把结果返回给 OpenClaw 分发。

给 Hermes 加一个自定义 skill 的完整流程。

在项目根目录下找到 skills 文件夹。如果没有就新建一个。然后在里面新建一个 .md 文件。比如 daily-report.md

文件内容就是一段自然语言描述。你希望 Hermes 在什么场景下做什么事。格式大概是这样:

---
name: daily-report
description: 每天下午六点整理今天完成的任务,生成日报
---


# 日报生成

当用户说「写日报」时,汇总今天所有对话中提到的已完成任务。
按时间顺序列出。每条不超过一行。
最后加一句明天的计划提醒。

保存。下次对话时说「写日报」,它就会按这个 skill 执行。

这个机制的妙处在于:skill 是纯文本。不需要写代码,不需要学 API。用自然语言描述你想要的行为就行。Hermes 会自己解析,自己执行。

而且 Hermes 自己也会生成 skill。当它发现你反复做同一类事情,它会主动把这个模式提炼成 skill 存下来。你可以在 .hermes/skills 目录里看到这些自动生成的文件。

我看了一下自己的 skills 目录。里面有七八个文件。有些是我手动写的,有些是 Hermes 自己生成的。自动生成的那些,质量参差不齐。但有两三个确实有用,省了我不少重复操作。

给 OpenClaw 加一个新渠道的完整流程。

打开 localhost:3000 的 dashboard。左侧菜单点「Channels」。右上角「Add Channel」。

选择渠道类型。填入对应的凭证。Telegram 填 Bot Token。Discord 填 Bot Token + Application ID。Slack 填 Signing Secret + Bot Token。

点 Save。等几秒钟。绿色对勾表示连接成功。

之后这个渠道收到的消息,就会自动进入 Agent 的处理队列。你可以在 dashboard 的「Messages」面板里看到所有渠道的消息流。

如果你想给不同渠道配置不同的回复策略,在「Routing Rules」里设置。比如 Telegram 上的消息走客服模式,Discord 上的走社区模式。这个功能对团队来说很实用。不同渠道的用户期望不同,回复风格也该不同。

容易踩的坑。

说几个我实际遇到的。

Hermes 第一次启动会下载模型索引文件。如果网络不好,会卡在那里很久。看起来像是挂了,其实在下载。耐心等,或者挂代理。

OpenClaw 要求 Node 18 以上。如果你用的是 Node 16,npm install 会报一堆依赖错误。先跑 node -v 确认版本。不够的话用 nvm 切换:

nvm install 18
nvm use 18

两个一起用的时候注意端口。OpenClaw 默认占 3000。如果你本地还有别的服务在 3000,启动时加环境变量:

PORT=3001 npm start

还有一个不算坑的坑。Hermes 的记忆文件会越来越大。用了几个月之后,.hermes 文件夹可能有几十 MB。不影响性能。但如果你用 git 管理项目,记得把它加进 .gitignore

最后一个。OpenClaw 的 Webhook 地址需要公网可访问。如果你在本地开发,Telegram 的消息推不进来。用 ngrok 或者 cloudflared 做一个隧道。dashboard 里填隧道地址就行。

这个坑我卡了半小时。一直以为是 token 填错了,其实是 Telegram 的服务器访问不到我本地的 3000 端口。加了隧道之后秒通。

最后说一句。

两个项目的社区都在讨论对方。OpenClaw 的用户想要 Hermes 的记忆能力。Hermes 的用户想要 OpenClaw 的多渠道接入。已经有人在做把两者打通的方案。

这个现象本身就说明了一件事。用户要的从来不是某个工具。用户要的是一个既聪明又无处不在的助手。

开源 AI Agent 的两条路,可能最终会合流。一个既能接入所有平台,又能持续学习进化的 Agent。那才是终局的样子。

但现在还没到那一步。现在是选择的阶段。

选一个先用起来。用着用着,你就知道自己要什么了。

下方是赋能君的AI学习交流永久免费星球,想学习更多内容,欢迎扫码加入。

🙌 如果你阅读到这里,说明我们对信息的认可区域是有一定交集的,可以说我们是同道中人,所以如果你有自认为不错的信息获取渠道,欢迎留言或者私聊我,谢谢。

都看到这里了,就给个关注吧👀:

喜欢我的文章,可以请你右下角顺手来一波点赞&在看&分享三连么👉