乐于分享
好东西不私藏

我把AI助手从OpenClaw换成了Hermes Agent之后 … 真香!

我把AI助手从OpenClaw换成了Hermes Agent之后 … 真香!

最近我连续写了几篇 Agent 相关文章,前面拆过 OpenClaw,也自己动手造过一只“龙虾”。

我解剖了这只爆火的龙虾

我手搓了一只自己的龙虾(OpenClaw)

这次我又去看了看 Hermes Agent。

说实话:我一开始真有点没把它当回事。又一个 AI Agent?又一个能跑在终端里的工具?又一套“什么都能自动化”的熟悉叙事?这一年类似项目太多了,人的耐心会被磨薄,所以我第一次扫到 Hermes 时,心里其实是有点敷衍的。

但这次我认真顺着 README、官方文档、CLI 帮助和本机可运行版本一路摸下来后,反而有种“哦,前面是我判断太快了”的感觉:Hermes Agent 不是在重复做一个聊天壳子,它更像是在认真搭一套“会积累经验的 Agent Runtime 产品”。

如果说 OpenClaw 更像一个面向个人助手场景的产品系统,那 Hermes 在我眼里更像一个可编程、可成长、可迁移的 Agent 基座。它们都在做“让 AI 帮你干活”,但发力点并不一样。

所以这篇文章我还是不想写成那种特别标准、特别工整的“产品介绍”。我更想把自己这次重新理解 Hermes 的过程摊开讲讲,顺便回答 4 个问题:

  • 1.Hermes Agent 到底是干什么的
  • 2.它和 OpenClaw 有什么区别
  • 3.如果我今天第一次上手,我会怎么开始
  • 4.哪些命令是真正值得先记住的

先说我最后得出的结论:Hermes 更像一个会成长的 Agent Runtime 产品

Hermes Agent 是 Nous Research 开源的一套 AI agent 框架 / 运行时。它可以跑在终端里,也可以挂到 Telegram、Discord、Slack、WhatsApp 这类消息平台上,还能接工具、接浏览器、接 shell、接文件系统、接 cron、接 MCP。

单看这些能力,其实并不会立刻让人兴奋。现在很多 Agent 项目都能做到“会调工具”。但我越往下看,越觉得 Hermes 真正有辨识度的地方,不是功能表更长,而是它把下面这些东西放到了系统中心,而不是做成附属功能:

  • skills:把任务经验沉淀成可复用的流程文档
  • memory:跨会话记住用户偏好、环境信息和稳定事实
  • session search:回查过去做过什么,而不是每次都重新开始
  • cron + delegation:让 agent 不只会对话,还会长期运行、定时执行、并行分工

官方 README 对它的描述很直接:它是一个 self-improving AI agent。说实话,以前我看到这种表述,第一反应一般都是“嗯,好,又来一个”。但放到 Hermes 这里,我后来真不太想把它只当一句营销词。因为从文档、CLI 能力和整体设计看,它确实一直在认真回答一件事:一个 Agent 如果想越用越像你自己的系统,到底该怎么搭。

我后来越来越愿意把 Hermes 理解成这样:

它不只是一个会聊天的终端工具,而是一个带工具系统、记忆系统、技能系统、调度系统和多入口网关的 Agent Runtime。

这句话还是有点长,但已经比“又一个 AI 助手”接近得多了。


我一开始其实把 Hermes 想简单了

如果把它拆开看,Hermes Agent 其实同时承担了几层角色。越往下看,我越能理解为什么我一开始会误判它。因为如果只看“能聊天、能调工具、能跑在终端里”,它确实很容易被归进那一大类同质化的 Agent 工具里。

第一层,它当然是一个能对话的 Agent。你可以直接在终端里运行hermes,像用 Claude Code、Codex、Gemini CLI 一样跟它对话,让它读文件、改代码、查资料、跑命令。

第二层,它是一个工具调用运行时。它能接终端、文件、浏览器、搜索、代码执行、图像分析、计划管理、定时任务、消息发送这些工具,而且工具不是固定死的,还可以通过 MCP、skills、插件继续扩展。

第三层,它是一个多平台入口网关。你不一定非得在终端里跟它说话,也可以把它接到消息平台上,让同一个 agent 在 Telegram、Discord、Slack、WhatsApp 等入口上工作。也就是说,终端只是它的一个外壳,不是全部。

第四层,也是我后来越想越觉得关键的一层,它是一个带学习闭环的系统。当一个复杂任务做成了,它可以自发的把方法论沉淀为 skill;当它知道了你的偏好和环境约定,它可以写入 memory;当你说“上次我们搞过这个”,它可以用 session search 去找回过往会话。这个组合一旦放在一起看,它就不太像一次性聊天机器人了,而更像一个会慢慢长出记忆和习惯的工作代理。

所以如果你问我 Hermes Agent 到底是干什么的,我现在会给一个有点长、但更诚实的答案:

它是一个把对话、工具调用、长期记忆、技能沉淀、任务调度和多平台入口整合到一起的通用 Agent Runtime 产品,是带自我进化的OpenClaw!


后来真正让我停下来多看两眼的,不是“会调工具”

过去一年,很多人一提 Agent,脑海里的理解还是比较扁平:模型更强一点,会用几个工具,能自动执行几步,有个终端或者网页壳子。

这当然也算 Agent,但我现在越来越觉得,这只是“能工作”的起点,不是“我愿不愿意真的把它放进自己工作流”的起点。

真正难的是另外几件事:

  • 1.你上次解决过的问题,这次能不能别从头再来
  • 2.一套 workflow,能不能沉淀下来让未来复用
  • 3.当任务变复杂时,系统有没有并行和调度能力

Hermes 的设计,基本都在回应这些问题。

它把 skills 做成“程序性记忆”,把 memory 做成“用户和环境事实存储”,把 session search 做成“跨会话召回”,再加上 cron、delegate_task、profile、MCP 这些外围能力,形成了一套比较完整的系统观。

也是到这里,我才开始觉得自己前面对它的判断太快了。它更像在做一层 substrate,而不只是做一个入口产品。

把 Hermes 和 OpenClaw 放在一起看,我的感觉就更清楚了

这个问题很重要,因为它们经常会被放在同一个语境里讨论。

从大类上说,它们确实都属于“能长期运行、能调用工具、能接多入口的 AI Agent 系统”。但如果你真的用工程眼光去看,会发现它们重心不太一样。

OpenClaw 更像 personal AI assistant product

OpenClaw README 里有一句话很能代表它的气质:

The Gateway is just the control plane — the product is the assistant.

这个表述非常产品化。它强调的是:这是一个跑在你自己设备上的 personal AI assistant,它在你已经在用的渠道里回答你,能常驻在线,能接手机、消息 App、控制面板、原生语音能力,整体体验更像“一个个人助手产品”。

你看它的文档导航和 onboarding 流程,也能感受到这种重心:大量 channels、native apps、gateway & ops 文档

也就是说,OpenClaw 非常强调“产品入口”和“始终在线的个人助手体验”。

Hermes 更像 agent runtime / framework

Hermes 的首页虽然也强调 gateway,但它更突出的是这些概念:

  • self-improving
  • skills
  • memory
  • session search
  • cron scheduling
  • subagents / delegation
  • provider-agnostic
  • profiles

也就是说,Hermes 的关注点不只是“你怎么跟 agent 说话”,而是“agent 如何积累、调度、扩展、迁移和复用”。

所以如果非要用一句话去对比,我会这样说:

  • OpenClaw
    更像一个面向个人助手场景打磨出来的产品系统,换句话说:ChatAPP+ClaudeCode
  • Hermes Agent
    更像一个把 agent 当成可编程基础设施来设计的,换句话说:ChatApp+ClaudeCode+有效记忆

两者最核心的差异,不在“能不能接平台”,而在“系统到底把什么当一等公民”

它们都能接消息平台,这不是本质差异。

真正的差异在于:

  • OpenClaw 把assistant experience、channel surface、always-on product feel放在更前面
  • Hermes 把learning loop、skills、memory、tool/runtime extensibility放在更前面

换句话说,OpenClaw 更容易让人感受到“我拥有了一个随时在线的 AI 助手”。而 Hermes 更容易让人感受到“我有了一套可持续生长的 Agent 系统”。

什么情况下,我会认真把 Hermes 放进自己的工作流?

如果你是下面这类人,我觉得 Hermes 会特别顺手。更准确地说,这些也是我自己判断“我要不要认真继续用它”的几个条件:

第一类,是把 AI 当成长期生产力系统来用的人。你不只是偶尔让它回答问题,而是希望它逐渐学会你的习惯、项目结构、工作目录、命令偏好和重复流程。

第二类,是重度自动化用户或开发者。你会在意 cron、subagent、session search、toolsets、MCP、profiles 这种能力,因为你不是在玩一个聊天产品,而是在慢慢搭自己的工作底座。

说白了,如果你如果想慢慢把 AI 变成自己的工作系统,让他越来越懂你,Hermes 可能更适合你。

最后:Hermes 打动我的,是越来越懂我的Agent

我看完之后最大的感受是,Hermes 的野心并不在于把 AI 包装得多像一个人格化助手,而在于把 Agent 作为一个系统长期运行起来。这个差别,说起来像一句空话,但你越往下看它的 memory、skills、session search、cron、delegate_task,就越能感觉出来。

它关心的不是单次回答是否顺滑,而是:经验能不能积累,流程能不能沉淀,以前是不是聊过,多入口能不能共用同一个 agent

如果你追求的是“一个能逐渐学会你的环境、沉淀你的 workflow、扩展成长期生产力底座的 Agent Runtime”,Hermes Agent 很值得花时间研究。

它更像一个正在认真回答这个问题的项目:

如果 Agent 不是一次性的聊天框,而是一个会记忆、会复用、会调度、会不断长出能力的系统,它应该长成什么样?

Hermes 给出的答案,还远远没到最终形态,但已经相当有意思了。

我现在已经把我的OpenClaw切换到Hermes了,深度用 Hermes一段时间之后,我大概率还会再写一篇:不只是讲它是什么,而是讲它到底有没有真的变成我的 Agent 基座。到那时候,可能会比这篇更有资格下结论。