我为什么放弃了 OpenClaw,全面拥抱 Hermes Agent(上手指南)
一、Hermes Agent 是什么
Hermes Agent 是 Nous Research 开源的自主 AI Agent 框架,GitHub 上已经超过 10 万 Star。官方地址:github.com/NousResearch/hermes-agent
说实话,我一开始也觉得”又一个 AI 聊天工具”。但用下来发现,它跟那些”绑死在 IDE 里的代码助手”或者”套壳聊天机器人”完全不是一回事。它的核心设计理念只有一句:用得越久,它越强。
这句”越用越强”不是营销口号。它内置了一整套自我进化的循环:每次对话都从里面提取记忆、自动生成能复用的技能、后台还有个程序默默自我审视。三个子系统一起转,让 Agent 的能力随着你用的时间不断往上涨。
我自己的理解是:它就是一个装在你自己设备上的全能 AI 助手。写代码、抓网页、做调研、管文件、调 API 都行,甚至能接上 Telegram、飞书、Slack,7×24 小时待命。它不绑死在你的笔记本上,可以跑在 5 美元一个月的 VPS 上、跑在 GPU 集群上,也可以跑在按用量计费的 Serverless 环境里(Daytona、Modal),闲着的时候几乎不花钱。
核心特性速览
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
二、环境要求与安装
这是全篇最”工具性”的一节,也是最容易踩坑的一节。我按顺序把每一步都写清楚。
(如果你电脑上已经装了 Claude Code,或者 Trae、Cursor、WorkBuddy 之类的别的 Agent 工具,也有个偷懒办法:直接把 Hermes 的 GitHub 地址丢给它,然后说一句”帮我参考这个地址,完成 Hermes 的安装”。)
2.1 环境要求
动手之前,先确认系统满足这几条:
|
|
|
|---|---|
|
|
|
|
|
|
不确定自己的 Python 版本?终端里敲一句查一下:
版本不够?按你的系统装:
2.2 一键安装
Linux / macOS / WSL2,一条命令:
Windows(PowerShell,目前还是早期 beta):
安卓(Termux)也支持,用上面那条 curl 命令就行,安装器会自己认环境。
装完之后,当前这个终端还认不出 hermes 命令,得重载一下:
嫌麻烦就直接把终端关掉重开,效果一样。配置文件都在 ~/.hermes/ 这个目录下。
2.3 首次设置向导
装好之后,建议先把完整的设置向导跑一遍:
向导会带着你一步步走完下面这些(可以先选 quicksetup,把基础配置和模型先设好,剩下的以后按需再改):
· 选 LLM 提供商
· 填 API Key
· 配默认工具集
· 设基础偏好
2.4 配置模型 Provider
装好之后第一件事就是配模型。Hermes 支持 20 多个 Provider,不绑定任何一家模型,这是它最大的优势之一:
交互式地选你的 Provider。我自己的配置是这样:
|
|
|
|
|
|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
其他常用的 Provider:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
选完 Provider,API Key 会存在 ~/.hermes/.env 文件里。
模型随时能换,不影响你已经攒下的记忆和技能。以后想换模型,再跑一次 hermes model 就行。
国内模型完全够用:GLM、DeepSeek、Kimi、通义千问都支持,不翻墙也能跑。我自己日常主力就是 GLM-5.1,写代码、生成文本都很稳,价格也划算。
2.5 验证安装:hermes doctor
这个命令值得单拎出来讲,因为它能帮你省下 90% 的排错时间(别问我怎么知道的):
它会一项一项地查:
· Python 版本够不够
· 依赖装全了没有
· 模型配置有没有效
· 工具链正不正常
全绿通过 = 装好了。有红色报错,按提示修一下就行。
2.6 开始第一次对话
就这么简单。敲完进对话模式,直接开聊。新手建议先试试这几句:
· 你好,请介绍一下你自己
· 帮我看看当前目录下有哪些文件
· 帮我写一个 Python 脚本,统计一个目录下所有 JSONL 文件的行数
Hermes 会自己挑合适的工具去把活干完。
我的第一条对话是:”帮我整理一下今天的团队工作进展,输出一份简短的日报”。它自己扫了我的工作目录、读了几份会议记录,输出了一份结构清晰的日报。那一刻我意识到,这东西不只是个聊天机器人。
三、对话中的进阶操作
3.1 斜杠命令速查
进了对话(敲 hermes)之后,下面这些是我最常用的斜杠命令:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
重点说两个:
/skills —— 这是 Hermes”自进化”能力的可视化窗口。Agent 干完复杂任务后自己沉淀下来的技能,都能在这儿看到。我用了一个月之后敲这个命令,发现已经攒了十几个技能——简历筛选、日报生成、实验记录格式化,全是我自己都没察觉在重复做的事。
/insights –days 7 —— 相当于给你的 AI 助手出一份”周报”。它总结这周学了什么、哪些技能被反复调用、哪些任务模式在重复。说实话第一次看到这个输出我有点惊讶——Agent 比我自己还清楚我这一周在忙什么。
3.2 对话中临时切换模型
除了用 hermes model 全局切,我更常用的是在对话里随时切:
我的习惯是:日常对话和简单任务用 GLM-5.1(便宜),碰上复杂推理或者要设计代码架构,就切 DeepSeek V4 Pro(更强)。同一次对话里随便切,不影响已经攒下的记忆和技能。
四、核心机制:自我进化循环
这是 Hermes 最核心的设计,也是它跟所有”一次性 AI 助手”拉开差距的地方。这套 Self-Improving Loop(自我进化循环)由三个子系统组成。把这三个搞懂,你就明白 Hermes 为什么”越用越强”了。

4.1 记忆系统(Memory)
记忆系统是整个进化循环的地基。它不是个简单的对话记录器,而是有一套精心设计的分层架构。

MEMORY.md 与 USER.md
· MEMORY.md:约 2200 字符,放 Agent 精选的长期记忆。里面是 Agent 自己判断”重要”的东西:你的偏好、项目背景、常用工具配置等。
· USER.md:约 1375 字符,放用户画像。Agent 通过 Honcho 的”辩证式用户建模”,一点点搭起对你的理解。
记忆操作
Agent 通过 memory 工具管记忆:add 追加、replace 替换、remove 删除。
会话搜索
session_search 工具基于 SQLite FTS5 全文索引,能搜你所有的历史会话:
外部记忆 Provider
要是内置记忆不够用,Hermes 支持接 8 个外部记忆 Provider:
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
对大多数人来说,内置的 MEMORY.md + FTS5 搜索已经够用了。我自己目前还没接外部 Provider,内置这点记忆量对我够使。你要是重度用户、记忆量很大,可以考虑接一个。
4.2 技能系统(Skill)
如果说记忆是”知道什么”,那技能就是”知道怎么做”。
Skill 是 Hermes 从你的重复操作里自动提取出来的标准流程,存成 SKILL.md 文件。每个 Skill 长这样:
技能的自动生成
Agent 会在这几种情况下自动触发生成技能:
· 同一个任务调用了 5 次以上工具——说明这是个复杂流程,值得沉淀下来
· 遇到错误又成功克服了——把解决办法固化住
· 用户纠正了 Agent 的做法——把正确做法记下来
渐进式披露
技能系统用了三层渐进式披露,避免白白浪费上下文:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
这就意味着,几百个技能不会一股脑全塞进上下文,而是按需加载。
技能管理
Agent 自己也能管技能(skill_manage 工具):创建、修补、编辑、删除。有安全机制会自动扫新装的技能,发现危险操作就回滚。
4.3 Nudge Engine(提示引擎)
Nudge Engine 是第三个子系统,也是最容易被忽略的一个——因为它在后台默默干活,你不主动翻日志,甚至都不知道它在忙啥。它本质是一个跑在后台的审查 Agent。工作流程是这样:
· 每轮对话结束后,Nudge Engine 在后台 fork 一个独立的审查 Agent
· 这个审查 Agent 检查:有没有值得记下来的信息、有没有值得沉淀的技能
· 它内部维着两个计数器:memory_count 和 skill_count
· 计数器到了阈值(默认 10),就触发一次记忆写入或技能生成
· 审查 Agent 最多调 8 次工具,防止它无限循环
五、SOUL.md:定义 AI 人格
SOUL.md 是 Hermes 的”灵魂文件”,放在 ~/.hermes/SOUL.md。它定义了 Agent 的人格、沟通风格、专业领域,还有你的身份信息。说实话,这部分值得你花 15 分钟认真写——写好了,后面每一次对话都在这个底子上往上叠。
没有 SOUL.md 的 Hermes,就像一个没性格的通用助手,每次对话都得重新跟它解释你是谁。有了 SOUL.md,它就知道你的背景、你的工作、你喜欢什么样的沟通方式。再配上 Memory 系统,它能一步步搭起对你的深入理解。
示例配置(我自己的实际配置)
这是我照着自己实际情况写的 SOUL.md。它能帮 Agent 快速搞清楚:你是谁、你在做什么、你需要什么样的帮助。
六、配置精讲:config.yaml
Hermes 的主配置文件在 ~/.hermes/config.yaml,搭配 ~/.hermes/.env 存密钥。日常用默认配置就够了,但下面这几个配置项值得了解一下,能帮你省不少 Token、提升体验。
6.1 终端后端
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
比如要环境隔离,切到 docker 后端,配置长这样:
6.2 辅助模型(Auxiliary Models)
可以给不同任务指定不同模型,平衡成本和质量:
6.3 上下文压缩
长对话很费 Token。Hermes 内置了 LLM 压缩:
6.4 委派(Delegation)
让 Agent 自己生成子 Agent 去处理子任务:
6.5 安全配置
6.6 网页搜索
七、实操案例:我用 Hermes 做什么
装好之后,我把它揉进了日常工作流。下面是六个真实场景,全是我每天在用的。

场景一:工作记录——把散落的笔记变成结构化知识
我一个人接好几个客户的项目,每天的活都很碎:跟 A 客户对需求、给 B 客户调试客服机器人、整理 C 客户的知识库、晚上还要回报价。我习惯随手在对话里丢一句:
Hermes 会自动把它整理成结构化的工作记录,存进记忆。过一周我搜”上次跟那个制造业客户对齐验收口径是哪天”,它能精确找到。用了一周后,MEMORY.md 里已经攒下”用户是做企业 AI 服务的独立开发者””手上同时跟好几个客户项目”这些结构化信息——不用我手动维护,Agent 自己提炼的。
场景二:头脑风暴——给客户的技术方案怎么选
这是我最常用的场景之一。比如有个客户想上一套企业知识问答,我在纠结技术路线:
Hermes 会结合它记忆里关于我这个项目的信息,给出有针对性的分析,而不是泛泛地告诉你”RAG 适合啥、微调适合啥”。
场景三:简历筛选——帮我筛外包和合作者
项目忙不过来时我会找外包,会收到一堆简历,让 Hermes 帮着做第一轮筛:
它会给一个简洁的评估:匹配度、亮点、疑点。我拿着筛选结果再决定要不要细聊,省了不少时间。用多了之后,Agent 自己沉淀出一个”简历筛选”的 Skill,我现在只要说一句”帮我筛一下这份简历”就行了。
场景四:日报周报——给客户的项目进展从碎片到成品
这是我每周给客户同步进展的固定动作:
Hermes 会生成格式规范的周报,分”本周完成””进行中””下周计划”三块。给不同客户发的时候,加一句”换成给某某客户的口吻”就行。
场景五:自研小工具——快速搞定临时需求
交付项目时经常要些小工具:把客户给的数据转个格式、批量跑一遍测试问答、把结果汇个总。以前我要么自己写脚本,要么干脆手动弄。现在直接让 Hermes 搞:
它直接生成能跑的脚本,我 review 一下就能用。这类需求频率高、单次工作量又不大,以前总被卡在”写脚本的时间比用工具的时间还长”,现在几秒钟就解决。
场景六:技术调研——快速抓住核心
看到一个新模型、新方案,让 Hermes 帮忙快速提炼,判断值不值得用到客户项目里:
它会给一个结构化的分析。如果我之前调研过类似的方案,它还会主动关联:”之前你看过一个类似的方案,那次的结论是……”——这就是 Memory 的价值。
观察自我进化
用了一阵子之后,看看 Agent 都学到了啥:
我发现用了两周之后,skills 目录里已经躺着 5 个自动生成的技能文件了。最常用的是”日报生成”和”简历筛选”——因为这俩操作我确实每天都在做。Hermes 自动把它们沉淀成了标准流程。
八、多平台网关与 OpenClaw 迁移
8.1 多平台网关
如果你想(像我一样)让 Hermes 同时在 Telegram、Discord、Slack 这些平台上干活:
一个 gateway 进程搞定所有平台。它支持跨平台对话连续——在 Telegram 聊到一半,切到 Discord 接着聊,上下文不丢。还支持语音消息转录。
对我们做客服 SaaS 的来说,这个能力直接就是产品力——客户可能散在不同平台,但 Hermes 作为 AI 客服,在所有平台上记的是同一份上下文。客户不管从哪个渠道来找你,AI 都知道之前聊了啥。
8.2 从 OpenClaw 迁移
如果你之前用的是 OpenClaw(龙虾),Hermes 就是它的正式继任者。同一个团队、同一条产品线,但架构和能力做了大幅升级。第一次跑 hermes setup 时,如果它检测到你本地有 ~/.openclaw 目录,会自动提示迁移。也可以手动来:
迁移内容包括
· 人格文件(SOUL.md)
· 记忆数据(MEMORY.md、USER.md)
· 自建技能(导入到 ~/.hermes/skills/openclaw-imports/)
· 命令审批白名单
· 各平台 API Key(Telegram、OpenRouter、OpenAI、ElevenLabs 等)
· TTS 语音资源、工作区指令(AGENTS.md)
迁移完成后,OpenClaw 的原始数据不会被删,你可以放心操作。万一不满意,原来那只龙虾还在。
九、常见问题
Q:Hermes 和普通 AI 聊天有什么区别?
A:三个核心区别:1)自主调工具(能真去执行操作);2)自我进化(用久了会攒记忆、自动生成技能);3)持久运行(不靠浏览器,能 7×24 跑在服务器上)。
Q:Token 消耗会不会很大?
A:配置合理的话,消耗是可控的。我的做法:日常用 GLM-5.1(便宜),复杂任务切 DeepSeek V4 Pro;开上下文压缩;辅助模型用轻量的。
Q:记忆上限 2200 字符够用吗?
A:轻度用够了。重度用户建议接外部记忆 Provider(比如 Hindsight 或 MemOS),或者用 MemOS 本地记忆插件扩容。
Q:怎么切换模型?
A:三种方式:1)全局切 hermes model;2)对话中临时切 /model deepseek:deepseek-v4-pro;3)在 config.yaml 里给不同任务配不同模型。切模型不影响已经攒下的记忆和技能。
Q:遇到问题怎么排查?
A:第一反应跑 hermes doctor,80% 的问题它能直接告诉你答案。如果 doctor 全绿但还有问题,再查 hermes model 确认 Provider 配置,或者跑 hermes setup 重新初始化。
Q:想快速体验满配版,不想一个个手动配怎么办?
A:社区有个一键满配工具 evey-setup,跑一条命令就能自动装 29 个常用插件、配好免费模型访问和 Token 优化。下一篇会细讲。
Q:去哪儿找更多工具、Skill 和教程?
A:三个推荐入口:Hermes Atlas(hermesatlas.com,交互式工具地图)、awesome-hermes-agent(GitHub 资源汇总)、get-hermes.ai/community(官方社区门户)。
十、核心价值:为什么选择 Hermes
用了一个月之后,我总结了几个让我觉得”选对了”的理由:
夜雨聆风