用Hermes Agent快两个月了,最让我后背发凉的不是它的能力,是它的"习惯"。
上周四凌晨三点,我让它跑一个数据清洗任务。第二天早上看结果,它用的方法是我上个月跟它提过的一个偏门技巧。
那个技巧我教过它一次,它就记住了,还知道什么时候用。
那一刻我意识到:这玩意儿不是在"记住"我说话,它是在"学习"我的想法。
省流版:Hermes Agent是2026年2月发布的开源AI Agent框架,核心特点是"越用越懂你"的学习闭环。和OpenClaw不同,Hermes更像一个会自己琢磨怎么做得更好的搭档。
学习闭环:不是记住了,是学会了
第一次用Hermes时,我以为它就是个会写脚本的Claude包装版。
我让它帮我处理GitHub issue,它干得不错,但有个习惯让我抓狂:每次都要先把整个issue历史读一遍,哪怕最新的comment已经包含了关键信息。
我跟它说了三次"你不需要每次都读全量历史"。
第四次,它改了。
但让我震惊的不是它改了,是它改的方式——它自己写了一个Skill,叫github-issue-quick-scan,逻辑是"先读最新3条comment,如果包含closed/merged标签就不再追溯历史"。
这不是我教它的。这是它自己琢磨出来的。
Hermes把学习能力拆成四个环节:
Periodic Nudge(定期提醒) — 它会自己停下来想"刚才这段对话里有什么值得记住的"。
不需要你告诉它该记什么,它自己评估哪些内容值得沉淀 就像学生上课不是抄板书,是记"老师到底想讲什么" Skill Creation(技能创建) — 当它发现某个工作流重复出现时,会自己写成"说明书"。
触发条件:5次以上工具调用、从错误恢复、用户纠正 存在 ~/.hermes/skills/目录下Session Search(会话搜索) — 下次遇到类似问题,它会主动去"回忆"。
用SQLite+FTS5全文搜索 检索结果经LLM摘要后才注入当前任务 Skill Improvement(技能改进) — 技能在使用中继续优化。
发现更好路径时会更新 就像你用久了某工具,会自己摸索出快捷键
这个机制有个局限:它只能学习"可表达"的偏好。
如果你自己都不知道自己喜欢什么,Hermes也学不会。很多时候,我们以为自己的偏好是A,其实是B,只有看到结果时才知道"哎原来我不喜欢这个"。
Hermes没法读你的心,它只能读你的行为。所以它的进化速度,取决于你对自己偏好的自知程度。
模糊的指令,只能得到模糊的进化。精确的反馈,才能换来精确的成长。
四层记忆:比OpenClaw多了什么
Hermes的记忆系统设计,是我见过最像"人脑"的。
官方把它分成四层:
Layer 1:Prompt Memory(3,575字符的速记本)
这是它的"短期工作记忆"——相当于你桌上那张便利贴。
位置: ~/.hermes/memories/MEMORY.md和USER.md总字符限制:3,575——故意收紧,强制精选而非堆积
3,575这个数字有意思。官方解释:这是经过测试的"最优强迫"阈值——太小记不住关键信息,太大会变成垃圾场。我实测下来确实如此。当记忆空间收紧时,Hermes会主动"思考"哪些内容值得保留。
Layer 2:Session Archive(FTS5检索的档案室)
用SQLite存储,FTS5全文索引 记录"发生了什么,何时发生"
这里有个关键设计:记忆和技能是分离。情景记忆(Session Archive)是"发生过什么",程序记忆(Skills)是"怎么做某事"。
就像人脑:你记得上周吃过好吃的餐厅,但你可能不记得那道菜的具体配方。
Layer 3:Skills(渐进式披露的教材)
位置: ~/.hermes/skills/默认只加载名称和摘要,确定相关时才加载完整内容
这个"渐进式披露"设计很聪明。有200个技能的Agent,和有40个技能的Agent,上下文成本几乎一样。因为它不会一开始就把所有技能塞进prompt,而是"需要时才加载"。
Layer 4:Honcho(用户建模)
可选的"偏好档案"——相当于你的伴侣知道你喝咖啡不加糖。
跟踪偏好、沟通风格、领域知识 使用"辩证建模"方法,在12个身份层上建模你和它的关系
这一层我目前还没开。但如果你想让Hermes真正变成"你的"Agent,值得花时间调教。
和OpenClaw相比,Hermes的记忆架构更系统化。OpenClaw用文件系统做记忆,简单直接,但不适合长期积累。Hermes用分层设计,把"记住内容"和"记住方法"分开——这才是真正的"成长型"架构。
Skill自动生成:它怎么自己写"说明书"
Hermes最让我震惊的,是它写Skill的能力。
一个Skill从0到成熟,大致经历这样的路径:
触发阶段:代理完成任务后,自动检查是否值得记录
工具调用≥5次 从错误中恢复 用户纠正 成功的非显式工作流
生成阶段:按agentskills.io标准创建Skill文件。每个Skill包含名称、描述、版本号,以及分类标签(如python、automation、devops),存在~/.hermes/skills/目录下,格式统一,可在不同Agent间共享。
优化阶段:使用中持续迭代
patch模式:只传递更改部分,token高效 edit模式:完整重写,用于大幅修改
它偏好patch而非edit。完整重写容易破坏已有功能,只传递更改部分更安全也更省钱。
我实测过一个案例:让它处理arXiv论文搜索。
第1次,它写了一个粗糙的Skill,能跑但效率低。
第3次使用时,它自己优化了查询逻辑,加了一个"按引用数排序"的选项。
第7次使用时,它发现我经常需要"排除某些作者",又自己加了个exclude参数。
我没有教过它这些。它自己"观察"到了我的使用模式。
这就是Hermes说的"程序性记忆"——不是记住你说了什么,是记住"你通常怎么做事"。
Skill系统也有坑。有时候它生成的Skill过于"经验主义"——把偶然的使用模式当成通用规律。我见过它把"我连续三天在早上9点让它查邮件"写成一个"早上9点自动查邮件"的定时任务。
这个"过度拟合"问题,需要你时不时review一下它的Skill库,删除那些奇怪的"习惯"。
Gateway:永远在线的秘密
Hermes的另一个核心设计是Gateway——一个持久化后台服务。
和OpenClaw不同,Hermes的Agent不是"需要时启动的东西",而是"始终开启等待"的常驻进程。
7个平台连接:CLI、Telegram、Discord、Slack、WhatsApp、Signal、Email。会话通过ID绑定,而非平台。你在Telegram上开始的任务,可以在终端里继续。
这意味着你不需要在一个特定的app里和AI对话——它就像一个真实的"人",在各个平台上都有"分身"。
定时自动化是一级代理任务。
Hermes把周期性任务视为"Agent自己要做的事",而非"恰好调用AI的shell脚本"。
工作流:调度消息 → Hermes解析指令 → 存储作业到cron/目录 → Gateway的cron ticking处理 → 到达预定时间代理循环运行任务 → 通过Gateway路由输出到指定平台。
定时任务和任何交互会话使用相同管道。这意味着它在凌晨3点执行的自动化任务,和白天你跟它聊天的会话,共享同一套记忆和技能。
Profile系统:从个人助理到代理操作系统(v0.6.0新增)
这个功能让Hermes可以运行多个隔离实例,每个有独立的配置、内存、会话、技能。
你可以在同一台机器上跑"工作用Hermes"和"个人用Hermes",它们完全互不干扰。这标志着Hermes从"个人助理"转向"可复用的代理操作系统"。
和OpenClaw到底选哪个
我的答案:不是谁更好,是你需要什么。
如果你需要一个"听你指挥的工具",选OpenClaw。它就像一把瑞士军刀,功能强大,但你需要自己知道怎么用每个功能。
如果你想要一个"会自己长大的搭档",选Hermes。它更像一个聪明的徒弟,开始可能不如OpenClaw顺手,但用久了,它会越来越懂你。
Hermes的进化方向是不可控的。它可能学到你并不希望它记住的"坏习惯"。你的偏好信号如果模糊,它也会困惑。所以"精确反馈"比"多用"更重要。
趋势判断
2026年的AI Agent,正在从"工具"向"伙伴"转变。
传统Agent:你教它做什么,它就做什么。用完即走。
学习型Agent:你告诉它你想要什么,它会自己琢磨怎么做得更好。越用越强。
Hermes的"会成长"这个概念,我认为会成为一个新的产品范式。
风险也很明显:
- 进化方向不可控
——它可能学到你不想要的"习惯" - 偏好信号模糊
——如果你自己都不知道自己要什么,它也学不会 - 黑盒效应
——你不知道它为什么会变成现在这样
这些问题,需要产品设计上的克制和透明。
Hermes目前做得还不错:所有Skill都可见、可编辑、可删除。记忆系统也完全透明,你可以随时查看它"记住"了什么。
这种"可审计性",是AI Agent从工具走向伙伴的必要条件。
Hermes不是完美的Agent框架,它甚至比OpenClaw难上手——你需要花时间调教它,前期的收益不如OpenClaw直接。
但如果你愿意投入那两三周的"磨合期",它会给你一个OpenClaw给不了的东西:一个真正懂你的AI。
不是那种"你说什么它都懂"的懂,是那种"你不用说它也知道"的懂。这种默契,在2026年的AI世界里,依然罕见。
夜雨聆风