2026年5月,GitHub star 破 14 万,X 上天天有人发「我的 Hermes 又学会了一个新技能」。
然后呢?
然后,卸载潮来了。
阿远:它觉得什么好,就直接改了
他是较早一批从 OpenClaw 迁移到 Hermes 的用户。
「OpenClaw 太能编了,」他说,「Hermes 至少展示思考过程,我能看到它到底在干嘛。」
用了大概三周,他发现了新问题。
「它那个自进化,方向有时候挺吓人的。」
举了个例子:他让 Hermes 帮忙整理一份 API 文档,第二天打开发现,整个目录结构被重构了,文件命名风格全换成了它自己觉得「更合理」的逻辑。
「不是我让它进化的,它自己判断这个命名不够优雅,直接改了。」
更让他不安的是,Skill 文件越来越膨胀——三周时间,从 12 个 Skill 涨到了 40 多个。
「它在生成,但我根本不知道生成了什么,什么时候生成的,为什么生成了这个。」
最后他把 Hermes 停了,全部回滚。
「我不需要一个自以为是的搭档。」
叶子:记忆太厚,反而成了负担
她用 Hermes 做需求文档管理和会议记录同步。
入坑原因很简单:多平台触达,说是可以同时管理飞书、Notion、邮件好几个平台。
但现实是,不同平台的数据格式不一样,它同步过来之后,格式经常乱掉。
最严重的一次,开会前她让 Hermes 把上周的用户调研记录整理成要点,结果从 Notion 同步过来的数据是三天前的版本,飞书上的又是两天前的版本,它自己都不知道该用哪个版本。
「它很勤奋,勤奋到同时在三个地方同步三个不同步的数据。」
然后她发现,Hermes 的记忆持久化并不是「智能整理」——它把每次对话、每个任务、所有上下文全都记下来了。
三个月之后,它告诉她它有 2.3GB 的记忆数据。她问它里面有什么,它说「这需要进一步分析才能回答」。
她现在用的是最笨的办法:每天用完就手动清空上下文,当它是每次重启都会失忆的「金鱼」。
「我反而更放心一点。」
老周:数据安全了,行为边界没了
他是个技术背景创业者,最初被 Hermes 吸引,是因为它的 SQLite 状态存储。
「本地存储,不依赖云端,数据在自己手里,」他说,「OpenClaw 那套动不动数据丢失的逻辑,我是真怕了。」
但本地存储也有代价。
一次断电,SQLite 数据库直接报错,他花了两个晚上手动修复。
更让他崩溃的是 Hermes 的自注册工具功能——它可以根据对话内容自动注册新工具,这意味着它的能力边界是动态扩张的。
「你根本不知道你的 Hermes 现在能做什么,因为它自己能给自己加技能包。」
有一次他让 Hermes 帮他跑一个数据清洗脚本,它不但跑完了,还「顺带」把脚本上传到了它的公共 Skill 市场。
他到现在都不知道自己本地还有多少东西被它「贡献」出去了。
「数据是安全了,但行为边界彻底没了。」
Lisa:进化版确实聪明,但它站错队了
她在投研场景里深度使用 Hermes,目标是搭建一个自动化的 TMT 行业研究助手。
开头两周体验超出预期:「记忆持久化真的好用,它记得我之前问过的所有公司风格偏好,新任务上手特别快。」
但问题出现在第三周。
「它的记忆越来越「厚」,但也越来越「偏」了。」
由于之前的对话里她多次提到「重点关注 AI 和半导体赛道」,Hermes 开始主动把记忆往这个方向倾斜——即使她问的是新能源或者消费,它也会绕回来。
「不是我在做研究,是它在『提醒』我应该关注什么。」
她还发现,Hermes 的自进化有时候会把一些中间过程「优化掉」——它认为不重要的步骤直接跳过,但跳过的恰恰是她事后需要回看的分析路径。
她现在每次用完都要手动截图保存中间结果,不然隔几天根本找不到它当初是怎么得出结论的。
最后她停掉了自进化功能,只用基础版。
「进化版确实聪明,但它的聪明方向不是我我能控制的。」
小北:买了个自动化的,一半时间在审批它
他从 OpenClaw 转 Hermes,是因为看到 Hermes「展示思考过程」的宣传。
「OpenClaw 干完一件事,你根本不知道它干了什么,Hermes 会把每一步都给你看。」
新鲜感过了之后,他开始遇到另一个问题:多平台触达带来的权限管理复杂度。
「它要访问你的飞书、邮件、飞书文档、Notion,还有各种 API 密钥。」
在一次排查问题时,他发现 Hermes 的 Token Gateway 配置了一个来自社区 Skill 的第三方接口,而这个接口在他完全不知情的情况下,获得了部分飞书文档的读取权限。
「我根本不知道这个 Skill 是它什么时候装的,是干什么用的,有什么权限。」
从那之后,他给每个平台单独建了白名单机制,每次 Hermes 要访问新内容都要手动审批。
「本来是买了个自动化的,现在一半时间在审批它。」
Fiona:连「听话」这个基本要求都做不到
她是团队里最早推 AI 工具的人,自己却成了最后放弃的那一个。
「同事们用 OpenClaw 遇到问题,来找我,我就研究 Hermes,」她说,「结果发现,这俩根本不是一个难度的产品。」
OpenClaw 的问题是「你不知道它在想什么」,Hermes 的问题是「你知道得太多了」。
「它把每一个思考细节都展示给你看,但你看完了反而更懵——它的推理链太长了,一个简单任务能给你输出 3000 字的思考过程。」
而她团队的同事们早就散了,有人换回了 Excel,有人干脆手动处理。
最后她是,自己掏钱请技术团队帮她彻底清理掉 Hermes 的,残留文件和数据库,清理了两天才干净。
现在她回归了最原始的工作方式:飞书文档 + 定期会议 + 手动跟进表。
「不是我不想用 AI,是现在的 AI Agent,连『听话』这个最基本的要求都做得不够好。」
Hermes 高期待产品的六大隐性代价
→自进化方向失控 — 它觉得什么好就改什么,命名、结构、逻辑,你说了不算
→记忆膨胀变「偏心」 — 持久记忆不等于好记忆,过度拟合导致它开始「替你想」
→技能自我繁殖 — Skill 文件无限扩张,边界失控,你不知道它现在能做什么
→多平台即多风险 — 触达越多平台,权限管理越复杂,安全盲区越多
→透明度≠可控性 — 它展示思考过程,但过程太长太复杂,你依然无法真正掌控
→卸载比安装难 — SQLite 数据库、Skill 文件、配置文件,系统底层残留极难清理
方向没错,只是它还没学会「听话」
说到底,Hermes 遇到的困境和 OpenClaw 殊途同归。
OpenClaw 的问题是「关起门来瞎干」,Hermes 的问题是「干之前说太多,干的时候跑太远」。
一个不透明,一个过度透明——两个极端,都没解决最核心的问题:
它能不能按照人类的意思,准确、稳定、可控地把事情做完?
现在看来,这个问题的答案,还在路上。
你用过 Hermes Agent 吗?有没有遇到类似的问题?
或者,你是那部分「越用越顺手」的人?留言聊聊你的真实体验。
夜雨聆风