OpenClaw被Hermes反超,Mercury又杀出-夜雨聆风

OpenClaw被Hermes反超,Mercury又杀出

2026年才过去四个月，AI Agent赛道已经打到第二轮淘汰赛。这篇把目前最值得关注的三款本地Agent——OpenClaw、Hermes、Mercury——按”普通人能不能长期用”这个标准拆一遍，给你一个能直接对号入座的选型答案。

● ● ●

一、为什么这件事值得认真聊

去年年底大家追的是OpenClaw。它是第一个让普通人感受到”AI不是聊天工具，是能干活的助手”的本地Agent，GitHub Star一路冲到36万+，生态丰富、集成能力强。

但用了大半年之后，痛点也集中爆发：

Token消耗快，账单焦虑
默认配置下安全边界模糊，shell权限+文件读写权限给得太松
版本迭代频繁，每次升级都可能踩雷
长期养下来，配置维护成本越来越重

紧接着今年2月，Nous Research发布了Hermes Agent，主打”自我进化”——8周内破10万星，是2026年增速最快的开源Agent框架之一。它的核心叙事是：Agent能从经验中自动生成skill、自动改进自己的Prompt、跨会话保留记忆。

而最近又出来一款Mercury Agent（Cosmic Stack出品），走的是另一条完全不同的路：不卷智能、不堆功能，只解决普通人最头疼的四件事——安全、省钱、稳定、永远在线。

普通人没有那么多耐心折腾，预算也有限。这篇文章想回答一个具体问题：

如果你只能长期养一个Agent，到底该选哪个？

● ● ●

二、三个Agent的快速画像

先用一句话给三个产品定位：

Agent	定位	核心特点
OpenClaw	行动生态之王	集成最多、知名度最高、Skill生态最大（13700+第三方），但默认配置坑多
Hermes	自我进化型伙伴	自动生成Skill、跨会话记忆、用得越久越懂你
Mercury	安全可控型管家	行动前必问、Token预算硬控、24/7稳定运行

如果你之前看过我那篇《让龙虾变厉害的十个骚操作》，对OpenClaw的细节这里就不重复了。这篇重点拆Hermes和Mercury，以及它们和OpenClaw的本质差异。

● ● ●

三、普通人选Agent该看的8件事

不是看功能列表，是看这8个底层维度：

01安全可控性

——会不会自作主张删文件、跑危险命令？有没有操作前确认？
02长期使用成本

——Token消耗能不能控住？预算能不能硬限？
03稳定运行能力

——能不能后台常驻？崩溃能不能自愈？
04记忆与个性化

——记忆是流水账还是结构化？能不能跨会话留存？
05上手维护门槛

——配置是几小时还是几天？日常需不需要持续调试？
06实际执行能力

——日常写作、查资料、文件处理这些基础任务靠不靠谱？
07隐私安全

——数据是纯本地还是上云？
08未来可持续性

——产品理念能不能长期跟你需求对齐？数据迁移成本高不高？

下面用这8个维度过Hermes和Mercury。

● ● ●

四、Hermes Agent深度拆解

Hermes的核心叙事是”Agent that grows with you“——一个跟你共同成长的Agent。它不只是工具调用的壳，自带一套学习闭环。

它最强的三件事

1. 自主生成Skill

每完成一个任务，Hermes会自动复盘，把可复用的部分抽象成新的Skill。这些Skill不是一次性脚本，会在后续使用中持续迭代优化。配套的hermes-agent-self-evolution项目用DSPy + GEPA做进化优化，是ICLR 2026 Oral论文。

2. 多层级记忆架构

跨会话、跨周期保留信息，分层存储，自动淡化无效内容、强化高价值信息。它用的是FTS5全文搜索 + Honcho dialectic user modeling——本质上是在给你建一个”用户画像”，且这个画像越用越精准。

3. 一个gateway通15+渠道

Telegram、Discord、Slack、WhatsApp、Signal、邮件、SMS——还有飞书、企业微信、钉钉。对国内用户来说，这点比OpenClaw更友好。

真实使用感受

用一段时间之后，Hermes最大的变化是：它真的越来越像你。写东西贴你的文风，做项目记得你过去的偏好，重复性工作肉眼可见地变顺手。这种感觉OpenClaw给不了——OpenClaw的记忆是Markdown文件，但它不会”主动从记忆里学”。

它的短板也很明显

自主性高=可控性低

。Hermes会主动改自己的Skill和Prompt，偶尔会改出意料之外的行为
新手门槛偏高

。配置逻辑比OpenClaw更抽象，得有点耐心
安全模型依赖底层沙箱

。自我进化过程中可能出现不可预测行为

适合什么人

有动手能力，愿意花时间调教
做内容创作、编程开发、知识管理这种长期深耕型工作
享受”AI陪伴成长”这种体验

● ● ●

五、Mercury Agent深度拆解

Mercury走的是和Hermes完全相反的路线：不追求聪明，追求可控。

它把四件事做到了极致：

1. 安全控制偏执到可怕

Mercury的核心哲学就一句话：Ask before it acts——干任何事之前先问你。

具体机制：

Shell blocklist

：sudo、rm -rf /这类危险命令直接拉黑，永不执行
文件夹级权限

：精确到目录粒度的读写权限
Pending Approval流程

：所有外部操作进审批队列
Ask Me / Allow All模式

：一次性授权或永久授权由你决定

普通人最怕的”AI偷偷搞破坏”，在Mercury这里几乎不可能发生。

2. 第二大脑：结构化记忆系统

Mercury用本地SQLite + FTS5全文搜索，把记忆划分成10类（身份、偏好、目标、事实、计划等等），每条记忆带置信度标注，会自动做冲突检测和定期巩固。

调用时只注入少量高关联内容——这是它Token效率高的核心原因。

3. Token预算硬控

内置每日预算，超70%自动精简上下文，超100%停止调用。这个功能Hermes和OpenClaw都没有。

4. 24/7稳定运行

mercury up一条命令搞定后台常驻：macOS用LaunchAgent、Linux用systemd、Windows用Task Scheduler。崩溃自动重启（每分钟最多重试10次，指数退避）。装完基本不用管。

“灵魂”驱动的个性化

Mercury有一套独特的”soul-driven”设计：你的Agent的人格通过几个Markdown文件定义——soul.md（核心价值观）、persona.md（人设）、taste.md（审美偏好）、heartbeat.md（节律设定）。全部本地、全部可手动改。

真实使用感受

用Mercury之后最强烈的感受是踏实——它不会乱搞操作，不会疯狂烧Token，不会自作聪明曲解需求。它就像一个安静、稳定、靠谱的长期助手。

它的短板

生态比OpenClaw和Hermes小，第三方Skill还在积累
自主进化能力远不如Hermes
对喜欢”折腾”的用户来说可能略显保守

适合什么人

绝大多数普通用户

——预算敏感、不想折腾、需要稳定主力工具
把AI当生产力工具用，不当玩具的人
对安全可控有强需求的（比如商家、个体经营者、自由职业者）

● ● ●

六、Hermes vs Mercury：本质差异

两者最根本的差别其实就一句话：

Hermes是进化派，Mercury是控制派。

维度	Hermes	Mercury
设计哲学	Agent应该越用越聪明	Agent应该越用越可控
记忆机制	自主curate + 主动学习	结构化存储 + 精准调用
Skill生成	自动生成、自我进化	用户安装、显式调用
Token策略	靠模型判断省	硬性预算限制
风险敞口	偶尔有不可预测行为	几乎可以保证不出格
适合人格	喜欢折腾、追求成长	偏好稳定、控制成本

普通人选型公式

直接对号入座：

怕麻烦、预算敏感、要日常主力辅助

→ 选Mercury
愿意调教、深耕长期项目、追求AI变聪明

→ 选Hermes
两个都想要

→ Mercury当后台主力，Hermes处理深度任务

我个人的建议：先把Mercury当主力养起来，建立稳定的使用习惯和安全边界。等你真正摸清自己的需求后，再按需补Hermes。

● ● ●

七、Mercury上手教程（新手30分钟搞定）

安装步骤

支持macOS、Windows、Linux，普通家用电脑就够。

Step 1：装Node.js

去nodejs.org下载LTS版本（20.x或更高），一路下一步。装完终端输node -v验证。

Step 2：装Mercury

npm i -g @cosmicstack/mercury-agent

或者用npx @cosmicstack/mercury-agent免安装直接跑。

Step 3：首次启动

mercury

会弹出setup wizard，按提示填：

你的名字（用于个性化）
LLM API Key（推荐DeepSeek，性价比最高；不想花钱用本地Ollama）
Telegram Bot Token（可选但强烈推荐，手机端能用）
每日Token预算（建议先设10万，避免烧钱）

整个过程30秒到1分钟。

Step 4：开启24/7后台模式

mercury up

这一步会装系统服务、起daemon、配置开机自启。

Step 5：验证

mercury status

看到Running就成了。

后续要改配置直接mercury doctor重新走一遍向导。

实际成本（按DeepSeek模型估算）

使用强度	每日成本	每月成本
轻度（偶尔聊几句）	0.1-0.5元	3-15元
中度（日常主力）	0.5-2元	15-60元
重度（高频自动化）	2-6元	60-180元
本地Ollama	0元	仅电费

大多数普通人是中度使用，月成本在15-60元区间。如果想彻底归零，切到本地Ollama即可。

维护成本

mercury upgrade

一键升级
所有配置都是本地Markdown/YAML文件，记事本就能改
内存占用低，长期挂着不烦人
后台运行后基本”装完即忘”

● ● ●

八、回到那个核心问题

2026年AI Agent的竞争，已经从”谁功能多、谁生态大”，转向了”谁更贴合普通人的真实需求、谁能长期可持续“。

三款Agent的真实定位：

OpenClaw

——打开了本地Agent的大门，但它更像一个”专业玩家的乐高”，普通人养起来累
Hermes

——把”AI自主进化”这件事做到了目前能做到的极致，适合愿意投入的用户
Mercury

——补齐了普通人最刚需的短板：可靠、安全、省心、低成本

普通人不需要顶尖AI，需要的是一个值得长期信任、不添乱、能省时省钱的实用伙伴。

工具迭代很快，但底层需求永远不变。选一个真正契合你性格、解决你顾虑的Agent，比追最新的星标榜更重要。

你目前在用哪款Agent？是图省心、追功能、还是图进化？评论区聊聊你的选型逻辑，我来一起拆。

一、为什么这件事值得认真聊

二、三个Agent的快速画像

三、普通人选Agent该看的8件事

四、Hermes Agent深度拆解

它最强的三件事

真实使用感受

它的短板也很明显

适合什么人

五、Mercury Agent深度拆解

1. 安全控制偏执到可怕

2. 第二大脑：结构化记忆系统

3. Token预算硬控

4. 24/7稳定运行

“灵魂”驱动的个性化

真实使用感受

它的短板

适合什么人

六、Hermes vs Mercury：本质差异

普通人选型公式

七、Mercury上手教程（新手30分钟搞定）

安装步骤

推荐先装的5个Skill

实际成本（按DeepSeek模型估算）

维护成本

八、回到那个核心问题