乐于分享
好东西不私藏

OpenClaw被Hermes反超,Mercury又杀出

OpenClaw被Hermes反超,Mercury又杀出

2026年才过去四个月,AI Agent赛道已经打到第二轮淘汰赛。这篇把目前最值得关注的三款本地Agent——OpenClaw、Hermes、Mercury——按”普通人能不能长期用”这个标准拆一遍,给你一个能直接对号入座的选型答案。

● ● ●

一、为什么这件事值得认真聊

去年年底大家追的是OpenClaw。它是第一个让普通人感受到”AI不是聊天工具,是能干活的助手”的本地Agent,GitHub Star一路冲到36万+,生态丰富、集成能力强。

但用了大半年之后,痛点也集中爆发:


  • Token消耗快,账单焦虑

  • 默认配置下安全边界模糊,shell权限+文件读写权限给得太松

  • 版本迭代频繁,每次升级都可能踩雷

  • 长期养下来,配置维护成本越来越重

紧接着今年2月,Nous Research发布了Hermes Agent,主打”自我进化”——8周内破10万星,是2026年增速最快的开源Agent框架之一。它的核心叙事是:Agent能从经验中自动生成skill、自动改进自己的Prompt、跨会话保留记忆

而最近又出来一款Mercury Agent(Cosmic Stack出品),走的是另一条完全不同的路:不卷智能、不堆功能,只解决普通人最头疼的四件事——安全、省钱、稳定、永远在线

普通人没有那么多耐心折腾,预算也有限。这篇文章想回答一个具体问题:

如果你只能长期养一个Agent,到底该选哪个?

● ● ●

二、三个Agent的快速画像

先用一句话给三个产品定位:

Agent
定位
核心特点
**OpenClaw**
行动生态之王
集成最多、知名度最高、Skill生态最大(13700+第三方),但默认配置坑多
**Hermes**
自我进化型伙伴
自动生成Skill、跨会话记忆、用得越久越懂你
**Mercury**
安全可控型管家
行动前必问、Token预算硬控、24/7稳定运行

如果你之前看过我那篇《让龙虾变厉害的十个骚操作》,对OpenClaw的细节这里就不重复了。这篇重点拆Hermes和Mercury,以及它们和OpenClaw的本质差异。

● ● ●

三、普通人选Agent该看的8件事

不是看功能列表,是看这8个底层维度:

  1. 01安全可控性
    ——会不会自作主张删文件、跑危险命令?有没有操作前确认?
  2. 02长期使用成本
    ——Token消耗能不能控住?预算能不能硬限?
  3. 03稳定运行能力
    ——能不能后台常驻?崩溃能不能自愈?
  4. 04记忆与个性化
    ——记忆是流水账还是结构化?能不能跨会话留存?
  5. 05上手维护门槛
    ——配置是几小时还是几天?日常需不需要持续调试?
  6. 06实际执行能力
    ——日常写作、查资料、文件处理这些基础任务靠不靠谱?
  7. 07隐私安全
    ——数据是纯本地还是上云?
  8. 08未来可持续性
    ——产品理念能不能长期跟你需求对齐?数据迁移成本高不高?

下面用这8个维度过Hermes和Mercury。

● ● ●

四、Hermes Agent深度拆解

Hermes的核心叙事是”Agent that grows with you“——一个跟你共同成长的Agent。它不只是工具调用的壳,自带一套学习闭环

它最强的三件事

1. 自主生成Skill

每完成一个任务,Hermes会自动复盘,把可复用的部分抽象成新的Skill。这些Skill不是一次性脚本,会在后续使用中持续迭代优化。配套的hermes-agent-self-evolution项目用DSPy + GEPA做进化优化,是ICLR 2026 Oral论文。

2. 多层级记忆架构

跨会话、跨周期保留信息,分层存储,自动淡化无效内容、强化高价值信息。它用的是FTS5全文搜索 + Honcho dialectic user modeling——本质上是在给你建一个”用户画像”,且这个画像越用越精准。

3. 一个gateway通15+渠道

Telegram、Discord、Slack、WhatsApp、Signal、邮件、SMS——还有飞书、企业微信、钉钉。对国内用户来说,这点比OpenClaw更友好。

真实使用感受

用一段时间之后,Hermes最大的变化是:它真的越来越像你。写东西贴你的文风,做项目记得你过去的偏好,重复性工作肉眼可见地变顺手。这种感觉OpenClaw给不了——OpenClaw的记忆是Markdown文件,但它不会”主动从记忆里学”。

它的短板也很明显

  • 自主性高=可控性低
    。Hermes会主动改自己的Skill和Prompt,偶尔会改出意料之外的行为
  • 新手门槛偏高
    。配置逻辑比OpenClaw更抽象,得有点耐心
  • 安全模型依赖底层沙箱
    。自我进化过程中可能出现不可预测行为

适合什么人


  • 有动手能力,愿意花时间调教

  • 做内容创作、编程开发、知识管理这种长期深耕型工作

  • 享受”AI陪伴成长”这种体验

● ● ●

五、Mercury Agent深度拆解

Mercury走的是和Hermes完全相反的路线:不追求聪明,追求可控

它把四件事做到了极致:

1. 安全控制偏执到可怕

Mercury的核心哲学就一句话:Ask before it acts——干任何事之前先问你。

具体机制:

  • Shell blocklist
    sudorm -rf /这类危险命令直接拉黑,永不执行
  • 文件夹级权限
    :精确到目录粒度的读写权限
  • Pending Approval流程
    :所有外部操作进审批队列
  • Ask Me / Allow All模式
    :一次性授权或永久授权由你决定

普通人最怕的”AI偷偷搞破坏”,在Mercury这里几乎不可能发生。

2. 第二大脑:结构化记忆系统

Mercury用本地SQLite + FTS5全文搜索,把记忆划分成10类(身份、偏好、目标、事实、计划等等),每条记忆带置信度标注,会自动做冲突检测和定期巩固。

调用时只注入少量高关联内容——这是它Token效率高的核心原因

3. Token预算硬控

内置每日预算,超70%自动精简上下文,超100%停止调用。这个功能Hermes和OpenClaw都没有。

4. 24/7稳定运行

mercury up一条命令搞定后台常驻:macOS用LaunchAgent、Linux用systemd、Windows用Task Scheduler。崩溃自动重启(每分钟最多重试10次,指数退避)。装完基本不用管。

“灵魂”驱动的个性化

Mercury有一套独特的”soul-driven”设计:你的Agent的人格通过几个Markdown文件定义——soul.md(核心价值观)、persona.md(人设)、taste.md(审美偏好)、heartbeat.md(节律设定)。全部本地、全部可手动改。

真实使用感受

用Mercury之后最强烈的感受是踏实——它不会乱搞操作,不会疯狂烧Token,不会自作聪明曲解需求。它就像一个安静、稳定、靠谱的长期助手。

它的短板


  • 生态比OpenClaw和Hermes小,第三方Skill还在积累

  • 自主进化能力远不如Hermes

  • 对喜欢”折腾”的用户来说可能略显保守

适合什么人

  • 绝大多数普通用户
    ——预算敏感、不想折腾、需要稳定主力工具

  • 把AI当生产力工具用,不当玩具的人

  • 对安全可控有强需求的(比如商家、个体经营者、自由职业者)

● ● ●

六、Hermes vs Mercury:本质差异

两者最根本的差别其实就一句话:

Hermes是进化派,Mercury是控制派。

维度
Hermes
Mercury
设计哲学
Agent应该越用越聪明
Agent应该越用越可控
记忆机制
自主curate + 主动学习
结构化存储 + 精准调用
Skill生成
自动生成、自我进化
用户安装、显式调用
Token策略
靠模型判断省
硬性预算限制
风险敞口
偶尔有不可预测行为
几乎可以保证不出格
适合人格
喜欢折腾、追求成长
偏好稳定、控制成本

普通人选型公式

直接对号入座:

  • 怕麻烦、预算敏感、要日常主力辅助
     → 选Mercury
  • 愿意调教、深耕长期项目、追求AI变聪明
     → 选Hermes
  • 两个都想要
     → Mercury当后台主力,Hermes处理深度任务

我个人的建议:先把Mercury当主力养起来,建立稳定的使用习惯和安全边界。等你真正摸清自己的需求后,再按需补Hermes。

● ● ●

七、Mercury上手教程(新手30分钟搞定)

安装步骤

支持macOS、Windows、Linux,普通家用电脑就够。

Step 1:装Node.js

nodejs.org下载LTS版本(20.x或更高),一路下一步。装完终端输node -v验证。

Step 2:装Mercury

npm i -g @cosmicstack/mercury-agent

或者用npx @cosmicstack/mercury-agent免安装直接跑。

Step 3:首次启动

mercury

会弹出setup wizard,按提示填:


  • 你的名字(用于个性化)

  • LLM API Key(推荐DeepSeek,性价比最高;不想花钱用本地Ollama)

  • Telegram Bot Token(可选但强烈推荐,手机端能用)

  • 每日Token预算(建议先设10万,避免烧钱)

整个过程30秒到1分钟。

Step 4:开启24/7后台模式

mercury up

这一步会装系统服务、起daemon、配置开机自启。

Step 5:验证

mercury status

看到Running就成了。

后续要改配置直接mercury doctor重新走一遍向导。

推荐先装的5个Skill

新手不用一上来全装,按需开启:

  1. 01Daily Digest
    ——每日待办+重要信息汇总
  2. 02GitHub Companion
    ——Issue、PR、代码审查
  3. 03Web Research & Summarizer
    ——一句话查资料+总结
  4. 04File Organizer
    ——自动整理下载、桌面、文档
  5. 05Reminder & Scheduler
    ——自然语言定时提醒

进阶再装Email Assistant、Content Creator、Data Analyzer这类。

实际成本(按DeepSeek模型估算)

使用强度
每日成本
每月成本
轻度(偶尔聊几句)
0.1-0.5元
3-15元
中度(日常主力)
0.5-2元
15-60元
重度(高频自动化)
2-6元
60-180元
本地Ollama
0元
仅电费

大多数普通人是中度使用,月成本在15-60元区间。如果想彻底归零,切到本地Ollama即可。

维护成本

  • mercury upgrade
     一键升级

  • 所有配置都是本地Markdown/YAML文件,记事本就能改

  • 内存占用低,长期挂着不烦人

  • 后台运行后基本”装完即忘”

● ● ●

八、回到那个核心问题

2026年AI Agent的竞争,已经从”谁功能多、谁生态大”,转向了”谁更贴合普通人的真实需求、谁能长期可持续“。

三款Agent的真实定位:

  • OpenClaw
    ——打开了本地Agent的大门,但它更像一个”专业玩家的乐高”,普通人养起来累
  • Hermes
    ——把”AI自主进化”这件事做到了目前能做到的极致,适合愿意投入的用户
  • Mercury
    ——补齐了普通人最刚需的短板:可靠、安全、省心、低成本

普通人不需要顶尖AI,需要的是一个值得长期信任、不添乱、能省时省钱的实用伙伴

工具迭代很快,但底层需求永远不变。选一个真正契合你性格、解决你顾虑的Agent,比追最新的星标榜更重要。


你目前在用哪款Agent?是图省心、追功能、还是图进化?评论区聊聊你的选型逻辑,我来一起拆。