OpenClaw被Hermes反超,Mercury又杀出
2026年才过去四个月,AI Agent赛道已经打到第二轮淘汰赛。这篇把目前最值得关注的三款本地Agent——OpenClaw、Hermes、Mercury——按”普通人能不能长期用”这个标准拆一遍,给你一个能直接对号入座的选型答案。
● ● ●
一、为什么这件事值得认真聊
去年年底大家追的是OpenClaw。它是第一个让普通人感受到”AI不是聊天工具,是能干活的助手”的本地Agent,GitHub Star一路冲到36万+,生态丰富、集成能力强。
但用了大半年之后,痛点也集中爆发:
Token消耗快,账单焦虑
默认配置下安全边界模糊,shell权限+文件读写权限给得太松
版本迭代频繁,每次升级都可能踩雷
长期养下来,配置维护成本越来越重
紧接着今年2月,Nous Research发布了Hermes Agent,主打”自我进化”——8周内破10万星,是2026年增速最快的开源Agent框架之一。它的核心叙事是:Agent能从经验中自动生成skill、自动改进自己的Prompt、跨会话保留记忆。
而最近又出来一款Mercury Agent(Cosmic Stack出品),走的是另一条完全不同的路:不卷智能、不堆功能,只解决普通人最头疼的四件事——安全、省钱、稳定、永远在线。
普通人没有那么多耐心折腾,预算也有限。这篇文章想回答一个具体问题:
如果你只能长期养一个Agent,到底该选哪个?
● ● ●
二、三个Agent的快速画像
先用一句话给三个产品定位:
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
如果你之前看过我那篇《让龙虾变厉害的十个骚操作》,对OpenClaw的细节这里就不重复了。这篇重点拆Hermes和Mercury,以及它们和OpenClaw的本质差异。
● ● ●
三、普通人选Agent该看的8件事
不是看功能列表,是看这8个底层维度:
- 01安全可控性
——会不会自作主张删文件、跑危险命令?有没有操作前确认? - 02长期使用成本
——Token消耗能不能控住?预算能不能硬限? - 03稳定运行能力
——能不能后台常驻?崩溃能不能自愈? - 04记忆与个性化
——记忆是流水账还是结构化?能不能跨会话留存? - 05上手维护门槛
——配置是几小时还是几天?日常需不需要持续调试? - 06实际执行能力
——日常写作、查资料、文件处理这些基础任务靠不靠谱? - 07隐私安全
——数据是纯本地还是上云? - 08未来可持续性
——产品理念能不能长期跟你需求对齐?数据迁移成本高不高?
下面用这8个维度过Hermes和Mercury。
● ● ●
四、Hermes Agent深度拆解
Hermes的核心叙事是”Agent that grows with you“——一个跟你共同成长的Agent。它不只是工具调用的壳,自带一套学习闭环。
它最强的三件事
1. 自主生成Skill
每完成一个任务,Hermes会自动复盘,把可复用的部分抽象成新的Skill。这些Skill不是一次性脚本,会在后续使用中持续迭代优化。配套的hermes-agent-self-evolution项目用DSPy + GEPA做进化优化,是ICLR 2026 Oral论文。
2. 多层级记忆架构
跨会话、跨周期保留信息,分层存储,自动淡化无效内容、强化高价值信息。它用的是FTS5全文搜索 + Honcho dialectic user modeling——本质上是在给你建一个”用户画像”,且这个画像越用越精准。
3. 一个gateway通15+渠道
Telegram、Discord、Slack、WhatsApp、Signal、邮件、SMS——还有飞书、企业微信、钉钉。对国内用户来说,这点比OpenClaw更友好。
真实使用感受
用一段时间之后,Hermes最大的变化是:它真的越来越像你。写东西贴你的文风,做项目记得你过去的偏好,重复性工作肉眼可见地变顺手。这种感觉OpenClaw给不了——OpenClaw的记忆是Markdown文件,但它不会”主动从记忆里学”。
它的短板也很明显
- 自主性高=可控性低
。Hermes会主动改自己的Skill和Prompt,偶尔会改出意料之外的行为 - 新手门槛偏高
。配置逻辑比OpenClaw更抽象,得有点耐心 - 安全模型依赖底层沙箱
。自我进化过程中可能出现不可预测行为
适合什么人
有动手能力,愿意花时间调教
做内容创作、编程开发、知识管理这种长期深耕型工作
享受”AI陪伴成长”这种体验
● ● ●
五、Mercury Agent深度拆解
Mercury走的是和Hermes完全相反的路线:不追求聪明,追求可控。
它把四件事做到了极致:
1. 安全控制偏执到可怕
Mercury的核心哲学就一句话:Ask before it acts——干任何事之前先问你。
具体机制:
- Shell blocklist
: sudo、rm -rf /这类危险命令直接拉黑,永不执行 - 文件夹级权限
:精确到目录粒度的读写权限 - Pending Approval流程
:所有外部操作进审批队列 - Ask Me / Allow All模式
:一次性授权或永久授权由你决定
普通人最怕的”AI偷偷搞破坏”,在Mercury这里几乎不可能发生。
2. 第二大脑:结构化记忆系统
Mercury用本地SQLite + FTS5全文搜索,把记忆划分成10类(身份、偏好、目标、事实、计划等等),每条记忆带置信度标注,会自动做冲突检测和定期巩固。
调用时只注入少量高关联内容——这是它Token效率高的核心原因。
3. Token预算硬控
内置每日预算,超70%自动精简上下文,超100%停止调用。这个功能Hermes和OpenClaw都没有。
4. 24/7稳定运行
mercury up一条命令搞定后台常驻:macOS用LaunchAgent、Linux用systemd、Windows用Task Scheduler。崩溃自动重启(每分钟最多重试10次,指数退避)。装完基本不用管。
“灵魂”驱动的个性化
Mercury有一套独特的”soul-driven”设计:你的Agent的人格通过几个Markdown文件定义——soul.md(核心价值观)、persona.md(人设)、taste.md(审美偏好)、heartbeat.md(节律设定)。全部本地、全部可手动改。
真实使用感受
用Mercury之后最强烈的感受是踏实——它不会乱搞操作,不会疯狂烧Token,不会自作聪明曲解需求。它就像一个安静、稳定、靠谱的长期助手。
它的短板
生态比OpenClaw和Hermes小,第三方Skill还在积累
自主进化能力远不如Hermes
对喜欢”折腾”的用户来说可能略显保守
适合什么人
- 绝大多数普通用户
——预算敏感、不想折腾、需要稳定主力工具
把AI当生产力工具用,不当玩具的人
对安全可控有强需求的(比如商家、个体经营者、自由职业者)
● ● ●
六、Hermes vs Mercury:本质差异
两者最根本的差别其实就一句话:
Hermes是进化派,Mercury是控制派。
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
普通人选型公式
直接对号入座:
- 怕麻烦、预算敏感、要日常主力辅助
→ 选Mercury - 愿意调教、深耕长期项目、追求AI变聪明
→ 选Hermes - 两个都想要
→ Mercury当后台主力,Hermes处理深度任务
我个人的建议:先把Mercury当主力养起来,建立稳定的使用习惯和安全边界。等你真正摸清自己的需求后,再按需补Hermes。
● ● ●
七、Mercury上手教程(新手30分钟搞定)
安装步骤
支持macOS、Windows、Linux,普通家用电脑就够。
Step 1:装Node.js
去nodejs.org下载LTS版本(20.x或更高),一路下一步。装完终端输node -v验证。
Step 2:装Mercury
npm i -g @cosmicstack/mercury-agent
或者用npx @cosmicstack/mercury-agent免安装直接跑。
Step 3:首次启动
mercury
会弹出setup wizard,按提示填:
你的名字(用于个性化)
LLM API Key(推荐DeepSeek,性价比最高;不想花钱用本地Ollama)
Telegram Bot Token(可选但强烈推荐,手机端能用)
每日Token预算(建议先设10万,避免烧钱)
整个过程30秒到1分钟。
Step 4:开启24/7后台模式
mercury up
这一步会装系统服务、起daemon、配置开机自启。
Step 5:验证
mercury status
看到Running就成了。
后续要改配置直接mercury doctor重新走一遍向导。
推荐先装的5个Skill
新手不用一上来全装,按需开启:
- 01Daily Digest
——每日待办+重要信息汇总 - 02GitHub Companion
——Issue、PR、代码审查 - 03Web Research & Summarizer
——一句话查资料+总结 - 04File Organizer
——自动整理下载、桌面、文档 - 05Reminder & Scheduler
——自然语言定时提醒
进阶再装Email Assistant、Content Creator、Data Analyzer这类。
实际成本(按DeepSeek模型估算)
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
大多数普通人是中度使用,月成本在15-60元区间。如果想彻底归零,切到本地Ollama即可。
维护成本
mercury upgrade
一键升级
所有配置都是本地Markdown/YAML文件,记事本就能改
内存占用低,长期挂着不烦人
后台运行后基本”装完即忘”
● ● ●
八、回到那个核心问题
2026年AI Agent的竞争,已经从”谁功能多、谁生态大”,转向了”谁更贴合普通人的真实需求、谁能长期可持续“。
三款Agent的真实定位:
- OpenClaw
——打开了本地Agent的大门,但它更像一个”专业玩家的乐高”,普通人养起来累 - Hermes
——把”AI自主进化”这件事做到了目前能做到的极致,适合愿意投入的用户 - Mercury
——补齐了普通人最刚需的短板:可靠、安全、省心、低成本
普通人不需要顶尖AI,需要的是一个值得长期信任、不添乱、能省时省钱的实用伙伴。
工具迭代很快,但底层需求永远不变。选一个真正契合你性格、解决你顾虑的Agent,比追最新的星标榜更重要。
你目前在用哪款Agent?是图省心、追功能、还是图进化?评论区聊聊你的选型逻辑,我来一起拆。
夜雨聆风
