从神坛跌落到新王诞生:OpenClaw过时了,这个AI Agent才是真正的进化

2026年4月9日,深夜11点。
程序员张磊关掉了OpenClaw的终端窗口——这是这个月第50次这么做了。
"3月份的时候,我对OpenClaw还是狂热信徒,"张磊说,"每天早上打开电脑的第一件事,就是启动OpenClaw,期待它能帮我自动化处理那些重复的工作。但到了4月初,我发现自己越来越不想用它了。"
张磊不是个案。
GitHub上的数据很诚实:OpenClaw的star增长曲线从3月31日开始,突然从陡峭变成了平缓。Twitter上的讨论热度断崖式下跌,各大技术社区的OpenClaw话题版块变得冷清。
一个曾经被誉为"开源AI Agent标杆"的项目,在短短一个月内,从巅峰滑落到了低谷。
但故事并没有结束。
就在OpenClaw逐渐淡出人们视野的时候,一个新的名字开始在技术圈悄然传播:
Hermes Agent——一个开源、自托管的持久型AI Agent。
它没有OpenClaw那样的高调宣传,没有铺天盖地的媒体报道,甚至没有复杂的安装流程。但它做到了OpenClaw做不到的事情:
从经验中学习,在使用中进化。
张磊在4月5日第一次尝试Hermes,一周后,他彻底停用了OpenClaw。
"这不是背叛,"张磊解释,"而是我遇到了一个真正能'成长'的AI Agent。"
故事:从工具到伙伴的进化

OpenClaw的诞生,曾经让整个技术圈为之沸腾。
2026年2月,当OpenClaw第一次出现在GitHub上时,它解决了AI Agent领域的一个根本痛点:如何让AI真正"做"事情,而不是只会"说"事情。
OpenClaw的设计哲学清晰而实用:
你给它工具(文件操作、浏览器控制、终端执行) 你给它规则(Skill插件系统、SOUL.md身份定义) 你全程盯着它,每一步都需要你确认
这种"人在决策环里"的设计,在早期是巨大的优势。它给了用户完全的控制权,所有操作都是透明的,所有行为都可以在文件层面审计。
"我用OpenClaw处理了一个复杂的数据分析任务,"张磊回忆,"每一步它都要问我:'我要运行这个Python脚本,可以吗?'、'我要访问这个API,可以吗?'、'我要创建这个文件,可以吗?'。虽然有点啰嗦,但我知道它在做什么。"
这种控制感,正是OpenClaw吸引硬核开发者的核心原因。
但随着用户量的增长,问题开始暴露。
问题一:版本迭代引入的稳定性问题
3月前后,OpenClaw连续发布了几次大版本更新,每次都带来大量新功能,但也引入了新的bug。用户量暴增后,各种边缘场景开始出现,issue堆得越来越高,但开发团队的响应速度跟不上。
张磊的经历:
"3月15号的版本更新后,我发现OpenClaw在处理某些特定类型的文件时会崩溃。我在GitHub上提交了issue,但三天都没人回复。后来自己翻了代码,才发现是一个简单的边界条件问题。"
问题二:技术债的雪球越滚越大
OpenClaw的设计追求"什么都要":既要控制文件系统,又要管浏览器,又要支持Skill插件,还要保证安全沙盒。这些目标之间本身就有张力,在没有足够多资源维护的情况下,顾此失彼就成了常态。
更深层的问题是:OpenClaw的设计哲学,本身就不适合大规模推广。
问题三:人必须在决策环里,这把双刃剑
"人必须在决策环里"在早期是优势,但当用户量大了之后,大多数普通用户并不想在每一步操作前都停下来确认。他们想要的是:说一声,事情办了。
张磊的感受:
"刚开始我觉得'每步确认'很安心,但用了两周后,我开始烦躁了。一个简单的文件整理任务,OpenClaw要问我10次'可以吗?'。我开始思考:为什么不能一次性把整个任务的规则都告诉它,让它自己决策?"
这就是OpenClaw的根本问题:它把用户当成了监控者,而不是监督者。
革命:Hermes Agent的重新定义

Hermes Agent的诞生,没有OpenClaw那样的高调宣传。它像一颗在技术圈悄然生根的种子,靠着口碑传播,慢慢生长。
Hermes的核心哲学只有一句话:
Agent = 你给目标 + 它自己学 + 用久了比你自己还懂你。
这句话看似简单,但它从根本上重新定义了AI Agent的定位。
从工具到伙伴的根本转变
OpenClaw的逻辑是:
你给工具 你给Skill 你全程盯着
Hermes的逻辑是:
你给目标 它自己找方法 它从经验中学习
这个差异,张磊用一次实际任务体验到了。
任务:定期分析项目代码质量,并生成报告
用OpenClaw:
1. 写一个Python脚本,用于代码质量分析
2. 告诉OpenClaw:每天运行这个脚本
3. 每次运行前,OpenClaw都要问:可以吗?
4. 如果脚本需要修改,你必须手动改,再告诉OpenClaw
5. 下次做类似任务,这些步骤全部重来
用Hermes:
1. 告诉Hermes:每周一早上9点,分析代码质量并生成报告
2. Hermes自动分析项目结构,选择合适的工具
3. 第一次运行后,Hermes把成功的执行路径保存成Skill
4. 下次运行,Hermes自动调用这个Skill,无需你再指导
5. 如果你想改进报告格式,只需说一句"改得更详细一点"
6. Hermes会自动更新Skill,下次就用新格式
张磊的总结:
"OpenClaw像是一个'工具箱',你需要自己选工具、自己拧螺丝、自己检查结果。 Hermes更像是一个'助手',你告诉他目标,他去找工具,拧螺丝,检查结果,甚至自己优化工作流。
工具不会成长,但助手会。"
架构层面的根本差异
Hermes的架构,不是"一个会聊天的命令行工具",而是一套把模型、工具、记忆、技能、自动化和安全边界拼到一起的Agent runtime。
让我们拆解Hermes的八层架构:
第一层:运行时入口层
Hermes从一开始就把CLI、消息平台和自动化视为同一套runtime的不同入口。
这意味着:
你在CLI里配置的记忆,在Telegram里也能用 你在Discord里创建的Skill,在Slack里也能调用 你用cron设置的定时任务,和交互式任务共享同一个技能库
这不是"先做个命令行,后面再补Bot",而是一开始就设计成统一runtime。
第二层:模型与工具执行层
Hermes把"模型调用"和"工具调用"彻底分开:
模型负责:理解目标、规划步骤、判断是否调用工具 工具负责:真的去搜网页、改文件、跑终端、开浏览器
模型不绑定某一家,支持OpenAI Codex、Nous Portal、OpenRouter等所有兼容端点。
第三层:上下文装配层
这是很多人会忽略,但其实很像"控制中枢"的地方。
Hermes在正式推理前,会做一轮上下文装配:
先吃系统级配置和项目规则 再吃用户当前显式引用的文件和变更 再把记忆、技能、外部provider上下文拼进去 最后才把完整上下文交给模型
这一步非常像一个"prompt assembly pipeline",不是单纯地把用户一句话丢给模型。
第四层:持久记忆层
这是Hermes区别于OpenClaw最大的点。
Hermes的内建记忆不是模糊概念,而是两份固定文件加一套历史检索机制:
MEMORY.md(约800 tokens):
存项目结构 存工具坑点 存工作流经验 存已经验证过的方法
USER.md(约500 tokens):
存用户偏好 存沟通方式 存习惯 存雷区 存技术水平
这两份文件不是实时乱改的"内存",而是在会话开始时作为frozen snapshot注入system prompt。这意味着Hermes对持久记忆的使用是受控的、稳定的。
更重要的是:Hermes的记忆有明确的容量设计。超了怎么办?不是无限追加,而是让Agent自己consolidate或替换旧条目。
Hermes官方对记忆的理解不是越多越好,而是要把常驻上下文压缩成真正重要的那一小块。
第五层:外部记忆Provider层
Hermes没有把记忆架构写死,而是做成了插件化接口。
除了内建的MEMORY.md/USER.md,Hermes还可以外挂一个外部memory provider(如Honcho)。当外部provider启用时,Hermes会自动做:
把provider知道的上下文注入system prompt 在每轮对话前预取相关记忆 在每次响应后把对话同步给provider 会话结束时抽取长期记忆 把内建记忆写入镜像到provider 给Agent暴露provider专属工具
这一层的意义在于:Hermes把内建轻记忆和外部深记忆分层了。
第六层:技能与程序性记忆层
如果说持久记忆存的是"你是谁、环境是什么、哪些事实重要",那技能层存的就是"事情到底怎么做"。
Hermes对Skills的定义很直接:它是按需加载的知识文档,遵循progressive disclosure(渐进式揭示)。
但最关键的不是"技能是markdown文件",而是Hermes把技能明确当成了procedural memory(程序性记忆)。
官网文档里说得非常直白:
完成复杂任务后,Agent可以创建Skill 试错后找到正确路径,可以保存成Skill 用户纠正了做法,也可以更新Skill Agent甚至可以删除过时Skill
技能层其实是Hermes对经验沉淀的正式建模。
记忆层回答的是:
用户是谁 项目是什么 过去讨论过什么
技能层回答的是:
这类任务该怎么做 哪条流程以前走通过 哪些坑已经踩过
这个分层很漂亮。因为如果你把"用户喜欢简洁回答"存成Skill就太重了;反过来,如果你把"如何部署Kubernetes服务"塞进MEMORY.md又太脏。Hermes官方把这两类东西拆开,实际上就是在区分事实记忆和程序记忆。
第七层:自动化与并行执行层
Hermes已经把Agent从"交互式助手"推向了"可运营的任务系统"。
支持的能力包括:
Scheduled Tasks:通过自然语言或cron表达式创建定时任务 Subagent Delegation:启动子Agent,隔离上下文并限制工具集 Code Execution:让Agent写Python脚本,通过沙箱化RPC一次完成多步工具调用 Batch Processing:批量并行跑大量prompt
第八层:安全与隔离层
最后一层是安全边界。Hermes采用的是defense-in-depth(纵深防御),而不是单点防护。
它把安全分成五层:
用户授权 危险命令审批 容器隔离 MCP凭证过滤 上下文文件扫描
这套设计说明Hermes并没有因为"自治"就放弃"边界"。恰恰相反,它把最危险的几个边界都显式化了。

深度:为什么"进化"才是AI Agent的未来

Hermes的架构,表面上看只是比OpenClaw多了几层功能,但它的本质是把"学习"和"进化"做成了AI Agent的第一性原则。
从"人治"到"自治"的根本转变
OpenClaw代表的是"人治"范式:
人定义规则 Agent执行规则 人监督全过程
Hermes代表的是"自治"范式:
人定义目标 Agent自己找最优路径 Agent从经验中学习优化
这两种范式没有绝对的对错,但它们适应的场景完全不同。
OpenClaw的问题是:它假设了用户愿意且能够持续介入。
实际上,大多数人不愿意。开个电脑还要审批一堆东西,时间久了就烦了,要么关掉安全机制,要么干脆不用。
Hermes的问题是:它把"自动进化"做得很漂亮,但这个进化过程对用户是不透明的。
Agent学了什么、为什么这么学、某次决策的依据是什么——这些都是黑盒。用户要么选择完全信任,要么选择不用。中间地带很小。
Hermes的真正突破
Hermes的真正突破,不是功能上的堆砌,而是它解决了AI Agent领域的三个根本问题:
问题一:重复任务如何自动化?
传统方案(OpenClaw):
每次任务都要重新配置 用户需要记住复杂的配置流程 配置错误会导致任务失败
Hermes方案:
第一次任务后,自动保存为Skill 下次同类任务,自动调用Skill Skill会根据使用情况自动优化
张磊的体验:
"我每周都要做一次代码质量分析。用OpenClaw,每次都要重新配置命令行参数、选择工具、设置输出格式。用Hermes,第一次之后,它就自动学会了。现在我只要说'做代码质量分析',它就知道我想用哪个工具、哪个参数、哪个格式。"
问题二:个性化需求如何满足?
传统方案(OpenClaw):
需要用户手动编写个性化配置 配置复杂,需要编程能力 难以适应细微的偏好差异
Hermes方案:
自动学习用户偏好 长期使用,越用越懂你 细微偏好也会被记住
张磊的体验:
"我发现Hermes慢慢开始知道我喜欢什么样的回答了。有时候我问一个问题,它会直接给我我想看到的格式,而不是问我要哪种格式。这有点可怕,但真的好用。"
问题三:复杂任务如何分解?
传统方案(OpenClaw):
需要用户手动分解任务 分解错误会导致任务失败 难以处理复杂的依赖关系
Hermes方案:
自动分析任务结构 智能分解为子任务 自动处理依赖关系
张磊的体验:
"我让Hermes帮我'部署一个Web应用'。它没有直接开始部署,而是先问了我几个问题:数据库用什么?部署环境是什么?需要监控吗?然后它自动分解任务,一步步完成。这种智能分解能力,OpenClaw没有。"
实战:从OpenClaw迁移到Hermes

张磊从OpenClaw迁移到Hermes的过程,只用了三天。
Day 1:安装和初体验
Step 1:安装Hermes
# 克隆仓库
git clone https://github.com/nousresearch/hermes-agent.git
cd hermes-agent
# 安装依赖
pip install -e .
# 初始化配置
hermes init
Step 2:连接消息平台
# 设置Telegram
hermes gateway setup --platform telegram
# 按照提示完成OAuth认证
# 输入Bot Token,选择频道
Step 3:第一次对话
在Telegram里@你的HermesBot,说:"你好"
张磊的初体验:
"我以为Hermes会和OpenClaw一样,问我一堆配置问题。但出人意料的是,它直接就回答了我的问题,而且回答得很准确。我意识到,Hermes已经有一个默认的'新手模式'。"
Day 2:配置个性化记忆
Step 1:编辑USER.md
# 打开用户记忆文件
vim ~/.hermes/memories/USER.md
张磊的配置:
# 用户画像
## 基本信息
- 职业:全栈开发工程师
- 技术栈:Python, JavaScript, Go
- 工作领域:Web应用开发
## 沟通偏好
- 喜欢简洁的回答
- 不喜欢太详细的技术细节
- 优先给出解决方案,然后解释原理
- 如果不确定,直接说不知道
## 工作习惯
- 每周一早上做代码质量分析
- 每周五下午写周报
- 遇到问题先查Google,再问AI
## 雷区
- 不要删除我的代码文件
- 不要修改生产环境的配置
- 不要在没有确认的情况下执行sudo命令
Step 2:编辑MEMORY.md
# 打开项目记忆文件
vim ~/.hermes/memories/MEMORY.md
张磊的配置:
# 项目记忆
## 当前项目:电商Web应用
- 技术栈:Python(Django), React, PostgreSQL
- 部署环境:Docker, AWS EC2
- 代码规范:PEP 8, ESLint
## 常用工具
- 代码质量:flake8, pylint
- 测试框架:pytest, Jest
- 部署工具:docker-compose, kubectl
## 已知问题
- 登录接口有并发问题,需要加锁
- 支付接口偶尔超时,需要重试机制
- 图片上传慢,需要CDN
## 工作流
- 开发流程:feature分支 → PR → review → merge → deploy
- 测试流程:单元测试 → 集成测试 → E2E测试
- 发布流程:staging环境 → 生产环境
张磊的感受:
"编辑这两个文件的时候,我发现Hermes的设计非常清晰。USER.md是关于'我'的,MEMORY.md是关于'项目'的。这种分离很合理。"
Day 3:第一个自动化任务
任务:每周一早上9点,自动做代码质量分析
Step 1:创建定时任务
在Telegram里@HermesBot,说:
"每周一早上9点,做代码质量分析,生成报告"
Step 2:Hermes第一次执行
Hermes自动分析项目结构,选择工具:
- 代码质量检查:flake8, pylint
- 报告生成:HTML格式
- 邮件通知:发送到我的邮箱
Step 3:Hermes创建Skill
Hermes自动保存为Skill:
~/.hermes/skills/code_quality_analysis.md
张磊的观察:
"Hermes第一次执行花了10分钟,因为它需要分析项目、选择工具、生成报告。第二次执行只用了3分钟,因为它已经学会了工作流。第三次执行,我甚至没意识到它已经完成了,因为它完全是自动的。"
影响:AI Agent的未来战局

Hermes的崛起,不是OpenClaw的失败,而是AI Agent范式的进化。
OpenClaw不会消失,但它的定位会改变
短期看,OpenClaw在硬核开发者社区还会是主流,尤其在隐私合规要求高的场景里。
它的价值在于:
完全透明,所有操作文件层面可见 高度可控,每一步都需要确认 安全沙盒,适合处理敏感数据
张磊的选择:
"我并没有完全停用OpenClaw。对于需要高度控制的任务,比如处理生产环境的数据,我依然会用OpenClaw。但对于日常的、重复性的、可以自动化的任务,我全部用Hermes。"
"能进化的Agent"会成为主流
长期看,能"进化"的Agent范式会逐渐成为主流。
原因很简单:
大多数人没有时间精力去精细化管理一个Agent 大多数任务都是重复性的,需要自动优化 大多数用户都希望Agent能越用越懂自己
但这个"进化"机制的透明度和可控性,是它能不能真正普及的关键。
Hermes已经走出了第一步,但它还面临挑战:
挑战一:Skill进化的黑盒问题
当Hermes生成了一个你不认可的Skill时,你没有像OpenClaw那样直接改文件的能力。
张磊的担忧:
"有一天我发现Hermes自动创建的Skill有个bug。我想直接改那个markdown文件,但Hermes警告我:手动修改可能会导致技能失效。这让我有点不安。"
挑战二:"成长"需要时间
Hermes用久了确实会更懂你,但这个"久"是真的需要一段时间积累。如果你的使用场景是一次性的、或者用几次就不用了,Hermes的学习能力体现不出来。
张磊的体验:
"前三天用Hermes,它给我的回答和GPT-4没什么区别。用了一周后,它开始记住我的偏好。用了一个月后,它已经能准确预测我的需求了。但这种'成长'需要时间,不是开箱即用的。"
挑战三:极度隐私敏感场景的局限
虽然Hermes支持本地部署,但它的Skill自动生成机制涉及将执行路径数据写进技能库——这意味着你的使用习惯本身会被结构化存储。
对于极度保守的安全要求,这个存储本身也需要保护。
混用可能是最佳方案
张磊找到了一个务实的方案:混用OpenClaw和Hermes。
用OpenClaw做主控层:
- 处理需要精确控制的高风险任务
- 处理敏感数据的操作
- 需要完全透明的场景
用Hermes做轻量执行节点:
- 处理重复性的日常任务
- 需要自动学习优化的工作流
- 实验性功能的测试
这种架构的优势:
高风险任务依然可控 日常任务自动化 实验性功能隔离 可以随时回滚
张磊的总结:
"OpenClaw给了我安全感,Hermes给了我效率。两者结合,才是我想要的。"
终局:当Agent不再只是工具

张磊的故事,不是关于"工具取代工具",而是关于"范式演进"。
他从一个需要精细控制每一步操作的用户,变成了一个可以放心委托任务的管理者。
Hermes的意义,不只是让Agent更智能,而是让Agent真正成为"伙伴"。
因为:
持久记忆让Agent记住你 自动进化让Agent适应你 技能系统让Agent服务你 安全边界让Agent保护你
2026年的今天,AI Agent的边界已经扩展到:
从"人治"到"自治" 从"工具"到"伙伴" 从"执行"到"进化" 从"单次"到"长期"
而这一切,不需要复杂的配置,不需要深度学习知识,完全开源免费。
AI Agent的未来,是更智能、更自适应、更懂你。
张磊的最后思考:
"OpenClaw让我意识到,AI Agent可以'做'事情。 Hermes让我意识到,AI Agent可以'学会'做事情。
但最深刻的发现是:当AI Agent开始'学习',它就不再只是工具,而是伙伴了。
因为伙伴会成长,工具不会。"
Hermes Agent: https://hermes-agent.nousresearch.com/docs/getting-started/quickstart/[1]
OpenClaw: https://github.com/reconurge/openclaw[2]
许可证: Apache License 2.0
技术栈: Python, Open Source, Self-hosted
主要功能:
持久记忆系统 自动技能进化 多平台集成 定时任务调度 纵深防御安全
适用场景:
重复性任务自动化 个性化需求满足 复杂任务智能分解 长期使用场景 团队协作需求
如果你也在使用AI Agent,或者对Hermes vs OpenClaw有自己的看法,欢迎在评论区分享你的选择和理由。
引用链接
[1]https://hermes-agent.nousresearch.com/docs/getting-started/quickstart/
[2]https://github.com/reconurge/openclaw
夜雨聆风