从神坛跌落到新王诞生:OpenClaw过时了,这个AI Agent才是真正的进化

2026年4月9日,深夜11点。

程序员张磊关掉了OpenClaw的终端窗口——这是这个月第50次这么做了。

"3月份的时候,我对OpenClaw还是狂热信徒,"张磊说,"每天早上打开电脑的第一件事,就是启动OpenClaw,期待它能帮我自动化处理那些重复的工作。但到了4月初,我发现自己越来越不想用它了。"

张磊不是个案。

GitHub上的数据很诚实:OpenClaw的star增长曲线从3月31日开始,突然从陡峭变成了平缓。Twitter上的讨论热度断崖式下跌,各大技术社区的OpenClaw话题版块变得冷清。

一个曾经被誉为"开源AI Agent标杆"的项目,在短短一个月内,从巅峰滑落到了低谷。

但故事并没有结束。

就在OpenClaw逐渐淡出人们视野的时候,一个新的名字开始在技术圈悄然传播:

Hermes Agent——一个开源、自托管的持久型AI Agent。

它没有OpenClaw那样的高调宣传,没有铺天盖地的媒体报道,甚至没有复杂的安装流程。但它做到了OpenClaw做不到的事情:

从经验中学习,在使用中进化。

张磊在4月5日第一次尝试Hermes,一周后,他彻底停用了OpenClaw。

"这不是背叛,"张磊解释,"而是我遇到了一个真正能'成长'的AI Agent。"

故事:从工具到伙伴的进化

OpenClaw的诞生,曾经让整个技术圈为之沸腾。

2026年2月,当OpenClaw第一次出现在GitHub上时,它解决了AI Agent领域的一个根本痛点:如何让AI真正"做"事情,而不是只会"说"事情。

OpenClaw的设计哲学清晰而实用:

你给它工具(文件操作、浏览器控制、终端执行)
你给它规则(Skill插件系统、SOUL.md身份定义)
你全程盯着它,每一步都需要你确认

这种"人在决策环里"的设计,在早期是巨大的优势。它给了用户完全的控制权,所有操作都是透明的,所有行为都可以在文件层面审计。

"我用OpenClaw处理了一个复杂的数据分析任务,"张磊回忆,"每一步它都要问我:'我要运行这个Python脚本,可以吗?'、'我要访问这个API,可以吗?'、'我要创建这个文件,可以吗?'。虽然有点啰嗦,但我知道它在做什么。"

这种控制感,正是OpenClaw吸引硬核开发者的核心原因。

但随着用户量的增长,问题开始暴露。

问题一:版本迭代引入的稳定性问题

3月前后,OpenClaw连续发布了几次大版本更新,每次都带来大量新功能,但也引入了新的bug。用户量暴增后,各种边缘场景开始出现,issue堆得越来越高,但开发团队的响应速度跟不上。

张磊的经历:

"3月15号的版本更新后,我发现OpenClaw在处理某些特定类型的文件时会崩溃。我在GitHub上提交了issue,但三天都没人回复。后来自己翻了代码,才发现是一个简单的边界条件问题。"

问题二:技术债的雪球越滚越大

OpenClaw的设计追求"什么都要":既要控制文件系统,又要管浏览器,又要支持Skill插件,还要保证安全沙盒。这些目标之间本身就有张力,在没有足够多资源维护的情况下,顾此失彼就成了常态。

更深层的问题是:OpenClaw的设计哲学,本身就不适合大规模推广。

问题三:人必须在决策环里,这把双刃剑

"人必须在决策环里"在早期是优势,但当用户量大了之后,大多数普通用户并不想在每一步操作前都停下来确认。他们想要的是:说一声,事情办了。

张磊的感受:

"刚开始我觉得'每步确认'很安心,但用了两周后,我开始烦躁了。一个简单的文件整理任务,OpenClaw要问我10次'可以吗?'。我开始思考:为什么不能一次性把整个任务的规则都告诉它,让它自己决策?"

这就是OpenClaw的根本问题:它把用户当成了监控者,而不是监督者。

革命:Hermes Agent的重新定义

Hermes Agent的诞生,没有OpenClaw那样的高调宣传。它像一颗在技术圈悄然生根的种子,靠着口碑传播,慢慢生长。

Hermes的核心哲学只有一句话:

Agent = 你给目标 + 它自己学 + 用久了比你自己还懂你。

这句话看似简单,但它从根本上重新定义了AI Agent的定位。

从工具到伙伴的根本转变

OpenClaw的逻辑是:

你给工具
你给Skill
你全程盯着

Hermes的逻辑是:

你给目标
它自己找方法
它从经验中学习

这个差异,张磊用一次实际任务体验到了。

任务:定期分析项目代码质量,并生成报告

用OpenClaw:

1. 写一个Python脚本,用于代码质量分析
2. 告诉OpenClaw:每天运行这个脚本
3. 每次运行前,OpenClaw都要问:可以吗?
4. 如果脚本需要修改,你必须手动改,再告诉OpenClaw
5. 下次做类似任务,这些步骤全部重来

用Hermes:

1. 告诉Hermes:每周一早上9点,分析代码质量并生成报告
2. Hermes自动分析项目结构,选择合适的工具
3. 第一次运行后,Hermes把成功的执行路径保存成Skill
4. 下次运行,Hermes自动调用这个Skill,无需你再指导
5. 如果你想改进报告格式,只需说一句"改得更详细一点"
6. Hermes会自动更新Skill,下次就用新格式

张磊的总结:

"OpenClaw像是一个'工具箱',你需要自己选工具、自己拧螺丝、自己检查结果。 Hermes更像是一个'助手',你告诉他目标,他去找工具,拧螺丝,检查结果,甚至自己优化工作流。

工具不会成长,但助手会。"

架构层面的根本差异

Hermes的架构,不是"一个会聊天的命令行工具",而是一套把模型、工具、记忆、技能、自动化和安全边界拼到一起的Agent runtime。

让我们拆解Hermes的八层架构:

第一层:运行时入口层

Hermes从一开始就把CLI、消息平台和自动化视为同一套runtime的不同入口。

这意味着:

你在CLI里配置的记忆,在Telegram里也能用
你在Discord里创建的Skill,在Slack里也能调用
你用cron设置的定时任务,和交互式任务共享同一个技能库

这不是"先做个命令行,后面再补Bot",而是一开始就设计成统一runtime。

第二层:模型与工具执行层

Hermes把"模型调用"和"工具调用"彻底分开:

模型负责:理解目标、规划步骤、判断是否调用工具
工具负责:真的去搜网页、改文件、跑终端、开浏览器

模型不绑定某一家,支持OpenAI Codex、Nous Portal、OpenRouter等所有兼容端点。

第三层:上下文装配层

这是很多人会忽略,但其实很像"控制中枢"的地方。

Hermes在正式推理前,会做一轮上下文装配:

先吃系统级配置和项目规则
再吃用户当前显式引用的文件和变更
再把记忆、技能、外部provider上下文拼进去
最后才把完整上下文交给模型

这一步非常像一个"prompt assembly pipeline",不是单纯地把用户一句话丢给模型。

第四层:持久记忆层

这是Hermes区别于OpenClaw最大的点。

Hermes的内建记忆不是模糊概念,而是两份固定文件加一套历史检索机制:

MEMORY.md(约800 tokens):

存项目结构
存工具坑点
存工作流经验
存已经验证过的方法

USER.md(约500 tokens):

存用户偏好
存沟通方式
存习惯
存雷区
存技术水平

这两份文件不是实时乱改的"内存",而是在会话开始时作为frozen snapshot注入system prompt。这意味着Hermes对持久记忆的使用是受控的、稳定的。

更重要的是:Hermes的记忆有明确的容量设计。超了怎么办?不是无限追加,而是让Agent自己consolidate或替换旧条目。

Hermes官方对记忆的理解不是越多越好,而是要把常驻上下文压缩成真正重要的那一小块。

第五层:外部记忆Provider层

Hermes没有把记忆架构写死,而是做成了插件化接口。

除了内建的MEMORY.md/USER.md,Hermes还可以外挂一个外部memory provider(如Honcho)。当外部provider启用时,Hermes会自动做:

把provider知道的上下文注入system prompt
在每轮对话前预取相关记忆
在每次响应后把对话同步给provider
会话结束时抽取长期记忆
把内建记忆写入镜像到provider
给Agent暴露provider专属工具

这一层的意义在于:Hermes把内建轻记忆和外部深记忆分层了。

第六层:技能与程序性记忆层

如果说持久记忆存的是"你是谁、环境是什么、哪些事实重要",那技能层存的就是"事情到底怎么做"。

Hermes对Skills的定义很直接:它是按需加载的知识文档,遵循progressive disclosure(渐进式揭示)。

但最关键的不是"技能是markdown文件",而是Hermes把技能明确当成了procedural memory(程序性记忆)。

官网文档里说得非常直白:

完成复杂任务后,Agent可以创建Skill
试错后找到正确路径,可以保存成Skill
用户纠正了做法,也可以更新Skill
Agent甚至可以删除过时Skill

技能层其实是Hermes对经验沉淀的正式建模。

记忆层回答的是:

用户是谁
项目是什么
过去讨论过什么

技能层回答的是:

这类任务该怎么做
哪条流程以前走通过
哪些坑已经踩过

这个分层很漂亮。因为如果你把"用户喜欢简洁回答"存成Skill就太重了;反过来,如果你把"如何部署Kubernetes服务"塞进MEMORY.md又太脏。Hermes官方把这两类东西拆开,实际上就是在区分事实记忆和程序记忆。

第七层:自动化与并行执行层

Hermes已经把Agent从"交互式助手"推向了"可运营的任务系统"。

支持的能力包括:

Scheduled Tasks:通过自然语言或cron表达式创建定时任务
Subagent Delegation:启动子Agent,隔离上下文并限制工具集
Code Execution:让Agent写Python脚本,通过沙箱化RPC一次完成多步工具调用
Batch Processing:批量并行跑大量prompt

第八层:安全与隔离层

最后一层是安全边界。Hermes采用的是defense-in-depth(纵深防御),而不是单点防护。

它把安全分成五层:

用户授权
危险命令审批
容器隔离
MCP凭证过滤
上下文文件扫描

这套设计说明Hermes并没有因为"自治"就放弃"边界"。恰恰相反,它把最危险的几个边界都显式化了。

深度:为什么"进化"才是AI Agent的未来

Hermes的架构,表面上看只是比OpenClaw多了几层功能,但它的本质是把"学习"和"进化"做成了AI Agent的第一性原则。

从"人治"到"自治"的根本转变

OpenClaw代表的是"人治"范式:

人定义规则
Agent执行规则
人监督全过程

Hermes代表的是"自治"范式:

人定义目标
Agent自己找最优路径
Agent从经验中学习优化

这两种范式没有绝对的对错,但它们适应的场景完全不同。

OpenClaw的问题是:它假设了用户愿意且能够持续介入。

实际上,大多数人不愿意。开个电脑还要审批一堆东西,时间久了就烦了,要么关掉安全机制,要么干脆不用。

Hermes的问题是:它把"自动进化"做得很漂亮,但这个进化过程对用户是不透明的。

Agent学了什么、为什么这么学、某次决策的依据是什么——这些都是黑盒。用户要么选择完全信任,要么选择不用。中间地带很小。

Hermes的真正突破

Hermes的真正突破,不是功能上的堆砌,而是它解决了AI Agent领域的三个根本问题:

问题一:重复任务如何自动化?

传统方案(OpenClaw):

每次任务都要重新配置
用户需要记住复杂的配置流程
配置错误会导致任务失败

Hermes方案:

第一次任务后,自动保存为Skill
下次同类任务,自动调用Skill
Skill会根据使用情况自动优化

张磊的体验:

"我每周都要做一次代码质量分析。用OpenClaw,每次都要重新配置命令行参数、选择工具、设置输出格式。用Hermes,第一次之后,它就自动学会了。现在我只要说'做代码质量分析',它就知道我想用哪个工具、哪个参数、哪个格式。"

问题二:个性化需求如何满足?

传统方案(OpenClaw):

需要用户手动编写个性化配置
配置复杂,需要编程能力
难以适应细微的偏好差异

Hermes方案:

自动学习用户偏好
长期使用,越用越懂你
细微偏好也会被记住

张磊的体验:

"我发现Hermes慢慢开始知道我喜欢什么样的回答了。有时候我问一个问题,它会直接给我我想看到的格式,而不是问我要哪种格式。这有点可怕,但真的好用。"

问题三:复杂任务如何分解?

传统方案(OpenClaw):

需要用户手动分解任务
分解错误会导致任务失败
难以处理复杂的依赖关系

Hermes方案:

自动分析任务结构
智能分解为子任务
自动处理依赖关系

张磊的体验:

"我让Hermes帮我'部署一个Web应用'。它没有直接开始部署,而是先问了我几个问题:数据库用什么?部署环境是什么?需要监控吗?然后它自动分解任务,一步步完成。这种智能分解能力,OpenClaw没有。"

实战:从OpenClaw迁移到Hermes

张磊从OpenClaw迁移到Hermes的过程,只用了三天。

Day 1:安装和初体验

Step 1:安装Hermes

# 克隆仓库
git clone https://github.com/nousresearch/hermes-agent.git
cd hermes-agent

# 安装依赖
pip install -e .

# 初始化配置
hermes init

Step 2:连接消息平台

# 设置Telegram
hermes gateway setup --platform telegram

# 按照提示完成OAuth认证
# 输入Bot Token,选择频道

Step 3:第一次对话

在Telegram里@你的HermesBot,说:"你好"

张磊的初体验:

"我以为Hermes会和OpenClaw一样,问我一堆配置问题。但出人意料的是,它直接就回答了我的问题,而且回答得很准确。我意识到,Hermes已经有一个默认的'新手模式'。"

Day 2:配置个性化记忆

Step 1:编辑USER.md

# 打开用户记忆文件
vim ~/.hermes/memories/USER.md

张磊的配置:

# 用户画像

## 基本信息
- 职业:全栈开发工程师
- 技术栈:Python, JavaScript, Go
- 工作领域:Web应用开发

## 沟通偏好
- 喜欢简洁的回答
- 不喜欢太详细的技术细节
- 优先给出解决方案,然后解释原理
- 如果不确定,直接说不知道

## 工作习惯
- 每周一早上做代码质量分析
- 每周五下午写周报
- 遇到问题先查Google,再问AI

## 雷区
- 不要删除我的代码文件
- 不要修改生产环境的配置
- 不要在没有确认的情况下执行sudo命令

Step 2:编辑MEMORY.md

# 打开项目记忆文件
vim ~/.hermes/memories/MEMORY.md

张磊的配置:

# 项目记忆

## 当前项目:电商Web应用
- 技术栈:Python(Django), React, PostgreSQL
- 部署环境:Docker, AWS EC2
- 代码规范:PEP 8, ESLint

## 常用工具
- 代码质量:flake8, pylint
- 测试框架:pytest, Jest
- 部署工具:docker-compose, kubectl

## 已知问题
- 登录接口有并发问题,需要加锁
- 支付接口偶尔超时,需要重试机制
- 图片上传慢,需要CDN

## 工作流
- 开发流程:feature分支 → PR → review → merge → deploy
- 测试流程:单元测试 → 集成测试 → E2E测试
- 发布流程:staging环境 → 生产环境

张磊的感受:

"编辑这两个文件的时候,我发现Hermes的设计非常清晰。USER.md是关于'我'的,MEMORY.md是关于'项目'的。这种分离很合理。"

Day 3:第一个自动化任务

任务:每周一早上9点,自动做代码质量分析

Step 1:创建定时任务

在Telegram里@HermesBot,说:
"每周一早上9点,做代码质量分析,生成报告"

Step 2:Hermes第一次执行

Hermes自动分析项目结构,选择工具:
- 代码质量检查:flake8, pylint
- 报告生成:HTML格式
- 邮件通知:发送到我的邮箱

Step 3:Hermes创建Skill

Hermes自动保存为Skill:
~/.hermes/skills/code_quality_analysis.md

张磊的观察:

"Hermes第一次执行花了10分钟,因为它需要分析项目、选择工具、生成报告。第二次执行只用了3分钟,因为它已经学会了工作流。第三次执行,我甚至没意识到它已经完成了,因为它完全是自动的。"

影响:AI Agent的未来战局

Hermes的崛起,不是OpenClaw的失败,而是AI Agent范式的进化。

OpenClaw不会消失,但它的定位会改变

短期看,OpenClaw在硬核开发者社区还会是主流,尤其在隐私合规要求高的场景里。

它的价值在于:

完全透明,所有操作文件层面可见
高度可控,每一步都需要确认
安全沙盒,适合处理敏感数据

张磊的选择:

"我并没有完全停用OpenClaw。对于需要高度控制的任务,比如处理生产环境的数据,我依然会用OpenClaw。但对于日常的、重复性的、可以自动化的任务,我全部用Hermes。"

"能进化的Agent"会成为主流

长期看,能"进化"的Agent范式会逐渐成为主流。

原因很简单:

大多数人没有时间精力去精细化管理一个Agent
大多数任务都是重复性的,需要自动优化
大多数用户都希望Agent能越用越懂自己

但这个"进化"机制的透明度和可控性,是它能不能真正普及的关键。

Hermes已经走出了第一步,但它还面临挑战:

挑战一:Skill进化的黑盒问题

当Hermes生成了一个你不认可的Skill时,你没有像OpenClaw那样直接改文件的能力。

张磊的担忧:

"有一天我发现Hermes自动创建的Skill有个bug。我想直接改那个markdown文件,但Hermes警告我:手动修改可能会导致技能失效。这让我有点不安。"

挑战二:"成长"需要时间

Hermes用久了确实会更懂你,但这个"久"是真的需要一段时间积累。如果你的使用场景是一次性的、或者用几次就不用了,Hermes的学习能力体现不出来。

张磊的体验:

"前三天用Hermes,它给我的回答和GPT-4没什么区别。用了一周后,它开始记住我的偏好。用了一个月后,它已经能准确预测我的需求了。但这种'成长'需要时间,不是开箱即用的。"

挑战三:极度隐私敏感场景的局限

虽然Hermes支持本地部署,但它的Skill自动生成机制涉及将执行路径数据写进技能库——这意味着你的使用习惯本身会被结构化存储。

对于极度保守的安全要求,这个存储本身也需要保护。

混用可能是最佳方案

张磊找到了一个务实的方案:混用OpenClaw和Hermes。

用OpenClaw做主控层:
- 处理需要精确控制的高风险任务
- 处理敏感数据的操作
- 需要完全透明的场景

用Hermes做轻量执行节点:
- 处理重复性的日常任务
- 需要自动学习优化的工作流
- 实验性功能的测试

这种架构的优势:

高风险任务依然可控
日常任务自动化
实验性功能隔离
可以随时回滚

张磊的总结:

"OpenClaw给了我安全感,Hermes给了我效率。两者结合,才是我想要的。"

终局:当Agent不再只是工具

张磊的故事,不是关于"工具取代工具",而是关于"范式演进"。

他从一个需要精细控制每一步操作的用户,变成了一个可以放心委托任务的管理者。

Hermes的意义,不只是让Agent更智能,而是让Agent真正成为"伙伴"。

因为:

持久记忆让Agent记住你
自动进化让Agent适应你
技能系统让Agent服务你
安全边界让Agent保护你

2026年的今天,AI Agent的边界已经扩展到:

从"人治"到"自治"
从"工具"到"伙伴"
从"执行"到"进化"
从"单次"到"长期"

而这一切,不需要复杂的配置,不需要深度学习知识,完全开源免费。

AI Agent的未来,是更智能、更自适应、更懂你。

张磊的最后思考:

"OpenClaw让我意识到,AI Agent可以'做'事情。 Hermes让我意识到,AI Agent可以'学会'做事情。

但最深刻的发现是:当AI Agent开始'学习',它就不再只是工具,而是伙伴了。

因为伙伴会成长,工具不会。"

Hermes Agent: https://hermes-agent.nousresearch.com/docs/getting-started/quickstart/^[1]

OpenClaw: https://github.com/reconurge/openclaw^[2]

许可证: Apache License 2.0

技术栈: Python, Open Source, Self-hosted

主要功能:

持久记忆系统
自动技能进化
多平台集成
定时任务调度
纵深防御安全

适用场景:

重复性任务自动化
个性化需求满足
复杂任务智能分解
长期使用场景
团队协作需求

如果你也在使用AI Agent,或者对Hermes vs OpenClaw有自己的看法,欢迎在评论区分享你的选择和理由。

引用链接

[1]https://hermes-agent.nousresearch.com/docs/getting-started/quickstart/

[2]https://github.com/reconurge/openclaw