乐于分享
好东西不私藏

从OpenClaw 到 Hermes:下一代智能体,记忆到底是怎么“长”出来的?

从OpenClaw 到 Hermes:下一代智能体,记忆到底是怎么“长”出来的?

OpenClaw 到 Hermes:下一代智能体,记忆到底是怎么“长”出来的?

这两年如果你稍微关注一点AI 智能体圈子,应该已经被两个名字刷过屏:

OpenClaw:被国内社区亲切地叫“小龙虾”,一个“能把所有 AI 能力接在一起”的中控式智能体;

Hermes Agent:被戏称为“龙虾界的爱马仕”,主打“会自己长大、越用越聪明”的自进化智能体。

网上讨论最多的是:

“我是不是该从 OpenClaw 迁到 Hermes?”“Hermes 完全取代 OpenClaw 吗?”“谁才是智能体的未来?”

如果你把所有技术细节都抛开,只盯着一个问题看,其实更容易看明白:

这一代智能体,是怎么把“记忆”这件事做得越来越像人类的?

我尝试用一个简单的四层结构来帮你拆开看:

1.提示词记忆层:我现在要怎么对你说话?

2.会话检索层:我之前跟你说过什么?

3.Skills 层:你以前做过的事,能不能变成“经验”?

4.Honcho 层:你到底“认识的是谁”?

这四层不是官方叫法,是我参考了OpenClaw、Hermes 的设计,再结合自己的理解抽象出来的一套“读者视角模型”。它未必严谨,但挺方便帮助你快速理解现有开源智能体在记忆这件事上到底做了什么,也方便你反过来思考:我们自己的智能体平台,应该把记忆这层做好到什么程度?

一层:提示词记忆——“我现在要怎么跟你说话?”

这一层,其实是所有智能体架构里最容易被忽略的一块。

你可以把它理解成:“此刻这一次调用里,LLM 收到的提示词长什么样”

OpenClaw / Hermes 里,它大致包含:

系统提示词(System Prompt):

你是谁?风格如何?边界是什么?

比如:“你是一个技术支持助手,说话简洁,所有回答先给结论再给原因。”

当前任务框架:

这次要解决的核心问题;

已经有哪些已知约束(时间、工具、权限等)。

临时注入的“短期记忆”:

刚才检索出来的重点历史对话;

刚刚从Skills / 知识库选出的几个片段。

OpenClaw 更偏“中控”,会集中管理不同场景的固定 Prompt 模板;Hermes 强调“会长大”,会根据技能、用户画像动态调整提示词结构。

这一层本质上解决的是:

“这一刻”,我应该用什么语境、什么风格、什么前置信息来理解你、回应你?

它像是你跟一个同事说话之前,在脑子里先给自己打一段小小的“心理预设”“等会跟运营聊,要讲业务价值;等会跟研发聊,要讲技术细节。”

对我们做智能体平台的人来说,这层很关键:

决定了不同业务智能体是否“像一个人”,还是只是“一个 API 包装”;

决定了我们能不能把一个基础大模型,包装成多个有明显人格和边界的角色。

二层:会话检索——“我之前跟你说过什么?”

第二层,就是大家最熟悉的“历史会话 + 向量检索”,但在 OpenClaw / Hermes 里,已经长得更细。

OpenClaw 的思路大致是:

会话本身作为消息流存在(多平台网关),

重要内容提炼成结构化记录(有点像写在MEMORY.md 里的“要点备忘录”),

通过语义检索把历史片段重新注入到新的Prompt 里。

简单说,它更像一个多人协作的“共享笔记 + 搜索”系统

Hermes 则直接上了比较“硬核”的做法:

SQLite + FTS5 做长期会话存储;

每条消息都有结构化字段:是谁说的、在哪个Agent 上下文中说的、关联了哪些任务/技能;

通过全文索引+ 语义检索混合,来支撑“跨会话记忆”。

于是你会得到这样一种能力:

两周前你在另一个对话里提过“我喜欢用函数式风格写 Python”,Hermes 能在今天帮你写代码时自动想起来,把风格对上。

这层解决的是:“一个对话”到“一个长期关系”

在我们给客户做积墨AI 智能体落地时,其实很多“看起来很难”的需求,本质都卡在这一层:

希望AI 记住我的写作风格、品牌语气、汇报模板;

希望AI 知道“这个老板最讨厌 PPT 上出现哪些词”;

希望AI 每次帮我写项目纪要时,都能自动延续上一次的结构。

如果没有这层,会话每次都是“初次见面”;有了这层,才有了“我们已经聊了很久”的错觉。

三层:Skills——“你以前做过的事,能不能变成‘经验’?”

第三层,是Hermes 拉开和 OpenClaw 差距最大的地方之一,也是一大堆文章反复提到的亮点。

先看传统做法:OpenClaw 式 Skills

OpenClaw 的“技能”,更接近我们熟悉的:

插件/ 工具(Tool):比如“调用某个 API”、“读写某个知识库”;

行为模板:某段固定流程,比如“先问清楚需求,再列方案,再输出结果”。

这些Skills 多数来源于:

开发者手写;

社区贡献(ClawHub 上的技能包)。

优点:稳定、可控、易于企业治理。缺点:不会自己长,需要人不停写。

Hermes 的做法:让技能从“用过的经验”里长出来

Hermes 在 Skills 上做了一个非常激进的设计:

1.每次执行一个非平凡任务时,会自动记录“任务过程 + 关键决策”;

2.任务结束后,会由一个“反思/总结”的 Loop,把这次执行抽象成一份技能说明(Markdown);

3.下次遇到类似任务时,会优先检索这些“经验技能”,再进行改写和复用;

4.如果执行失败,会把失败原因也写入技能文档里,形成“修正版技能”。

这就像你带一个新人干活:

第一次你手把手教;

第二次他看上次的记录自己做,你在旁边纠错;

再之后,他自己会根据之前踩过的坑自动规避。

Hermes 官方用的是一个比较硬核的说法:“从任务轨迹中自动提取可重用策略,形成自进化技能库。”

在这层上,我们能看到智能体和“传统 ChatGPT 封装”的最大差异:

它不再只是“会按你说的做一次”。而是“做完一次,会记住怎么做,下次做得更好”。

这层能力,对业务来说意味着什么?

你也许不需要一堆人写SOP,而是让智能体在真实任务中自然生长出“机器版 SOP”;

你可以把高频、可复用的工作沉淀成公司自己的“AI 经验资产”,而不是每次都从零开始问一个通用大模型。

四层:Honcho——“你到底认识的是谁?”

第四层是Hermes 这套架构里非常特别的一块:Honcho 引擎

通俗点讲,它负责回答一个底层问题:

“眼前这个用户/团队/项目,在我的世界观里是谁?”

你可以把它理解成:“人”和“组织”做长期建模的那一层记忆。

Hermes 里的 Honcho 大致做了这些事:

记录一个用户跨对话的行为特征:

说话风格:是喜欢直接结论,还是喜欢过程解释;

决策偏好:保守/激进、先考虑风险还是机会;

技能水平:比如“这位用户是资深 Go 工程师,不要用过于基础的解释”。

建模一个“抽象人格”:

在不同任务里提取“这个人一贯的偏好和约束”;

用类似“辩证法”的方式(官方文档这么形容),不断修正原来的印象。

在每次新会话时,把这个“抽象人格”注入到 Prompt 和决策里。

对用户来说,表现出来就是几件事:

你不需要每次都重新告诉它“我不喜欢太官方的语气”;

你不需要每次都解释“我们公司在这个项目上的底线是什么”;

它会越来越“懂你”,甚至知道什么情况下该提醒你一句“这个做法风险有点大”。

OpenClaw 体系里,这一层更多还是靠外部系统(CRM、用户画像系统)来做,Hermes 是把它作为智能体自身的一部分来看。

这层的意义在于:

记忆不再只是“记住发生过什么”,而是“形成对一个人的稳定认知,并在决策里用上”。

对于企业级智能体,这一层会越来越重要——因为所有“真正在业务里跑的智能体”,最后都绕不开一个问题:它到底是“工具”,还是“懂你的人”?

四层模型之外:对我们做积墨AI 智能体平台的启发

上面这四层,是我站在“观察者”的角度,对 OpenClaw / Hermes 这两个标杆项目做的一个拆解和抽象,不是他们官方的架构图。

这套拆解,对我们自己在积墨AI 智能体平台上的选择,其实有几个很直接的启发:

1.不要把“记忆”只理解成向量库

记忆至少有:

当次提示词的“短期记忆”;

会话检索的“工作记忆”;

Skills 级的“经验记忆”;

Honcho 级的“人格/画像记忆”。

不同业务只需要其中一部分,但架构上要能支撑完整闭环。

2.企业更适合“OpenClaw + Hermes 思路结合”

OpenClaw 式的“中控 + 多平台接入 + 稳定技能”,很适合做企业级统一入口、权限控制、治理。

Hermes 式的“自我进化技能 + 用户画像”,很适合落在具体业务线和团队里,让智能体随着使用成长。

3.真正的竞争力,不在“接了多少模型”,而在“记忆做得多细”

模型今天大家用的都差不多;

决定体验差异的是:

能不能长期记住企业内部的知识和经验;

能不能记住团队和个人的风格和习惯;

能不能让AI 在一个组织里越用越懂这个组织。

最后:如果你也在想“我们公司要不要搞自己的 Hermes?”

如果你看到这里,大概率已经在考虑类似问题:

我们要不要搭一套自己的智能体平台?

是不是应该“照着 Hermes 抄一套”?

如何在企业环境里做可控的“自我进化”?

我们现有的知识库、业务系统、钉钉/企微,怎么和这种四层记忆接起来?

这类问题,基本已经是我们「积墨AI智能体平台」每天在和客户一起讨论、落地的内容。

如果你:

想更系统地聊聊OpenClaw / Hermes 这些开源项目对你们意味着什么;

想看看“提示词记忆 – 会话检索 – Skills – 用户画像”这四层,在你们现有业务里可以从哪一层先做起;

想要一套“能落地到具体团队的智能体记忆方案”,而不是再多一个Demo——

欢迎在微信搜索并关注公众号「积墨AI实验室」

后面我们会持续拆解这些全球最新的智能体架构,也会分享我们在实际企业项目里踩过的坑、学到的最佳实践:

怎么给老板配一整套AI 管理助手;

怎么让知识库不再只是“文件柜”,而是“会长大的经验库”;

怎么让智能体逐渐成为你团队里“真正能托付事情的人”。

如果你已经有具体场景,也可以在「积墨AI实验室」后台留言【智能体记忆】,我们可以一起从你的第一条业务线开始,把这四层记忆真正跑起来。