乐于分享
好东西不私藏

深度拆解:从 OpenClaw 到 Hermes 的架构迁移实战

深度拆解:从 OpenClaw 到 Hermes 的架构迁移实战

大家好,我是 kman。之前写过一篇我用 OpenClaw + 飞书搭的那套 6 个 Agent 分工方案——小墨管调度、墨媒管运营、墨码写 AI、墨微写读书、墨红跑小红书、墨拍做短视频,资讯抓取、编码辅助、公众号和短视频运营全压在这套架子上。

跑了一段时间,架构本身没毛病,”角色化分工”的思路我现在依然认。但实操里有两个问题越来越绕不开:

一是烧 token。 多个 Agent 之间反复传上下文,加上每个角色自带的 SOUL/USER/AGENTS 三件套,一轮任务跑下来 token 哗哗走,两天就开始算账。

二是丢记忆。 长链路任务跨几轮之后,前面铺好的状态经常对不上号,得人工回去捞,”全自动”硬生生跑成了”半自动”。

最近研究了一段时间 Hermes,发现它在上下文管理和成本控制上的设计思路明显更”工程化”——不是堆 Agent 数量,而是把这两件事当成核心问题来解决。

这篇是一次实打实的迁移复盘:把 OpenClaw 那套场景原样搬到 Hermes 上,记录哪些坑没躲过、哪些地方真香、哪些地方还需要再观察。没有跑分数据,只有真实体感,给同样在多 Agent 路上折腾的朋友一点参考。


一、两个心头病,到底硌在哪

光说”烧 token、丢记忆”太虚,举两个我自己每周都会遇到的场景。

场景一:风格记忆”薛定谔更新”

用墨码Agent写读书号的公众号内容,写了一段时间之后,风格和用词习惯基本定下来了。我觉得这些应该沉淀下来,于是把偏好重新整理了一遍——哪些词不能用、句子多长、语气什么感觉——让 OpenClaw 更新到永久记忆。

更新完当场试了试,写得挺好,风格完全对上了。

结果下次开个新对话接着写,它又回到了最早那种味道——好像上次的更新压根没发生过。我只能再贴一遍偏好,再让它更新一次。过几轮,老样子又来了。

这件事本身就违背了我用这套系统的初衷:我不应该每次都当”人肉记忆搬运工”。

场景二:墨拍做短视频脚本

短视频脚本是个典型的多 Agent 协作场景:

墨媒先出选题方向
墨码或墨微提供内容素材
墨拍把素材改写成口播脚本 + 分镜
最后回到墨媒做平台适配(视频号 / 抖音文案差异)

这套链路跑起来,每个 Agent 都要把前面所有 Agent 的产出当作上下文塞进去,token 是叠加的。一条 60 秒的脚本,背后可能是几万 token 的内部对话——你为最终那 300 字的脚本,付了整本小说的钱。

而且只要中间任何一个 Agent 上下文截断了,后面就开始胡编。

两件事归根到底是同一个问题: 在多 Agent 系统里,”上下文”和”成本”是绑在一起的。要省 token 就得砍上下文,砍了上下文就丢记忆——OpenClaw 的设计更偏”角色隔离、各管一摊”,把这道题留给了使用者自己解。


二、为啥看上 Hermes

研究下来,Hermes 吸引我的是两个底层设计思路(以下是我作为使用者的理解,具体实现请以官方文档为准)。

1. 记忆是显式管理的资源,不是靠对话历史堆出来的

OpenClaw 的玩法更像”一群人在群里协作”,每个人手里拿着自己的笔记本,需要同步信息就互相喊话。

Hermes 的思路更像”大家手里都有各自的本子,但项目关键信息放在共同可见的地方”——共享状态是显式管理的,Agent 之间传递的是结构化引用,而不是把完整的对话历史再喂一遍。

这意味着:像读书号持续输出这种跨周期的任务,记忆稳不稳定,不再靠”对话历史还没被截断”这种运气。

2. 成本可观测,优化有抓手

多 Agent 系统最坑的不是贵,是你不知道贵在哪。

Hermes 把 token 消耗、调用链路、每个 Agent 的成本贡献做成了可视化。哪个环节在烧钱,一眼能看出来;想优化也有地方下手——而不是像之前那样,月底看账单只能干瞪眼。

这两点,正好对上我那两个心头病。


三、迁移实录:Profile 隔离怎么用

光说概念太虚,直接上迁移过程。

OpenClaw 那套是用”一个 Agent 一个 workspace”做隔离,记忆、SOUL、技能完全独立。Hermes 走的是类似但更轻的路子:用 profile 做隔离单位。

我对着原来 6 个 Agent 的角色,在 Hermes 里建了对应的 profile:

default          日常私人助手(运行中)work             工作项目coding           编程专用research         研究资料wechat-book      读书分享公众号(对应原墨微)wechat-laoma     老码的AI实践公众号(对应原墨码)moss-video       视频内容创作(对应原墨拍)

每个 profile 都用 --clone 从 default 复制出来,自动继承了 config、.env、SOUL.md 和 skills。

也就是说,起步时所有角色共享同一套基线,之后各自独立演化——这比 OpenClaw 那种”从零写一份 SOUL/USER/AGENTS”省事很多,特别适合从一个能用的 default 慢慢分化出专精角色。

启动方式也很轻:

hermes -p wechat-laoma   # 进入交互hermes -p coding chat -q"帮我审查这个项目代码"# 单次调用

每个 profile 还会自动生成一个 wrapper,等于给每个角色发了张名片:

wechat-laoma chatmoss-video chat

有一点必须说清楚: profile 隔离的是记忆、上下文和会话,不是系统权限。如果你启用了 file/terminal 这类工具,它们依然可以访问同一个本机文件系统。

所以,多 Agent 系统的安全边界永远要在工具权限那一层划,不是靠角色隔离。这一点 OpenClaw 也一样。


四、搬迁实录:读书号风格记忆怎么稳住

profile 建好了,最该验证的就是场景一说的那个问题——风格记忆到底能不能真的留住。

改造前(OpenClaw):

墨码的记忆靠 workspace 里的 SOUL.md + 当前对话历史
写了一段时间想沉淀风格,得手动整理偏好、更新到记忆文件
更新完当前对话能用,新开一轮又忘了,等于白折腾

改造后(Hermes / wechat-laoma profile):

把风格偏好提炼成一份结构化的项目记忆:禁用词表、句式模板、语气关键词
每次启动写作任务,先自动加载这份记忆,不需要手动贴
写的过程中如果发现风格偏了,可以即时更新记忆,下次直接生效

踩到的坑:

1.
记忆不是塞得越多越好。 一开始我把所有写过的风格反馈都丢进去,效果反而下降——模型注意力被稀释了。后来只保留”高频规则 + 最近案例”,质量明显回升。
2.
回写要有规则。 一开始让 Agent 自己更新记忆,它把很多无关的对话内容也写进去了,记忆越来越臃肿。后来我定了模板:”只更新风格规则、禁用词、句式三个字段”,才稳住。
3.
冷启动比想象中麻烦。 把之前积累的风格偏好整理成 Hermes 的记忆格式,是个体力活,没捷径。

体感差异:

新开对话不再需要手动喂风格了,它自己就能对上。偶尔还会飘,但比之前好太多。最大的感受是:我终于不用当”人肉记忆搬运工”了。


五、搬迁实录:墨拍短视频脚本

这条线考的是多 Agent 协作的成本问题。

改造前(OpenClaw):

墨媒 → 墨码 → 墨拍 → 墨媒,四个环节串起来
每个环节把前面所有产出当上下文塞进去,token 滚雪球
一条脚本背后的内部对话量,远超脚本本身

改造后(Hermes / moss-video profile):

这里说明一下实际结构:四个环节仍然是独立的 profile(墨媒、墨码、墨拍各自一个),它们之间不直接传对话历史,而是传结构化的中间产物——选题卡、素材包、脚本草稿、平台适配版。

需要共享的项目状态(比如选题方向、风格约定)单独维护,每个 Agent 按需取用,而不是每次全量传递。

整条链路的 token 消耗在 Hermes 后台是可视化的,哪个环节贵一眼能看见。

踩到的坑:

1.
中间产物的格式要先定好。 一开始让 Agent 自由发挥,结果素材包格式天天变,墨拍读起来反而更费劲。后来用 JSON schema 把每个中间产物锁死,整条链路才稳。
2.
共享状态有”过期”问题。 墨媒昨天写的选题方向,今天墨拍还在用——但平台热点已经变了。后来加了时间戳和过期标记。
3.
可观测性是双刃剑。 能看到每个环节烧多少 token 确实爽,但也容易陷入”过度优化”——为了省那点钱反复调 prompt,结果耽误了主线。该花的钱还是要花。

体感差异:

没有具体数据,但直观感受是同样一条脚本,内部对话量明显瘦身。更重要的是,当某条脚本出问题,我能直接定位是哪个环节出了什么状况——这在 OpenClaw 那套里基本靠猜。


六、阶段性结论

跑了快一个月,给个阶段性判断。

Hermes 真香的地方:

长链路、跨周期的任务(连载、专题、长期项目),记忆稳定性是质变
多 Agent 协作的成本可视化,让”优化”从玄学变成工程
profile --clone 这套机制,让从单 Agent 分化到多角色的成本非常低
强迫你把”中间产物”结构化,副作用是整个系统更好维护

还在观察的地方:

学习曲线比 OpenClaw 陡。OpenClaw 是”配几个文件就能跑”,Hermes 需要你先想清楚记忆结构和数据流
Profile 隔离的是记忆和会话,不是系统权限——工具权限边界还得自己划
生态还在早期,遇到问题翻文档 + 自己摸索的成本不低
不是所有场景都值得搬。一次性任务、轻量场景,OpenClaw 那套依然够用

给想跟进的朋友三条建议:

1.
先别急着全量搬迁。挑一条最痛的业务线试点——比如我就是先搬了”读书号风格记忆”这一条,跑通了再扩
2.
先设计记忆结构,再写 Agent。 这个顺序反过来一定后悔
3.
盯紧成本可视化。这是 Hermes 给你的最大礼物,别浪费

最后说一句:工具的迭代没有终点。OpenClaw 教会我”角色分工”的思路,Hermes 在这个基础上把记忆管理和成本控制做得更工程化。底层思路是延续的,不是推翻。