深度拆解:从 OpenClaw 到 Hermes 的架构迁移实战-夜雨聆风

深度拆解:从 OpenClaw 到 Hermes 的架构迁移实战

大家好，我是 kman。之前写过一篇我用 OpenClaw + 飞书搭的那套 6 个 Agent 分工方案——小墨管调度、墨媒管运营、墨码写 AI、墨微写读书、墨红跑小红书、墨拍做短视频，资讯抓取、编码辅助、公众号和短视频运营全压在这套架子上。

跑了一段时间，架构本身没毛病，”角色化分工”的思路我现在依然认。但实操里有两个问题越来越绕不开：

一是烧 token。 多个 Agent 之间反复传上下文，加上每个角色自带的 SOUL/USER/AGENTS 三件套，一轮任务跑下来 token 哗哗走，两天就开始算账。

二是丢记忆。 长链路任务跨几轮之后，前面铺好的状态经常对不上号，得人工回去捞，”全自动”硬生生跑成了”半自动”。

最近研究了一段时间 Hermes，发现它在上下文管理和成本控制上的设计思路明显更”工程化”——不是堆 Agent 数量，而是把这两件事当成核心问题来解决。

这篇是一次实打实的迁移复盘：把 OpenClaw 那套场景原样搬到 Hermes 上，记录哪些坑没躲过、哪些地方真香、哪些地方还需要再观察。没有跑分数据，只有真实体感，给同样在多 Agent 路上折腾的朋友一点参考。

一、两个心头病，到底硌在哪

光说”烧 token、丢记忆”太虚，举两个我自己每周都会遇到的场景。

场景一：风格记忆”薛定谔更新”

用墨码Agent写读书号的公众号内容，写了一段时间之后，风格和用词习惯基本定下来了。我觉得这些应该沉淀下来，于是把偏好重新整理了一遍——哪些词不能用、句子多长、语气什么感觉——让 OpenClaw 更新到永久记忆。

更新完当场试了试，写得挺好，风格完全对上了。

结果下次开个新对话接着写，它又回到了最早那种味道——好像上次的更新压根没发生过。我只能再贴一遍偏好，再让它更新一次。过几轮，老样子又来了。

这件事本身就违背了我用这套系统的初衷：我不应该每次都当”人肉记忆搬运工”。

场景二：墨拍做短视频脚本

短视频脚本是个典型的多 Agent 协作场景：

•

墨媒先出选题方向

•

墨码或墨微提供内容素材

•

墨拍把素材改写成口播脚本 + 分镜

•

最后回到墨媒做平台适配（视频号 / 抖音文案差异）

这套链路跑起来，每个 Agent 都要把前面所有 Agent 的产出当作上下文塞进去，token 是叠加的。一条 60 秒的脚本，背后可能是几万 token 的内部对话——你为最终那 300 字的脚本，付了整本小说的钱。

而且只要中间任何一个 Agent 上下文截断了，后面就开始胡编。

两件事归根到底是同一个问题： 在多 Agent 系统里，”上下文”和”成本”是绑在一起的。要省 token 就得砍上下文，砍了上下文就丢记忆——OpenClaw 的设计更偏”角色隔离、各管一摊”，把这道题留给了使用者自己解。

二、为啥看上 Hermes

研究下来，Hermes 吸引我的是两个底层设计思路（以下是我作为使用者的理解，具体实现请以官方文档为准）。

1. 记忆是显式管理的资源，不是靠对话历史堆出来的

OpenClaw 的玩法更像”一群人在群里协作”，每个人手里拿着自己的笔记本，需要同步信息就互相喊话。

Hermes 的思路更像”大家手里都有各自的本子，但项目关键信息放在共同可见的地方”——共享状态是显式管理的，Agent 之间传递的是结构化引用，而不是把完整的对话历史再喂一遍。

这意味着：像读书号持续输出这种跨周期的任务，记忆稳不稳定，不再靠”对话历史还没被截断”这种运气。

2. 成本可观测，优化有抓手

多 Agent 系统最坑的不是贵，是你不知道贵在哪。

Hermes 把 token 消耗、调用链路、每个 Agent 的成本贡献做成了可视化。哪个环节在烧钱，一眼能看出来；想优化也有地方下手——而不是像之前那样，月底看账单只能干瞪眼。

这两点，正好对上我那两个心头病。

三、迁移实录：Profile 隔离怎么用

光说概念太虚，直接上迁移过程。

OpenClaw 那套是用”一个 Agent 一个 workspace”做隔离，记忆、SOUL、技能完全独立。Hermes 走的是类似但更轻的路子：用 profile 做隔离单位。

我对着原来 6 个 Agent 的角色，在 Hermes 里建了对应的 profile：


default          日常私人助手（运行中）work             工作项目coding           编程专用research         研究资料wechat-book      读书分享公众号（对应原墨微）wechat-laoma     老码的AI实践公众号（对应原墨码）moss-video       视频内容创作（对应原墨拍）

每个 profile 都用 --clone 从 default 复制出来，自动继承了 config、.env、SOUL.md 和 skills。

也就是说，起步时所有角色共享同一套基线，之后各自独立演化——这比 OpenClaw 那种”从零写一份 SOUL/USER/AGENTS”省事很多，特别适合从一个能用的 default 慢慢分化出专精角色。

启动方式也很轻：


hermes -p wechat-laoma   # 进入交互hermes -p coding chat -q"帮我审查这个项目代码"# 单次调用

每个 profile 还会自动生成一个 wrapper，等于给每个角色发了张名片：


wechat-laoma chatmoss-video chat

有一点必须说清楚： profile 隔离的是记忆、上下文和会话，不是系统权限。如果你启用了 file/terminal 这类工具，它们依然可以访问同一个本机文件系统。

所以，多 Agent 系统的安全边界永远要在工具权限那一层划，不是靠角色隔离。这一点 OpenClaw 也一样。

四、搬迁实录：读书号风格记忆怎么稳住

profile 建好了，最该验证的就是场景一说的那个问题——风格记忆到底能不能真的留住。

改造前（OpenClaw）：

•

墨码的记忆靠 workspace 里的 SOUL.md + 当前对话历史

•

写了一段时间想沉淀风格，得手动整理偏好、更新到记忆文件

•

更新完当前对话能用，新开一轮又忘了，等于白折腾

改造后（Hermes / wechat-laoma profile）：

•

把风格偏好提炼成一份结构化的项目记忆：禁用词表、句式模板、语气关键词

•

每次启动写作任务，先自动加载这份记忆，不需要手动贴

•

写的过程中如果发现风格偏了，可以即时更新记忆，下次直接生效

踩到的坑：

记忆不是塞得越多越好。 一开始我把所有写过的风格反馈都丢进去，效果反而下降——模型注意力被稀释了。后来只保留”高频规则 + 最近案例”，质量明显回升。

回写要有规则。 一开始让 Agent 自己更新记忆，它把很多无关的对话内容也写进去了，记忆越来越臃肿。后来我定了模板：”只更新风格规则、禁用词、句式三个字段”，才稳住。

冷启动比想象中麻烦。 把之前积累的风格偏好整理成 Hermes 的记忆格式，是个体力活，没捷径。

体感差异：

新开对话不再需要手动喂风格了，它自己就能对上。偶尔还会飘，但比之前好太多。最大的感受是：我终于不用当”人肉记忆搬运工”了。

五、搬迁实录：墨拍短视频脚本

这条线考的是多 Agent 协作的成本问题。

改造前（OpenClaw）：

•

墨媒 → 墨码 → 墨拍 → 墨媒，四个环节串起来

•

每个环节把前面所有产出当上下文塞进去，token 滚雪球

•

一条脚本背后的内部对话量，远超脚本本身

改造后（Hermes / moss-video profile）：

这里说明一下实际结构：四个环节仍然是独立的 profile（墨媒、墨码、墨拍各自一个），它们之间不直接传对话历史，而是传结构化的中间产物——选题卡、素材包、脚本草稿、平台适配版。

需要共享的项目状态（比如选题方向、风格约定）单独维护，每个 Agent 按需取用，而不是每次全量传递。

整条链路的 token 消耗在 Hermes 后台是可视化的，哪个环节贵一眼能看见。

踩到的坑：

中间产物的格式要先定好。 一开始让 Agent 自由发挥，结果素材包格式天天变，墨拍读起来反而更费劲。后来用 JSON schema 把每个中间产物锁死，整条链路才稳。

共享状态有”过期”问题。 墨媒昨天写的选题方向，今天墨拍还在用——但平台热点已经变了。后来加了时间戳和过期标记。

可观测性是双刃剑。 能看到每个环节烧多少 token 确实爽，但也容易陷入”过度优化”——为了省那点钱反复调 prompt，结果耽误了主线。该花的钱还是要花。

体感差异：

没有具体数据，但直观感受是同样一条脚本，内部对话量明显瘦身。更重要的是，当某条脚本出问题，我能直接定位是哪个环节出了什么状况——这在 OpenClaw 那套里基本靠猜。

六、阶段性结论

跑了快一个月，给个阶段性判断。

Hermes 真香的地方：

•

长链路、跨周期的任务（连载、专题、长期项目），记忆稳定性是质变

•

多 Agent 协作的成本可视化，让”优化”从玄学变成工程

•

profile --clone 这套机制，让从单 Agent 分化到多角色的成本非常低

•

强迫你把”中间产物”结构化，副作用是整个系统更好维护

还在观察的地方：

•

学习曲线比 OpenClaw 陡。OpenClaw 是”配几个文件就能跑”，Hermes 需要你先想清楚记忆结构和数据流

•

Profile 隔离的是记忆和会话，不是系统权限——工具权限边界还得自己划

•

生态还在早期，遇到问题翻文档 + 自己摸索的成本不低

•

不是所有场景都值得搬。一次性任务、轻量场景，OpenClaw 那套依然够用

给想跟进的朋友三条建议：

先别急着全量搬迁。挑一条最痛的业务线试点——比如我就是先搬了”读书号风格记忆”这一条，跑通了再扩

先设计记忆结构，再写 Agent。 这个顺序反过来一定后悔

盯紧成本可视化。这是 Hermes 给你的最大礼物，别浪费

最后说一句：工具的迭代没有终点。OpenClaw 教会我”角色分工”的思路，Hermes 在这个基础上把记忆管理和成本控制做得更工程化。底层思路是延续的，不是推翻。