如何让 OpenClaw 像 Hermes 一样去自动写技能-夜雨聆风

如何让 OpenClaw 像 Hermes 一样去自动写技能

一个真正好用的 Agent，不能每次都从零开始。

它完成一次复杂任务之后，应该能记住这次是怎么跑通的：用了哪些工具，踩了哪些坑，最后哪条路径是稳定的。下一次遇到类似任务，它不应该再靠人反复提醒。

这就是 Hermes Agent 很有意思的地方：它不只是执行任务，还会尝试把执行经验沉淀成 Skill。

这件事很重要。

因为 Skill 本质上不是一段提示词，而是 Agent 的“工作经验”。当一个流程被写成 Skill，Agent 下次再遇到类似任务，就不用重新摸索，而是可以按一套成熟路径执行。

但问题也在这里：会自动写 Skill，是进化；乱写 Skill，就是灾难。

我们最近在思考的，就是怎么让 OpenClaw 也具备这种“自我沉淀”的能力，同时避免把原本稳定的 Skill 生态搞乱。

● ● ●

一、Hermes 的价值：Agent 不只会做事，还会积累经验

传统 AI 助手有一个问题：它每次都很聪明，但每次都像第一次干活。

你让它做一个复杂任务，它能查资料、读文件、跑脚本、生成图片、调用 TTS、合成视频、发到飞书。任务完成之后，聊天记录里确实有完整过程，但下一次呢？

如果没有沉淀机制，下一次还是要重新讲一遍规则。

这就是 Skill 的价值。

举个例子：视频号内容生产流程里，可能包含这些步骤：

读取公众号文章 → 改写口播文案 → 生成封面和配图 → 分段 TTS → ffmpeg 合成 MP4 → 抽帧 QA → 发飞书 → 生成标题、副标题、钩子和标签

如果每次都靠人提醒：“记得生成标签”“记得不要重复音频”“记得发飞书”“记得不要把频道名写进标签”，那这个 Agent 其实还没有真正长记性。

更理想的状态是：流程跑通一次，Agent 能主动意识到：这不是一次性操作，这是一个可复用工作流，应该沉淀成 Skill。

Hermes 强的地方就在这里。它把 Skill 看成 Agent 经验的一部分，而不是一个需要人手工维护的文档目录。

这个方向非常对。

一个 Agent 如果不能沉淀自己的成功路径，它永远只是“会执行”。只有能把执行经验变成下一次的默认能力，才开始接近“会成长”。

● ● ●

二、但自动写 Skill 也很危险

自动写 Skill 听起来很酷，但真正跑起来，很快会遇到另一个问题：Skill 会膨胀。

最常见的是三类灾难。

1. 测试阶段的废 Skill 被写进系统

很多流程第一次跑通，并不代表它已经稳定。

也许只是某个 provider 当时刚好没报错；也许只是某个 prompt 这次恰好能用；也许只是临时绕过了一个问题，但还没形成真正的标准路径。

如果这时 Agent 立刻把它写成 Skill，下次就会把一个“半成品经验”当成正式能力使用。

这类 Skill 最麻烦，因为它看起来像沉淀，实际上是污染。

2. 新 Skill 抢了旧 Skill 的入口

Skill 的危险不只在内容，还在触发词。

比如系统里已经有一个稳定的 wechat-video-account-publisher，负责把公众号文章变成视频号 MP4。它跑过很多次，知道图片、音频、合成、QA、飞书交付的完整边界。

这时如果一个实验 Skill 也写了类似描述：

Use when creating 视频号 MP4 packages...

那它就可能和原来的稳定 Skill 抢入口。

更糟的是，新 Skill 可能只解决了流程里一个很小的问题，比如“生成标签”，但因为描述写得太宽，反而接管了整个视频号工作流。

这就像一个刚实习一天的人，突然坐上了生产系统的调度位。

3. 最后变成 Skill 灾难

当废 Skill、重复 Skill、实验 Skill、稳定 Skill 混在一起，系统会出现一个很尴尬的状态：

Skill 越来越多；
触发边界越来越模糊；
老流程偶尔被新流程抢走；
Agent 自己也不知道该信谁；
用户发现“以前明明好用的东西，突然变差了”。

这就是 Skill 灾难。

它不是因为 Agent 不够聪明，而是因为没有治理机制。

自动写 Skill 的本质，不是“让模型多写几个 Markdown 文件”。真正难的是：什么时候写，写到哪里，什么时候可以接管入口，什么时候必须停。

● ● ●

三、OpenClaw 要怎么做：不自动乱写，但要主动提醒

OpenClaw 现在的问题不是不能写 Skill。

它能读写文件，能创建 SKILL.md，能跑 openclaw skills info 和 openclaw skills check，也已经有 skill-creator 这类技能创建指导。

真正缺的是一个机制：任务完成后，主动判断这次经验是否值得沉淀。

过去我们的 Skill 大多是人提醒后才写：

这个规则写进 Skill。以后都这样。下次别再犯。

这当然有效，但它依赖人一直盯着。

更好的方式是：复杂任务成功之后，Agent 自己先问一句：

这次流程已经形成稳定闭环，要不要沉淀成 Skill？

这就是我们现在采取的第一步：做一个 skill-reflection-suggester。

它不负责自动写正式 Skill，不负责自动改旧 Skill，也不负责抢入口。

它只做一件事：在复杂任务完成后，主动提醒这件事可能值得沉淀。

触发条件很简单：

工具调用很多 或任务跨多个阶段 或出现失败后修正成功 或用户纠偏形成明确规则 或这个流程未来大概率会重复

比如一次视频号任务里，如果经历了：

读文章 → 写口播 → 生成图片 → 合成音频 → ffmpeg 出 MP4 → QA → 飞书发送 → 补发布信息

这显然不是一次普通对话，而是一套可复用生产链路。

这时 Agent 就应该主动问：要不要沉淀成 Skill？

● ● ●

四、关键平衡：不是禁止进化，而是控制爆炸半径

我们不想走两个极端。

一个极端是完全不让 Agent 自己沉淀，所有 Skill 都靠人提醒。这样太慢，也浪费了 Agent 自己的执行经验。

另一个极端是任务一复杂就自动写 Skill，甚至自动修改稳定 Skill。这样太危险，最终会污染系统。

比较合理的中间路线是：动作可以主动，生效要分级。

低风险：可以大胆沉淀

比如这些规则：

文件命名；
本地目录结构；
元信息格式；
标签生成规则；
QA checklist；
prompt 模板；
本地打包流程。

这些即使错了，也不会立刻影响外部世界。Agent 可以主动建议，甚至在用户确认后快速写入。

中风险：可以建议，但要看影响范围

比如修改一个已有 Skill 的细节。

如果只是给现有流程补一个小规则，比如“MP4 完成后生成 视频号发布信息.txt”，这类修改可以接受。

但前提是：先读原 Skill，只做最小编辑，不重写整套规则。

高风险：必须确认

这些不能自动做：

修改稳定 Skill 的触发词；
替换已有生产流程；
改 daily cron；
涉及外部发送、发布、删除、凭证；
把实验路线变成默认路线。

这类能力一旦乱动，影响的不是一篇文章或一个视频，而是整个 Agent 的行为边界。

● ● ●

五、我们真正要的，是一个会复盘的 Agent

我越来越觉得，Agent 自进化的关键不是“自动写代码”，也不是“自动写 Skill”。

关键是它有没有复盘意识。

一个成熟的 Agent，应该在任务结束时问自己三件事：

这次有没有形成稳定成功路径？ 下次遇到类似任务，能不能少走弯路？ 这件事应该沉淀成规则、Skill，还是只是一条记忆？

这比“做完就结束”重要得多。

我们现在的方案很简单：先让 OpenClaw 学会主动发现 Skill 机会。

第一阶段，不自动写正式 Skill，只主动建议。

第二阶段，可以生成 draft Skill，但不抢入口。

第三阶段，低风险流程多次复用成功后，再考虑自动晋升。

高风险流程永远保留确认机制。

这套方案的目标不是把系统管死，而是让它敢进化，但不乱进化。

● ● ●

六、OpenClaw 的优势：它更适合做“可控进化”

Hermes 的优势在于更激进：它会尝试自己写 Skill，这让它有很强的自我生长感。

OpenClaw 的优势则在于更模块化、更容易治理。

它的 Skill 是文件化的，目录清晰；工具链、记忆、日程、飞书、浏览器、TTS、视频生成都能被拆开验证。一个流程能否沉淀，不需要停留在感觉上，而是可以看见：

产物有没有生成；
文件有没有归档；
QA 有没有通过；
外部发送有没有成功；
Skill 是否能被扫描；
规则有没有影响旧流程。

这让 OpenClaw 很适合走一条“可控自进化”的路线。

不是每次都让 Agent 野蛮生长，而是让它在真实任务中发现经验，在低风险区域快速沉淀，在高风险区域保留人工确认。

一句话：

Hermes 让我们看到 Agent 会自己写 Skill 的价值；OpenClaw 要解决的是，怎么让这种能力不变成 Skill 灾难。

● ● ●

结语：真正成熟的 Agent，会把经验变成下一次的能力

我现在判断一个 Agent 是否真正有潜力，不只看它一次任务能不能做成。

一次做成，是执行力。

做完之后，能不能把成功路径沉淀下来，才是进化能力。

但这件事不能鲁莽。

Skill 不是越多越好。一个写坏的 Skill，可能比没有 Skill 更危险。因为没有 Skill，Agent 只是慢；坏 Skill 会让 Agent 自信地走错路。

所以最好的路线不是“不写”，也不是“乱写”。

而是：

复杂任务成功后，主动发现沉淀机会； 低风险规则快速写入； 稳定 Skill 保持主权； 高风险入口变更必须确认。

未来真正强的 Agent，一定不是每次都从零开始的 Agent。

它应该像一个越来越老练的同事：这次踩过的坑，下次不会再踩；这次跑通的流程，下次能直接复用；这次被纠正的规则，下次会主动提醒。

这才是 Skill 系统真正的价值。

Agent 最重要的能力，不是一次做对，而是做完一次之后，下一次知道自己该怎么做。

如果你有更好的见解，欢迎到评论区留言讨论。