让 OpenClaw Agent 不再失忆:一个自进化 Skill 的完整方案-夜雨聆风

让 OpenClaw Agent 不再失忆:一个自进化 Skill 的完整方案

如果一个 Agent 每天都犯同样的错，问题通常不是模型不够强，而是它没有一套真正可运行的“记忆操作系统”。

过去一年，Agent 的能力在快速上升：会写代码、会调工具、会跑任务、会总结。但真正用久了之后，一个很现实的问题会暴露出来：

它能完成一次任务，不代表它会因为这次任务而变得更好。

很多所谓“记忆系统”，本质上只是把几条笔记写进 Markdown。它们有用，但不够稳定；能救急，但很难支撑长期演化。

这就是 Self-Improving Compound 真正有价值的地方。

它不是又一个“记一条 learning”的小工具，而是一套面向长期 Agent 工作流的自进化记忆系统：

•实时捕获错误、纠正、工具坑、workflow 经验；

•用 SQLite 存储结构化执行学习；

•用 cron 做后台审计和生命周期维护；

•用每日事实记忆保留上下文连续性；

•用 3+7 控制面让 Agent 的状态系统持续收敛。

项目地址：

•ClawHub：https://clawhub.ai/lingmafuture/self-improving-compound

•GitHub：https://github.com/LingmaFuture/self-improving-compound

01 Agent 最大的问题，不是不会做，而是不会沉淀

一次真实的 Agent 工作流通常长这样：

1用户提出任务；

2Agent 调工具、读文件、搜索、改代码；

3中间踩坑，修复；

4最后输出结果；

5下一次遇到类似问题，又从头踩一遍。

这就是“无记忆执行”的典型症状。

不是因为 Agent 没有上下文窗口，而是因为上下文窗口不是记忆系统。上下文窗口是临时工作台；真正的记忆系统需要回答几个问题：

•哪些经验值得保存？

•保存到哪里？

•如何避免重复和污染？

•什么时候晋升成稳定规则？

•如何在未来任务前被重新召回？

•如何持续维护，而不是越积越乱？

Agent 记忆的核心不是“多存”，而是“正确分层、持续审计、按需召回”。

这正是 Self-Improving Compound 想解决的问题。

02 市面上的自进化 Skill：轻量好用，但大多停在日志层

ClawHub 上已经有不少 self-improving 类 skill。比如下载量很高的 pskoett/self-improving-agent，页面显示它已经有很高的关注和使用指标：v3.0.21、31 个版本、数千级安装量，并且页面指标里出现了 426k 量级的数据。

这个方向非常有价值。它把“错误、纠正、feature request、best practice”这些东西变成显式日志，让 Agent 不再完全依赖临时上下文。

它的典型路径是：

命令失败 / 用户纠正 / API 出错        ↓写入 .learnings/LEARNINGS.md / ERRORS.md / FEATURE_REQUESTS.md        ↓必要时 promote 到 AGENTS.md / TOOLS.md / MEMORY.md

这类设计的优势很明显：

•安装和理解成本低；

•Markdown 可读、可手动编辑；

•对单项目、单 Agent、轻量工作流非常友好；

•非常适合作为 self-improvement 的入门形态。

但长期使用这类方案后，一个典型问题会出现：Markdown 日志会越来越像杂物间。

当任务量上来以后，会出现几个瓶颈：

•重复条目难以去重；

•经验没有生命周期，旧信息和新信息混在一起；

•很难做稳定搜索和统计；

•缺少后台审计，漏记就漏了；

•事实记忆、执行教训、人格规则、工具事实容易混层；

•安装之后如果没有 cron / hook / capture gate，实际效果会打折。

更准确的判断是：

轻量 Markdown learning 是很好的起点，但长期 Agent OS 需要更强的状态管理。

03 Self-Improving Compound 的核心：从“日志”升级成“记忆操作系统”

Self-Improving Compound 的目标不是替代所有记忆方案，而是把几个成熟思路组合起来，形成一个更完整的闭环。

它吸收了几类架构的优点：

来源/思路	保留的价值	在 Self-Improving Compound 中的落点
actual-self-improvement	结构化 logging、search-before-log、evals	`scripts/learnings.py` CLI
OpenHuman memory-tree	SQLite 存储、chunk、entity index、score	`learning/memory_tree/chunks.db`
self-improving-agent 类 skill	correction/error/feature 捕获范式	capture gate + log commands
HOT/WARM/COLD 记忆生命周期	记忆不是永久高优先级	lifecycle maintain
OpenClaw cron	背景审计和定时维护	Light Check / Heavy Audit / Daily Digest / Steward
Agent root markdown 控制面	稳定人格、工具、用户、系统规则	3+7 co-evolution

一句话概括：

Self-Improving Compound 把“写 learning”升级成了“捕获 → 去重 → 存储 → 审计 → 生命周期 → 晋升 → 维护”的完整闭环。

04 什么是 3+7？

我们把长期 Agent 状态拆成 3 个状态目录 + 7 个根 Markdown 控制面文件。

3 个状态目录

memory/    每日事实连续性learning/  SQLite 执行学习库skills/    可复用能力和流程

它们的职责不同：

•memory/ 记录事实：今天做了什么、改了哪些文件、有哪些决策、链接、风险和 follow-up；

•learning/ 记录教训：工具坑、用户纠正、错误模式、可复用 workflow；

•skills/ 记录能力：当某个经验反复出现，就沉淀成可复用 Skill。

7 个根 Markdown 控制面文件

AGENTS.md     workspace contract / 行为边界HEARTBEAT.md  轻量 check-in 表面IDENTITY.md   兼容入口或身份指针MEMORY.md     pinned long-term contextSOUL.md       Agent 身份和 personaTOOLS.md      本地工具与环境事实USER.md       用户画像和协作偏好

这 7 个文件不是“越多越好”，而是 Agent 的控制面。它们决定 Agent 每次启动时如何理解自己、用户、工具、边界和长期状态。

真正重要的是：不要混层。

•今日发生的事实，不要塞进 SOUL.md；

•工具 API 坑，不要写成用户偏好；

•临时任务状态，不要污染长期 persona；

•反复出现的 workflow，应该从 learning/ 晋升到 skills/ 或 AGENTS.md。

05 和主流记忆架构相比，它解决了什么？

常见 Agent 记忆方案大致可以分成几类。

方案	优点	短板	适合场景
纯上下文窗口	零配置、实时	一旦窗口丢失就失忆	短任务
单文件 MEMORY.md	简单、热启动快	容易膨胀、混层	少量长期偏好
Markdown learning 日志	可读、易改、入门好	去重/检索/生命周期弱	个人轻量 workflow
Vector/RAG memory	召回能力强	容易语义漂移，需要索引治理	大规模知识检索
多层 episodic/semantic memory	理论完整	工程复杂、落地成本高	研究型 Agent 系统
Self-Improving Compound	分层清楚、SQLite 可查询、cron 可审计、可晋升	安装配置比轻量 skill 更复杂	长期运行的 OpenClaw / coding agent / personal AI OS

这也是这个项目在安装文档里有一句很重要的话：

clawhub install 只是第一步。

一个真正可用的自进化系统，至少还需要：

•初始化 learning/；

•配置 OPENCLAW_WORKSPACE 等环境变量；

•把 capture gate 写进 AGENTS.md；

•安装 cron jobs；

•配置 Telegram / Feishu 等 delivery；

•可选启用 hooks；

•可选配置 daily memory collector；

•最后跑 smoke test。

听起来更重，但这恰恰是它和“装了但没生效”的区别。

06 四个后台任务：让记忆系统自己维护自己

Self-Improving Compound 推荐的 cron pipeline 包括四类任务：

Job	默认时间	作用
Self-Improving Light Check	白天每 2 小时	抓明显漏记的纠正、错误、blocker
Learning Audit Heavy	09:00 / 22:00	审计系统失败、cron 失败、维护生命周期
Daily Memory Digest	23:50	写 `memory/YYYY-MM-DD.md` 每日事实记忆
Daily Workspace Steward	00:20	检查 `learning/`、`skills/` 和 7 个 root Markdown

这里有个关键设计：cron 默认隔离。

隔离的好处是不会污染主对话上下文，也不会把后台审计塞进用户当前聊天。但代价是：如果 cron 需要理解主会话，它必须显式拉取 session history，或者使用专门的 collector。

这是很多 Agent 自动化容易踩坑的地方：后台任务不是“天然知道一切”。

07 适合谁？

如果你只是偶尔用 Agent 写点代码，轻量的 .learnings/ Markdown 方案已经足够。

但如果你符合下面任意一条，Self-Improving Compound 会更适合：

•你长期运行 OpenClaw / Claude Code / Codex 类 coding agent；

•你经常让 Agent 处理多步任务、自动化、发布、调试；

•你希望 Agent 记住用户偏好、工具坑、项目约定；

•你已经有 AGENTS.md / MEMORY.md / skills/ 之类控制面；

•你在构建 personal AI OS 或公司内部 Agent OS；

•你开始关心 memory hygiene，而不是“先都记下来再说”。

它不是零配置玩具。它更像一个小型基础设施组件。安装成本更高，但一旦跑起来，收益来自长期复利。

08 它真正解决了哪些痛点？

因为这些问题几乎是长期 Agent 工作流的必经坑：

•Agent 一次次忘记发布前要做敏感信息扫描；

•cron 任务因为 isolated session 拿不到上下文而假装成功；

•MEMORY.md 越写越乱，事实、规则、偏好混成一团；

•skill 发布目录里混进本地 .reference/ 大文件；

•安装文档只写 clawhub install，用户装完却不知道下一步怎么激活。

这些都不是“模型智商”问题，而是状态系统问题。

Self-Improving Compound 的价值，就是把这些坑变成可沉淀、可审计、可晋升的系统机制。

它不是让 Agent 变得神奇，而是让 Agent 少犯同样的错。

09 快速开始

安装：

class="language-bash">clawhub install self-improving-compound

但请记住，这只是第一步。

完整激活需要继续配置：

class="language-bash">export OPENCLAW_WORKSPACE="/path/to/workspace"export SELF_IMPROVING_SKILL_DIR="$OPENCLAW_WORKSPACE/skills/self-improving-compound"export SELF_IMPROVING_LEARNINGS_CLI="$SELF_IMPROVING_SKILL_DIR/scripts/learnings.py"python3 "$SELF_IMPROVING_LEARNINGS_CLI" --root "$OPENCLAW_WORKSPACE" initpython3 "$SELF_IMPROVING_LEARNINGS_CLI" --root "$OPENCLAW_WORKSPACE" status

然后：

1把 capture gate 写进 AGENTS.md；

2用 scripts/setup-cron.json 安装 cron；

3配置 delivery；

4可选启用 hooks；

5跑 smoke test。

我们在 SKILL.md 里已经把安装成熟度写成 1/5 到 5/5，避免“装了但没生效”。

10 结语：Agent OS 的记忆层，应该像基础设施一样被维护

下一代 Agent 不会只靠更长上下文窗口取胜。

真正可持续的 Agent，一定需要自己的状态系统：

•哪些事实需要保留；

•哪些错误需要记住；

•哪些经验需要晋升；

•哪些旧记忆应该降级；

•哪些规则应该写进控制面；

•哪些能力应该沉淀成 Skill。

Self-Improving Compound 是对这件事的一次工程化回答。

如果你也在构建长期运行的 Agent 工作流，欢迎试试：

•ClawHub：https://clawhub.ai/lingmafuture/self-improving-compound

•GitHub：https://github.com/LingmaFuture/self-improving-compound

它不是最轻的方案，但它指向一个更值得押注的方向：

让 Agent 不只是完成任务，而是持续变得更可靠。

参考与对比

•pskoett/self-improving-agent ClawHub 页面：https://clawhub.ai/pskoett/self-improving-agent

•ivangdavila/self-improving ClawHub 页面：https://clawhub.ai/ivangdavila/self-improving

•Self-Improving Compound：https://clawhub.ai/lingmafuture/self-improving-compound

•GitHub：https://github.com/LingmaFuture/self-improving-compound