乐于分享
好东西不私藏

让 OpenClaw Agent 不再失忆:一个自进化 Skill 的完整方案

让 OpenClaw Agent 不再失忆:一个自进化 Skill 的完整方案

如果一个 Agent 每天都犯同样的错,问题通常不是模型不够强,而是它没有一套真正可运行的“记忆操作系统”。

过去一年,Agent 的能力在快速上升:会写代码、会调工具、会跑任务、会总结。但真正用久了之后,一个很现实的问题会暴露出来:

它能完成一次任务,不代表它会因为这次任务而变得更好。

很多所谓“记忆系统”,本质上只是把几条笔记写进 Markdown。它们有用,但不够稳定;能救急,但很难支撑长期演化。

这就是 Self-Improving Compound 真正有价值的地方。

它不是又一个“记一条 learning”的小工具,而是一套面向长期 Agent 工作流的自进化记忆系统:

实时捕获错误、纠正、工具坑、workflow 经验;
用 SQLite 存储结构化执行学习;
用 cron 做后台审计和生命周期维护;
用每日事实记忆保留上下文连续性;
用 3+7 控制面让 Agent 的状态系统持续收敛。

项目地址:

ClawHub:https://clawhub.ai/lingmafuture/self-improving-compound
GitHub:https://github.com/LingmaFuture/self-improving-compound

01 Agent 最大的问题,不是不会做,而是不会沉淀

一次真实的 Agent 工作流通常长这样:

1用户提出任务;
2Agent 调工具、读文件、搜索、改代码;
3中间踩坑,修复;
4最后输出结果;
5下一次遇到类似问题,又从头踩一遍。

这就是“无记忆执行”的典型症状。

不是因为 Agent 没有上下文窗口,而是因为上下文窗口不是记忆系统。上下文窗口是临时工作台;真正的记忆系统需要回答几个问题:

哪些经验值得保存?
保存到哪里?
如何避免重复和污染?
什么时候晋升成稳定规则?
如何在未来任务前被重新召回?
如何持续维护,而不是越积越乱?

Agent 记忆的核心不是“多存”,而是“正确分层、持续审计、按需召回”。

这正是 Self-Improving Compound 想解决的问题。


02 市面上的自进化 Skill:轻量好用,但大多停在日志层

ClawHub 上已经有不少 self-improving 类 skill。比如下载量很高的 pskoett/self-improving-agent,页面显示它已经有很高的关注和使用指标:v3.0.21、31 个版本、数千级安装量,并且页面指标里出现了 426k 量级的数据。

这个方向非常有价值。它把“错误、纠正、feature request、best practice”这些东西变成显式日志,让 Agent 不再完全依赖临时上下文。

它的典型路径是:

命令失败 / 用户纠正 / API 出错        ↓写入 .learnings/LEARNINGS.md / ERRORS.md / FEATURE_REQUESTS.md        ↓必要时 promote 到 AGENTS.md / TOOLS.md / MEMORY.md

这类设计的优势很明显:

安装和理解成本低;
Markdown 可读、可手动编辑;
对单项目、单 Agent、轻量工作流非常友好;
非常适合作为 self-improvement 的入门形态。

但长期使用这类方案后,一个典型问题会出现:Markdown 日志会越来越像杂物间。

当任务量上来以后,会出现几个瓶颈:

重复条目难以去重;
经验没有生命周期,旧信息和新信息混在一起;
很难做稳定搜索和统计;
缺少后台审计,漏记就漏了;
事实记忆、执行教训、人格规则、工具事实容易混层;
安装之后如果没有 cron / hook / capture gate,实际效果会打折。

更准确的判断是:

轻量 Markdown learning 是很好的起点,但长期 Agent OS 需要更强的状态管理。


03 Self-Improving Compound 的核心:从“日志”升级成“记忆操作系统”

Self-Improving Compound 的目标不是替代所有记忆方案,而是把几个成熟思路组合起来,形成一个更完整的闭环。

它吸收了几类架构的优点:

来源/思路
保留的价值
在 Self-Improving Compound 中的落点
actual-self-improvement
结构化 logging、search-before-log、evals
scripts/learnings.py

 CLI
OpenHuman memory-tree
SQLite 存储、chunk、entity index、score
learning/memory_tree/chunks.db
self-improving-agent 类 skill
correction/error/feature 捕获范式
capture gate + log commands
HOT/WARM/COLD 记忆生命周期
记忆不是永久高优先级
lifecycle maintain
OpenClaw cron
背景审计和定时维护
Light Check / Heavy Audit / Daily Digest / Steward
Agent root markdown 控制面
稳定人格、工具、用户、系统规则
3+7 co-evolution

一句话概括:

Self-Improving Compound 把“写 learning”升级成了“捕获 → 去重 → 存储 → 审计 → 生命周期 → 晋升 → 维护”的完整闭环。


04 什么是 3+7?

我们把长期 Agent 状态拆成 3 个状态目录 + 7 个根 Markdown 控制面文件

3 个状态目录

memory/    每日事实连续性learning/  SQLite 执行学习库skills/    可复用能力和流程

它们的职责不同:

memory/ 记录事实:今天做了什么、改了哪些文件、有哪些决策、链接、风险和 follow-up;
learning/ 记录教训:工具坑、用户纠正、错误模式、可复用 workflow;
skills/ 记录能力:当某个经验反复出现,就沉淀成可复用 Skill。

7 个根 Markdown 控制面文件

AGENTS.md     workspace contract / 行为边界HEARTBEAT.md  轻量 check-in 表面IDENTITY.md   兼容入口或身份指针MEMORY.md     pinned long-term contextSOUL.md       Agent 身份和 personaTOOLS.md      本地工具与环境事实USER.md       用户画像和协作偏好

这 7 个文件不是“越多越好”,而是 Agent 的控制面。它们决定 Agent 每次启动时如何理解自己、用户、工具、边界和长期状态。

真正重要的是:不要混层。

今日发生的事实,不要塞进 SOUL.md
工具 API 坑,不要写成用户偏好;
临时任务状态,不要污染长期 persona;
反复出现的 workflow,应该从 learning/ 晋升到 skills/ 或 AGENTS.md

05 和主流记忆架构相比,它解决了什么?

常见 Agent 记忆方案大致可以分成几类。

方案
优点
短板
适合场景
纯上下文窗口
零配置、实时
一旦窗口丢失就失忆
短任务
单文件 MEMORY.md
简单、热启动快
容易膨胀、混层
少量长期偏好
Markdown learning 日志
可读、易改、入门好
去重/检索/生命周期弱
个人轻量 workflow
Vector/RAG memory
召回能力强
容易语义漂移,需要索引治理
大规模知识检索
多层 episodic/semantic memory
理论完整
工程复杂、落地成本高
研究型 Agent 系统
Self-Improving Compound
分层清楚、SQLite 可查询、cron 可审计、可晋升
安装配置比轻量 skill 更复杂
长期运行的 OpenClaw / coding agent / personal AI OS

这也是这个项目在安装文档里有一句很重要的话:

clawhub install 只是第一步。

一个真正可用的自进化系统,至少还需要:

初始化 learning/
配置 OPENCLAW_WORKSPACE 等环境变量;
把 capture gate 写进 AGENTS.md
安装 cron jobs;
配置 Telegram / Feishu 等 delivery;
可选启用 hooks;
可选配置 daily memory collector;
最后跑 smoke test。

听起来更重,但这恰恰是它和“装了但没生效”的区别。


06 四个后台任务:让记忆系统自己维护自己

Self-Improving Compound 推荐的 cron pipeline 包括四类任务:

Job
默认时间
作用
Self-Improving Light Check
白天每 2 小时
抓明显漏记的纠正、错误、blocker
Learning Audit Heavy
09:00 / 22:00
审计系统失败、cron 失败、维护生命周期
Daily Memory Digest
23:50
写 memory/YYYY-MM-DD.md 每日事实记忆
Daily Workspace Steward
00:20
检查 learning/skills/ 和 7 个 root Markdown

这里有个关键设计:cron 默认隔离。

隔离的好处是不会污染主对话上下文,也不会把后台审计塞进用户当前聊天。但代价是:如果 cron 需要理解主会话,它必须显式拉取 session history,或者使用专门的 collector。

这是很多 Agent 自动化容易踩坑的地方:后台任务不是“天然知道一切”。


07 适合谁?

如果你只是偶尔用 Agent 写点代码,轻量的 .learnings/ Markdown 方案已经足够。

但如果你符合下面任意一条,Self-Improving Compound 会更适合:

你长期运行 OpenClaw / Claude Code / Codex 类 coding agent;
你经常让 Agent 处理多步任务、自动化、发布、调试;
你希望 Agent 记住用户偏好、工具坑、项目约定;
你已经有 AGENTS.md / MEMORY.md / skills/ 之类控制面;
你在构建 personal AI OS 或公司内部 Agent OS;
你开始关心 memory hygiene,而不是“先都记下来再说”。

它不是零配置玩具。它更像一个小型基础设施组件。安装成本更高,但一旦跑起来,收益来自长期复利。


08 它真正解决了哪些痛点?

因为这些问题几乎是长期 Agent 工作流的必经坑:

Agent 一次次忘记发布前要做敏感信息扫描;
cron 任务因为 isolated session 拿不到上下文而假装成功;
MEMORY.md 越写越乱,事实、规则、偏好混成一团;
skill 发布目录里混进本地 .reference/ 大文件;
安装文档只写 clawhub install,用户装完却不知道下一步怎么激活。

这些都不是“模型智商”问题,而是状态系统问题。

Self-Improving Compound 的价值,就是把这些坑变成可沉淀、可审计、可晋升的系统机制。

它不是让 Agent 变得神奇,而是让 Agent 少犯同样的错。


09 快速开始

安装:

class="language-bash">clawhub install self-improving-compound

但请记住,这只是第一步。

完整激活需要继续配置:

class="language-bash">export OPENCLAW_WORKSPACE="/path/to/workspace"export SELF_IMPROVING_SKILL_DIR="$OPENCLAW_WORKSPACE/skills/self-improving-compound"export SELF_IMPROVING_LEARNINGS_CLI="$SELF_IMPROVING_SKILL_DIR/scripts/learnings.py"python3 "$SELF_IMPROVING_LEARNINGS_CLI" --root "$OPENCLAW_WORKSPACE" initpython3 "$SELF_IMPROVING_LEARNINGS_CLI" --root "$OPENCLAW_WORKSPACE" status

然后:

1把 capture gate 写进 AGENTS.md
2用 scripts/setup-cron.json 安装 cron;
3配置 delivery;
4可选启用 hooks;
5跑 smoke test。

我们在 SKILL.md 里已经把安装成熟度写成 1/5 到 5/5,避免“装了但没生效”。


10 结语:Agent OS 的记忆层,应该像基础设施一样被维护

下一代 Agent 不会只靠更长上下文窗口取胜。

真正可持续的 Agent,一定需要自己的状态系统:

哪些事实需要保留;
哪些错误需要记住;
哪些经验需要晋升;
哪些旧记忆应该降级;
哪些规则应该写进控制面;
哪些能力应该沉淀成 Skill。

Self-Improving Compound 是对这件事的一次工程化回答。

如果你也在构建长期运行的 Agent 工作流,欢迎试试:

ClawHub:https://clawhub.ai/lingmafuture/self-improving-compound
GitHub:https://github.com/LingmaFuture/self-improving-compound

它不是最轻的方案,但它指向一个更值得押注的方向:

让 Agent 不只是完成任务,而是持续变得更可靠。


参考与对比

pskoett/self-improving-agent ClawHub 页面:https://clawhub.ai/pskoett/self-improving-agent
ivangdavila/self-improving ClawHub 页面:https://clawhub.ai/ivangdavila/self-improving
Self-Improving Compound:https://clawhub.ai/lingmafuture/self-improving-compound
GitHub:https://github.com/LingmaFuture/self-improving-compound