AI记不住,才是最大的问题
我用OpenClawAI agent已经有一段时间了。一个最让我头疼的问题不是"AI回答质量差",而是:AI每次对话都是一张白纸。
昨天我跟它说过"这个问题不要用A方法",今天它照常用。上一周我教会它的一个工作流,下周一它完全忘了。听起来很蠢对吧?但这就是大多数AI agent的现状——没有记忆,只有上下文窗口。
我来分享一下我的经验。核心工具是 self-improving skill(自改进技能)+ 每日复盘机制。用了一个月,效果超出预期。今天分享一下我的做法。
核心工具:self-improving skill
这个 skill 本质上是一个结构化的经验记录系统。每当 agent 遇到问题、做出决策、或发现什么值得记住的东西,它会调用 self_improvement_log 工具,把内容写入 LEARNINGS.md 或 ERRORS.md。
记录的格式是固定的:
## [LRN-20260325-001] correction**Logged**: 2026-03-25T14:09:53+08:00**Priority**: high**Status**: pending**Area**: config### Summary一句话描述学到了什么### Details具体发生了什么、问题出在哪### Suggested Action以后遇到类似情况该怎么做### Metadata- Pattern-Key: cron.telegram-delivery- Recurrence-Count: 1- See Also: LRN-20260325-005固定格式不是形式主义——它让后来者(人或其他 agent)能快速检索、对比、和追踪一个问题的完整生命周期。
核心思路:双层记忆架构
我的方案是:短期记忆 + 长期记忆 + self-improving 复盘机制。
短期记忆层是每天的对话记录文件(memory/YYYY-MM-DD.md)。每天结束,agent自动把当天的操作、遇到的问题、未完成的事项写进去。第二天启动时先读这个文件,接上昨天的工作。
长期记忆层是 memory-lancedb-pro(基于 LanceDB 的向量数据库)。重要的决策、用户偏好、反复使用的流程,存进去,下次语义搜索找回来。
self-improving 层是每天23:00的定时复盘。agent调用 self_improvement_log,把今天的 learnings 写入文件,同时检查之前的相关 Pattern-Key,看有没有重复踩坑。
三层各司其职:每日文件管上下文,向量数据库管知识,self-improving 管成长。
每日复盘:23:00的定时任务
我给每个agent都设置了每天23:00(北京时间)自动执行复盘。通过 OpenClaw 的 cron 任务实现,每个agent独立运行自己的复盘流程。
复盘流程是这样的:
1. 读取当天的 memory 文件 2. 调用 self_improvement_log记录今日学习3. 检查是否有 Pattern-Key 与之前重复(重复踩坑的信号) 4. 把有价值的经验同步到 memory-lancedb-pro(长期记忆) 5. 通过 Telegram 发送复盘摘要
self-improving 真实案例
下面从我的 LEARNINGS.md 里摘几个例子,来看 self-improving 到底怎么帮助 agent 改进。
案例一:同一个错误,第二次就知道怎么修了
第一次(LRN-20260325-001)
我让星辉创建 cron 任务时,它用了这样的 delivery 配置:
--to user:5038825565Telegram 返回了报错:
Error: Telegram recipient must be a numeric chat ID星辉当时不知道为什么,折腾了一阵。这是它第一次遇到这个错误。
它把这个错误记进了 LEARNINGS.md:
### SummaryTelegram chat ID 在 cron job 的 delivery 配置中不应使用 "user:" 前缀### Details使用了 `--to user:5038825565` 格式,导致报错### Suggested Action使用纯数字 chat ID:`--to 5038825565`第二次(LRN-20260325-005)
一周后,星辉再次创建 cron 任务,又遇到了同样的问题。但这次它去查了 LEARNINGS.md,找到了 LRN-20260325-001,直接应用了 Suggested Action,修复成功。
更重要的是,它在这次记录里加了一行:
### Metadata- Recurrence-Count: 2- See Also: LRN-20260325-001第三次及以后
之后再创建 cron 任务,星辉再也没踩过这个坑。因为它记住了。
这就是 self-improving 的核心价值——错误只犯一次,第二次就知道怎么做对。
案例二:通过复盘发现流程漏洞并修复
LRN-20260328-001 记录了这样一个发现
3月27日的复盘过程中,星辉检查之前的记录时发现:3月27日这一天的 memory 文件是空的——也就是说那一天没有任何对话记录被保存。
问题出在哪?原来的设计是"第一次对话时检查并创建 memory 文件",但如果一整天都没有对话,文件就不会被创建。第二天 agent 想读取 3/27 的记录,发现什么都没有。
星辉把这个作为一个 learning 记录下来:
### Summary记忆文件流程优化 - 3月27日缺少记忆文件### Details原流程只在"第一次对话时"创建记忆文件,导致无对话日出现记忆断层### Suggested Action修改为:每次 Session 启动时都检查并创建当天 memory 文件,无论是否有对话这个发现直接推动了流程优化。现在所有 agent 每次 Session 启动时都会检查当天文件,不依赖有没有对话。
没有 self-improving 复盘,这个漏洞可能永远不会被发现——因为没有人会主动去想"3月27日有没有生成 memory 文件"这种问题。
案例三:Pattern-Key 帮助发现系统性重复
看几个记录的 Pattern-Key:
cron.daily-self-review | ||
cron.telegram-delivery | ||
cron.naming-convention |
cron.daily-self-review 出现了9次,说明这是一个活跃的、持续优化的领域。每一次复盘都在积累经验,而不是每次重头来。
cron.telegram-delivery 出现了2次,第二次就解决了。这说明 Pattern-Key 重复本身就是一个信号——第一次记了,第二次就该解决了。
这个机制让 agent 能区分"一次性错误"和"系统性重复",处理方式完全不同。
案例四:从 correction 到 best_practice 的进化
LRN-20260325-003 是一个 correction 类型的记录:
### Summary文件保存后需要验证### Details用户反馈保存失败的问题### Suggested Action写入文件后使用 read 工具验证内容已正确保存这是一个具体的、针对单个操作的改进建议。
LRN-20260325-004 是同一个领域的延伸,但层次更高:
### Summary创建了每日复盘 cron job 机制### Details为所有 4 个 agents 创建每日复盘 cron jobs...每个 agent 会:1. 读取当天对话记录2. 使用 self-improvement skill 进行复盘3. 更新各自的 learning 文件这是从"单次操作改进"进化到了"系统性机制建立"。
self-improving 的价值不只是记录单次错误,而是通过不断积累,让 agent 的行为模式持续进化。
实战技巧:让 self-improving 真正work
每错必记,但分类要准确。错误用 correction,流程改进用 workflow,配置发现用 config。分类清晰,Pattern-Key 才能真正起作用。
Suggested Action 要具体到能直接执行。不要写"注意配置"这种废话,写 --to 5038825565 这种具体写法。下次 agent 搜到这条记录时,直接照做就行。
每次复盘检查 Pattern-Key 重复。如果发现同一个 Pattern-Key 出现了第二次,就要问自己:上一次解决了吗?为什么又出现了?
Recurrence-Count 是最重要的指标之一。它告诉你哪些问题是真的反复出现,需要系统性解决;哪些只是偶发的一次性错误。
效果如何?
用了两个月,我最直接的感受是:agent 在同一个地方摔倒的次数越来越少了。
Telegram chat ID 格式错误只犯了两次就再也没出现。cron 任务命名不规范的地方被一次性修复。所有新的技能安装都会留下一条记录,包含安装位置、依赖、和未完成的配置步骤。
错误率下来了,重复沟通也少了。以前同一个问题问两三次是常态,现在 agent 能在 LEARNINGS.md 里找到答案,第一次就做对。
这套方案适合你吗?
说实话,如果你只是偶尔用一下AI聊天,这套系统 overkill。但如果你像我一样,同时运行多个agent、有固定的日常工作流、需要AI真正帮你做事情,这套 self-improving + 双层记忆 + 每日复盘的方案值得一试。
核心不是技术有多复杂,而是习惯:每天复盘、每次踩坑都记录、重要决策同步到长期记忆。做到了这些,AI agent就不再是"每次都要重新教"的工具,而是真正有记忆、会在错误中学习的助手。
这套系统运行在我的 Mac Mini(中央控制节点)上,通过 OpenClaw 管理多个agent协同工作。如果你也在用OpenClaw,欢迎交流。
夜雨聆风