当 OpenClaw 开始主动“少记一点”:长期记忆真正进入了工程化阶段-夜雨聆风

当 OpenClaw 开始主动“少记一点”:长期记忆真正进入了工程化阶段

很多人理解 Agent 的长期记忆时，第一反应是：记得越多越好。

聊天记录要存下来，工具结果要存下来，模型推理过程最好也能存下来。插件能力也是一样，最好一次性把所有工具、所有接口、所有入口都暴露给模型。这样看起来系统更聪明，能力更强，也更像一个“全能助手”。

但真正把 Agent 用到日常工作流里，就会发现这条路并不稳。

记得太多，会把噪音、临时状态、模型产物和敏感上下文一起写进长期系统。暴露太多，会让模型看到过宽的工具面、过多的调用入口和过大的提示预算。短期看是能力丰富，长期看是边界模糊。

OpenClaw 主干最近合入了一个很小但值得注意的更新：`session-memory` 在保存模型产物前做清洗，同时 SDK plugin surface budgets 也有调整。

这不是一个炫技功能。

它更像一个方向信号：OpenClaw 正在从“把记忆和插件能力接起来”，进入“主动裁剪记忆和能力暴露面”的阶段。

▲ 这次变化的关键词：保存前清洗、暴露面预算、边界收紧。

01 一、长期记忆最大的问题，不是记不住，而是记错东西

Agent 系统早期最容易追求“保存能力”。

一次任务结束后，把会话摘要写进 memory；一次工具调用结束后，把结果挂到 session；一次模型输出后，把产物留给下次调用。这样做当然有用，否则每次重启都像失忆。

但长期记忆的真正风险，往往不是“不够多”，而是“不够干净”。

比如：

• 临时调试信息被当成长期事实；

• 模型中间产物被当成用户偏好；

• 外部网页里的噪音被写进个人记忆；

• 工具返回里的敏感字段没有在落盘前处理；

• 一次错误判断被反复召回，变成系统的“经验”。

这类问题一旦进入长期记忆，比单次回答错误更麻烦。

单次回答错了，用户可以纠正；长期记忆写错了，后面每一次召回都会带着旧错误。它会让 Agent 看起来越来越“了解你”，但其实是在用一套污染过的上下文理解你。

所以 `session-memory` 保存前清洗这件事，表面上是安全处理，深层是记忆工程的质量门槛。

一个成熟的 Agent 记忆系统，不能只问“能不能写进去”，还要问：

• 这是不是应该进入长期记忆？

• 它是用户明确事实，还是模型推断？

• 它有没有外部输入污染？

• 它有没有敏感内容？

• 下次召回它，会帮助判断，还是制造偏差？

长期记忆不是仓库，更像一个有门禁的档案室。

▲ 长期记忆不是仓库，而是有门禁的档案室。

02 二、插件能力也不是越宽越好

另一个变化是 SDK plugin surface budgets。

这类更新听起来很工程化：surface、budget、export、baseline，像是只有维护者才关心的测试项。

但它对 Agent 系统很关键。

所谓 plugin surface，可以理解为插件向外暴露的能力边界。哪些函数能被调用，哪些类型成为公共 API，哪些入口会进入模型可见的工具面，都会影响系统的复杂度。

如果插件暴露面不断膨胀，会带来几个问题：

第一，模型更难选择。

工具越多，不代表越会用。很多时候，模型会在多个相似入口之间摇摆，或者误用一个本不该公开的底层能力。

第二，安全边界更难解释。

一个插件如果把太多内部能力暴露成公共接口，就很难说清楚“模型到底能做什么、不能做什么”。这对涉及文件、浏览器、账号、消息、执行节点的系统尤其危险。

第三，维护成本会上升。

一旦某个能力变成公共 surface，就意味着它要承担兼容性、文档、测试和安全责任。随手暴露的接口，最后都会变成长期债务。

所以 surface budget 的意义，不是限制能力，而是阻止能力无序扩张。

对开发者来说，这意味着 OpenClaw 正在更认真地区分：

• 哪些能力是公共 SDK；

• 哪些能力只是内部实现；

• 哪些工具应该被模型看到；

• 哪些工具应该藏在更窄的运行时边界里；

• 哪些暴露会增加上下文泄漏和误调用风险。

插件少暴露一点，系统反而更可靠一点。

▲ 插件暴露面越宽，越需要预算、审计和公共 API 边界。

03 三、这次更新真正影响的是判断方式

如果你只是普通用户，这次更新可能不会带来一个明显按钮。

没有新的炫酷界面，也没有一个“点击开启长期记忆 2.0”的开关。

但它会改变后续排查问题的判断方式。

以后如果你发现 OpenClaw 或 Codex 的某些长期记忆“没以前那么多”，不一定是坏事。可能是保存前清洗开始生效，系统主动丢掉了一些不该长期保存的模型产物。

以后如果你发现某些插件能力报告变短、工具面变窄，也不一定是能力退化。可能是 SDK surface budget 在限制公共暴露面，把内部实现重新收回边界内。

过去我们常把 Agent 系统的问题理解成“能力不够”。

现在更应该多问一句：是不是边界开始变严了？

这对日常使用很重要。

因为 Agent 的成熟，不是永远加工具、加记忆、加上下文，而是在该记的时候记、该忘的时候忘、该暴露的时候暴露、该收起来的时候收起来。

04 四、为什么这对 OpenClaw 很关键

OpenClaw 这类系统，不是单纯聊天产品。

它会接触本地文件、微信消息、浏览器、插件、技能、项目仓库、长期记忆和多 Agent 协作。它越贴近日常工作，越不能只靠“模型聪明”来维持秩序。

真正的挑战是：

• 用户给了它很多权限；

• 它能跨很多工具做事；

• 它需要长期理解用户；

• 它还要避免把隐私、噪音、错误推断和临时状态写成事实。

这时候，记忆和插件都必须有治理。

记忆治理解决的是：什么值得留下，什么必须清洗，什么应该过期，什么只能作为当前会话上下文。

插件治理解决的是：什么能力能被调用，什么能力只属于内部，什么能力需要人工确认，什么能力必须有审计和预算限制。

这次 `session-memory` 和 plugin surface budget 的更新，正好落在这两个位置。

它说明 OpenClaw 的工程重心，不只是把 Agent 做得“更会干活”，也在把 Agent 做得“更知道边界”。

05 五、一个成熟 Agent 系统，最终比拼的是边界感

未来大家会越来越少被“模型能不能回答”打动。

因为回答能力会变成基础能力。

真正拉开差距的，是系统能不能在真实环境里稳定运行：

▲ 成熟 Agent 系统，最终比拼的是边界感。

• 记忆是否可靠；

• 权限是否可控；

• 工具是否少而准；

• 输出是否可追溯；

• 错误是否能纠偏；

• 上下文是否不会乱泄漏；

• 用户是否知道系统为什么记住、为什么忘掉、为什么看不到某个工具。

这也是这次更新值得写一篇文章的原因。

它不是一个“大功能发布”，而是一个成熟系统开始收紧边界的信号。

很多 Agent 产品还停留在展示能力：我能接多少插件，我能记多少历史，我能调用多少工具。

但真正进入长期使用后，问题会反过来：

你凭什么记？

你凭什么暴露？

你凭什么让模型看到这些？

你凭什么保证这些内容不会在未来变成错误召回、权限误用或上下文泄漏？

OpenClaw 这次的小更新，回答的正是这个方向。

不是更多，而是更干净。

不是更宽，而是更准。

长期记忆和插件生态走到这一步，才算真正进入工程化阶段。