乐于分享
好东西不私藏

OpenClaw 这次更新,终于把 Agent 跑崩后自动恢复这个坑填了

OpenClaw 这次更新,终于把 Agent 跑崩后自动恢复这个坑填了

用 OpenClaw 的 Agent 功能时,最怕什么?不是功能不够强,是跑到一半突然崩了。

工具调用中断、Session 绑定失效、媒体发送卡死——这些问题每天都在发生。Agent 跑得好好的,突然因为网络抖动或者某个 provider 超时,整个运行就僵在那。重启?上下文丢了。不重启?卡死了。

OpenClaw v2026.5.31-beta.3 解决了这个问题。

Agent 工具调用的”防弹衣”

这次更新的核心,是一整套运行时恢复机制。

不再是一次中断就全军覆没。当工具调用被中断时,Agent 和 CLI 运行时能检测到问题状态,自动清理脏数据,然后从最近的健康检查点继续执行。具体来说,5 个 PR(#88129、#88136、#88141、#88162、#88182)覆盖了以下场景:

  • 工具调用中断 — 网络波动导致某个工具没返回,不走超时重试,自动恢复
  • Session 绑定过期 — 长时间运行的 Agent 绑定过期后,不用手动重连
  • Compaction 移交 — 数据压缩过程中的状态迁移,不再丢上下文
  • 媒体发送重试 — 图片、语音、视频发送失败时,自动降级重试而不是直接报错

天天跑 Agent 的人会感觉到差别:之前每周要手动清理几次的 session 垃圾,现在基本不用管了。

渠道发送稳了

Agent 再强,消息发不过去等于零。

这次同步改了多个渠道的投递逻辑。Telegram、WhatsApp、iMessage、Slack、Discord、Microsoft Teams、Google Chat,加上 iOS 的实时语音对话,全都做了超时和重试加固。

背后是一系列 Timer 和 Retry 的绑定。Provider 请求、OAuth 设备码续期、媒体下载、本地服务探测、内容生成轮询——之前这些路径可能无限挂起,现在每个都有明确的超时边界。一个请求卡住,不影响整个运行。

iOS 端变化也很大。新增了托管推送中继和实时语音回放,WebSocket 路径加了心跳保护。手机上的 Agent 体验比以前稳定不少。

Skill Workshop:技能创建规范化

这次加了 Skill Workshop,把 Agent 技能的创建流程标准化了。

以前装个技能靠社区分享和自己手写,质量参差不齐,出了问题很难回滚。Workshop 引入了一套审核流程:

  • 提交提案 (Proposal) — 描述技能的功能、依赖、文件结构
  • 审核与批准 — CLI 和 Gateway 端都能操作,支持打回修改
  • 版本化 Frontmatter — 每次修改都记录日期和版本,方便回溯
  • 回滚保护 — 附带了哈希校验和回滚机制

对开发者来说最有价值的是 skill_workshop agent tool:Agent 可以直接通过这个工具提交、审核、隔离技能提案,不需要人工登录管理后台。

Workboard:多 Agent 编排

Workboard 之前一直是个概念,这次有了实际的原语(Primitive)。

新增的内容包括:多 Agent 任务规划、运行追踪、协调工具。如果你在跑多个 Agent 协作完成同一个任务(比如一个 Agent 搜索、一个 Agent 写稿、一个 Agent 发公众号),Workboard 能让你看到每个 Agent 在干什么、跑到哪一步了。

其他值得关注的改动

  • Codex 媒体生成 — 图片、音乐、视频生成改成后台异步,不阻塞对话流程,发完继续聊天
  • Control UI — Dreaming 面板新增 Agent 选择器,可以直接在界面上切 Agent,不用进命令行
  • 通知设置 — Communication Notifications 配置页面搬到设置面板,不再需要改配置文件
  • Tokenjuice 和 Copilot 插件独立 — 拆成单独的 npm 包,通过 ClawHub 发布,不再绑死在主代码里
  • SecretRef — 新增了插件集成清单合约,托管密钥管理更规范了

为什么这次更新重要

版本号是 beta,但改的都是生产环境天天踩的坑。

工具调用中断恢复,解决的是所有 Agent 用户最痛的问题——跑一半崩了。渠道稳定性,解决的是消息发不过去的尴尬。Workshop 和 Workboard,解决的是能力扩展和协作的基础设施。

这些改动看起来都是”基础设施建设”,但恰恰是这些底座层面的改进,才让 Agent 从”可以跑”变成”跑得住”。