乐于分享
好东西不私藏

OpenClaw v2026.5.3-5.5 全面升级

OpenClaw v2026.5.3-5.5 全面升级

v2026.5.3

新功能:文件传输插件

v2026.5.3内置了一个文件传输插件

具体有四个工具:

• file_fetch:从配对节点拉取文件

• dir_list:列目录

• dir_fetch:批量拉取整个目录

• file_write:往配对节点写文件

权限模型是默认拒绝,需要在 plugins.entries.file-transfer.config.nodes 下给每个节点配置路径白名单,符号链接默认不追踪(可以选择开启 followSymlinks),单次传输上限是 16 MB。

本来我以为通过这个插件可以直接给我手机传文件了,结果是多个装了OpenClaw且配对的设备之间传文件。后来直接让OpenClaw写了个Skill,可以直接传文件到Teletram。

两个新命令

/steer <message>:在任务执行中可以给 Agent 调方向,类似Codex的引导。这个命令发出去的消息不会立即生效,而是Agent在准备进行下一步思考或下一次工具调用之前,看到你的这句补充指导。

/side/btw 的别名,用来向当前任务的旁路队列发问题,不打断主流程。

网关启动性能优化

这次把网关启动路径做了大幅懒加载改造:插件和运行时发现、cron、channel config schema、会话元数据、关闭钩子等等,都推迟到真正需要的时候才加载。不再走热启动路径,启动速度有实质提升。

配套改动是:网关和热重载不再自动恢复无效 config——无效配置现在直接失败,openclaw doctor --fix 负责修复。

插件安装体系加固

这个版本对插件安装、卸载、更新、ClawHub 回退、npm 依赖状态报告做了系统性加固,让外置插件和内置插件的行为对齐。

几个具体改动:

• 安装时拒绝只有 TypeScript 源码、没有编译产物的包,在安装阶段就拦住,不等到运行时报错

• ClawHub 429 限速现在会显示重置时间和登录提示

• 修了一个长期问题:npm install 现在从 managed npm root 的 manifest 发起,安装一个 @openclaw/* 插件不会再把已安装的兄弟插件删掉

macOS 启动Agent升级修复

修了 macOS 升级时的两个问题: 1. 包更新后不再立即执行 launchctl kickstart -k,避免把刚启动的网关进程直接终止 2. doctor --fix 会清理悬空的全局插件运行时符号链接,避免旧的捆绑插件依赖路径在升级后继续干扰

WhatsApp 群组 @mention 支持

群消息里现在可以用 @+<digits> 或 @<digits> 格式,Agent 会把它们解析成 WhatsApp 原生 mention,包括 LID 群。同时要求 mention token 必须在词边界结束,避免电话号码前缀误触发。这回再在WhatsApp群中多个Agent可以互相@群聊了。

Heartbeat 调度时区感知

之前 Heartbeat 的 activeHours.timezone 配了也没用,定时器照样会在安静时段里触发。

这次修好了——调度器现在会主动跳过当前不在活跃时段的时间槽,定时器直接跳到下一个有效窗口。配了 Asia/Shanghai 等非 UTC 时区的用户,安静时段不会再莫名被 ping 了。

一些 BUG 修复

Ollama context window:修了一个会导致工具选择和上下文截断行为异常的回归——num_ctx 没有正确传递给 /api/chat 接口。影响 qwen3、llama3、gemma3 等有 catalog 条目的模型。

WebChat 重复提交:快速重复点发送,之前会启动多个独立的 agent:main:main 调度。现在正确合并成当前活跃 run 的一次请求。

Control UI/Sessions 性能:大会话列表里,chat-turn 的 sessions.changed 事件不再触发全量 sessions.list 重载,大幅减少会话响应过程中的多秒延迟。

飞书消息队列:单个卡住的消息不再把后续同群消息全部堵到网关重启。队列现在有 5 分钟超时保护,超时后继续处理下一条。

Telegram:修了 @newsletter 话题回复时旧消息残留的问题;forum-topic 最终消息现在要求实际观测到 Telegram 的 send/edit 确认才算送达。

Active Memory 召回:修了 memory_search / memory_get 在显式召回会话中丢失目标 agent 上下文的问题;修了 memory_search 结果被 debug 遥测误报为空的问题。

Discord 原生命令:CJK 或多行命令描述不再触发不必要的 PATCH 请求和 429 限速;commands.native=false 时正确跳过 slash 命令注册,低功耗部署不再等无用的 REST 请求。

tools.deny: ["write"]:不再隐式 deny apply_patch,需要明确写 apply_patch 或 group:fs

/responses 多工具调用:Agent 单轮调用多个 client tools 时,现在全部都会出现在响应里,不再只保留最后一个。

v2026.5.4

语音通话全面更新

Google Meet / 语音通话的 Twilio 接入路径,现在走 Gemini 实时语音桥接了。

之前Twilio 拨入之后,音频是直接推给 Agent 处理的,但没有做流控。音频一多,队列就堵,语音就断,体验非常差。

v2026.5.4 做了几件事来解决这个问题:

• paced audio streaming:音频流发送改成节奏控制,不再一口气全推

• backpressure-aware buffering:有反压感知的缓冲,知道下游处理不过来就先缓着

• barge-in queue clearing:用户插话时,旧的音频队列直接清掉,不再排着等

• 去掉了 TwiML fallback:实时语音期间不再回退到静态 TwiML,响应更干脆

实测下来,延迟明显降了。说完话,Agent 的响应速度接近正常语音通话的感觉了,不再有那种诡异的”卡帧感”。

如果你在用 OpenClaw 接 Google Meet 做语音 Agent,这个版本值得升。

依赖包全面刷新

这次依赖更新包含:Pi 0.73.0、ACPX adapters、OpenAI SDK、Anthropic SDK、Slack SDK、TypeScript native preview。

值得注意的是,Bedrock runtime 的安装器覆盖还是被固定在一个特定版本以下——因为 Windows ARM + Node 24 + npm 的组合目前有个 resolver 的 bug,没有 pin 住就会出问题。这个坑官方是知道的,先绕过去了。

Control UI 的几个改进

这个版本对 Control UI 做了不少打磨,逐个说:

会话管理:重复的纯文本消息现在会合并成一条,右上角显示出现次数。以前心跳确认消息会刷一堆一模一样的气泡,现在终于能看了。

Cron 新建任务面板:现在可以折叠了。以前每次进 Cron 页面,右边那个新建表单就占着地方,任务列表只能挤在左边。现在折起来,列表就有更多空间。

Talk 语音入口:修了两个比较烦人的问题—— 1. 语音启动失败之后,那个红色 Banner 之前是关不掉的,现在加了关闭按钮 2. 关掉 Banner 之后,再点 Talk 会直接重启一个新的语音会话,而不是让你先手动 Stop 上一个

媒体图片 URL:之前 WebChat 里的 AI 生成图片,URL 里带的是长期有效的 auth token。这次改成了短生命周期的 scoped ticket,安全性有所提升。

WhatsApp 新增 Newsletter 发送支持

这算一个小但实用的功能——现在可以用 @newsletter 语法,让 Agent 直接往 WhatsApp 的 Channel/Newsletter 发消息了,走的是频道元数据路由,不再走私信逻辑。

之前有个配套的 Bug 也一起修了:WhatsApp 配对时,手机号格式一直很乱,E.164、JID、whatsapp: 前缀这几种写法,系统处理逻辑不统一,会导致白名单匹配失败。现在统一规范成纯数字 ID 格式,再配对就不会出现”明明设置了白名单,消息却过不来”的问题了。

一些BUG修复

Discord IPv4 优先:Discord 的 REST 请求和网关WebSocket 现在优先走 IPv4。IPv4-only 环境下,之前启动会一直卡在 READY 等待,现在不会了。

Active Memory 搜索查询边界:以前 Memory 子 Agent 的搜索输入,会把 channel 和 runtime 的元数据也带进去当搜索关键词,导致搜出来的记忆完全不对。现在限定了边界,只搜最新的消息内容。

Prompt Cache 恢复:v2026.5.4 之前有个回归 Bug,每次 Chat 续话时,系统 Prompt 里多了当前轮的 runtime context,导致 cache key 不稳定,prompt cache 命中率大幅下滑,Token 消耗涨了。这次恢复了。如果你有用长 System Prompt 的 Agent,升级后 API 成本应该会降回来。

TUI 终端代码块:长 token 断词保护有个老问题——它会往 inline code、代码块、表格里塞空格。结果就是,从终端复制出来的包名、命令、ID 都是断开的,完全没法直接用。这个问题修了,代码块内容现在是 byte-for-byte 的,可以放心复制了。

Cron 失败诊断:Cron 任务因为 tool 权限问题失败时,之前 cron show 显示的是绿色的成功状态,但实际上任务根本没跑起来。现在会正确显示失败原因。

DeepSeek V4 via OpenRouter:通过 OpenRouter 跑 deepseek/deepseek-v4-pro 时,旧的 max thinking 参数会触发 OpenRouter 的 400 错误。现在自动映射到 xhigh,不用手动改配置了。

Claude Code /think 级别:Claude CLI Bridge 里的 /think 控制,之前除了 off 之外其他级别都是摆设,实际上不起作用。现在正确传递 --effort 参数了。

Windows 环境加固

这个版本集中修了几个 Windows 上的路径注入风险:

• .env 文件中的 SystemRoot/WINDIRLOCALAPPDATA 如果被覆盖,可能导致 icacls.exereg.execmd.exe 的路径被重定向到恶意位置。现在这些工具的解析都走系统可信路径,不再受 .env 影响。

• 浏览器工具在截图、读取 storage 等操作之前,现在会先校验当前 tab 的 URL 是否在允许范围内,而不是操作完再过滤。

对大多数 Linux/macOS 用户来说这些不太影响,但如果你在 Windows 上部署 OpenClaw,建议关注一下。

插件性能提升

这次 Agents 和 Plugins 都做了同一件事——复用当前 workspace 的 plugin metadata 快照,而不是每次都重新做冷扫描。

涉及到 BTW、compaction、PDF 工具、embedded runner 等几个路径,热路径上的 plugin metadata 读取效率有明显提升。如果你跑的 Agent 有频繁的子Agent调用或者压缩上下文,速度应该能感觉到变化。

网关启动速度也改善了——推迟了非关键 sidecar 的加载,避免了一些不必要的 barrel import,bundled plugin 的 metadata 现在走快速路径。

插件更新机制的修复

插件更新这块之前积累了不少小问题,这次集中清了一批:

• 2026.5.3-1 这种 CalVer correction 版本,之前 Plugin API 范围检查会认为不满足要求。现在修了,correction build 可以正常装插件了

• ClawHub 限速 429 的时候,现在会显示重置窗口时间和”未登录用户可以登录来提升限额”的提示

• Discord 插件外置化之后(从 2026.5.2 开始),dist/ 目录下的 secret-contract-api sidecar 找不到,导致 channels.discord.token 环境变量配置的频道在 2026.5.3 上启动后显示 “not configured”。这次修了

v2026.5.5

v2026.5.5 是一个纯修复版本,没有新功能。但这次修复的范围相当广——几乎覆盖了所有主流渠道和核心机制,下面挑几个重点说说。

多平台消息修复

飞书:话题首帖的 thread ID 在某些情况下没有提前补全,导致同一话题的第一轮和后续消息被路由到两个不同的会话。现在同一话题的对话能正确归并。

Discord:修了两个问题——/steer 这类纯文本控制命令之前在 Discord 里会被默默丢弃,根本到不了 Agent;另外心跳 ACK 超时的计时起点算错了,导致频道刚就绪时频繁出现假性断线重连。

LINE:配置了 dmPolicy: "open" 但没有设通配 allowFrom 的情况,之前会静默接受消息再悄悄拦截,现在改成配置校验阶段直接报错。

Matrix:审批消息发送失败时,现在最多重试 3 次,短暂网络抖动不会再把待审批请求卡死。

AI 提供商兼容性修复

xAI/Grok:原生 Grok Responses 模型不支持 OpenAI 风格的推理力度参数,之前直接传过去会报 Invalid reasoning effort。现在对 grok-4.3 等原生模型自动屏蔽这个参数。

Fireworks/Kimi:Kimi K2.5/K2.6 通过 Fireworks 跑时会因不支持的 reasoning* 参数被拒,现在强制锁成 thinking: disabled,手动切模型不再踩坑。

视频生成:统一规范各提供商的宽高比格式(如 720P -> MiniMax 支持的 768P),修了 Gemini 视频请求误带 generateAudio 导致 fallback 失败的问题。

Control UI / TUI 稳定性

Control UI 这次改动比较集中:会话表格和 openclaw status 里现在显示每个会话用的 agent runtime;带 tool-use 的 assistant 进度消息在聊天历史重载后不再消失;sessions cleanup 会顺带清理孤立的 transcript/compaction/trajectory 文件,避免网关崩溃后残留越积越多;history 加载慢时,标签页不再整体卡死,改为显示”部分加载”状态。

TUI 方面:修了首次启动时会误把心跳会话当普通聊天恢复的问题,以及 openclaw-tui 进程有时变成孤儿进程的问题。doctor --fix 同步支持修复被心跳污染的 agent:main:main 状态。

iOS 本地配对

iOS 配对现在允许私有局域网和 .local 域名走 ws:// 明文连接,Tailscale 和公网路由仍走 wss://。混合认证重连时优先用显式设置的网关密码,不再优先用可能已过期的 bootstrap token。在本地跑 OpenClaw、用 iPhone 直连配对的用户,这个改动很实用。

插件系统与性能

插件方面修了两个影响范围较大的问题:官方插件(Codex、Discord、WhatsApp 等)在宿主升级时,即使被禁用或版本钉死也会同步更新,避免版本脱节;对共享 npm root 做 mutating 操作后,会重新声明 openclaw peer link,防止装一个插件把其他插件的 SDK 路径搞坏。性能方面,model catalog 空结果现在会缓存到下次 reload,TUI 和控制面板的刷新循环不再反复扫描插件元数据。

Docker 安全加固 & 其他

docker-compose.yml 默认 drop 掉 NET_RAW 和 NET_ADMIN capability,并开启 no-new-privileges,自己用 Docker 部署的建议拉新的 compose 文件。另外 /status 输出里新增了 Gateway 进程运行时长和宿主机系统运行时长,方便判断上次重启时间。

总结

v2026.5.3:新功能引入与启动路径重构

• 核心功能:新增文件传输插件,支持多个装了OpenClaw且配对的设备之间传文件;新增运行时控制指令 /steer(引导 Agent 方向)。

• 架构优化:网关(Gateway)启动全面改为懒加载(Lazy-loading),显著提升启动速度;无效配置直接抛错,需依赖 openclaw doctor --fix 修复。

• 系统加固:规范化插件(Plugins)安装拦截与依赖管理,修复 macOS 升级时的进程管理与悬空符号链接问题;WhatsApp 增加 @mention 支持。

v2026.5.4:语音流控重做与基础体验打磨

• 语音通话升级:Google Meet / Twilio 的语音链路切至 Gemini 实时语音桥接,通过引入节奏流控(Paced audio streaming)、反压感知(Backpressure-aware buffering)和打断清空队列(Barge-in queue clearing)大幅降低延迟。

• 界面与交互(Control UI):优化大会话列表重复消息合并、Cron 面板折叠、语音启动(Talk)报错拦截,以及图片访问令牌(Scoped ticket)的安全性。

• 安全与修复:重点修复了 Windows 环境下的 .env 路径注入风险;修复 Prompt Cache 因系统提示词包含运行时上下文导致命中率下降的问题;WhatsApp 增加 @newsletter 广播支持。

v2026.5.5:大范围兼容性与稳定性修复

• 纯修复定位:无新功能,集中处理边缘状态与跨平台 Bug。

• 平台兼容:修复飞书(Feishu)话题归并、Discord /steer 指令静默丢弃、iOS 局域网 ws:// 直连配对等问题。

• 模型厂商适配:对 xAI/Grok 和 Kimi(通过 Fireworks)屏蔽或强制禁用不支持的推理(Reasoning/Thinking)参数,避免 API 报错。

• 部署安全docker-compose.yml 默认剥离 NET_RAW 和 NET_ADMIN 权限,并开启 no-new-privileges