OpenClaw 周报|一周五更,200+ 修复:安全、语音与平台整合的全面加固
2026-W20(5月3日—5月7日),OpenClaw 共发布 5 个版本:v2026.5.3 → v2026.5.4 → v2026.5.5 → v2026.5.6 → v2026.5.7。累计修复 / 新增功能超过 200 项。本周无重大新功能发布,全部是系统性加固——安全架构重写、多平台整合、Agent 可靠性补强、实时语音能力落地。
01
v2026.5.3|5月3日:文件工具链与 Google Meet 实时音频桥接奠基
v2026.5.3 是本周的起点,提供了两个值得单独关注的能力:
文件操作工具链正式登场:`file_fetch`、`dir_list`、`dir_fetch`、`file_write` 四个新工具加上 `plugins.entries.file-transfer.config.nodes` 配置项,以及 `followSymlinks` 支持,意味着 OpenClaw 的 Agent 可以直接操作本地文件系统——这是让 Agent 真正进入工作流的关键一步。
Google Meet 实时音频桥接奠基(v2026.5.3 已有原始能力):在这一版本,Google Meet 获得了:等待 `session.updated` 再认定桥接连接成功(解决 Meet 加入时序问题)、强制使用 OpenAI realtime output-audio 事件触发音频响应、路由 CLI 会话命令经由 gateway-owned runtime、刷新实时浏览器状态。这个能力在 v2026.5.4 被进一步扩展为完整的 Twilio 拨号 + Gemini 桥接方案。
此外 v2026.5.3 还修复了多个平台细节:WhatsApp 支持 `@newsletter` 独立推送目标、Telegram 论坛主题的最终消息确认逻辑重写、Feishu 流式传输可按账号配置、Mattermost 支持关闭预览草稿。
02
v2026.5.4|5月5日:Google Meet + Gemini 实时语音桥接完整落地
这是本周最受关注的功能发布。
Google Meet 新增 Twilio 拨号接入能力:拨入会议的参与者现在可以通过 Gemini 实时语音桥接与 OpenClaw Agent 对话,配备 paced audio streaming(背压感知音频流控)和 barge-in queue clearing(插话队列清除),并完全绕过 TwiML 回退——这意味着延迟大幅降低,实时插话成为可能。
几个实现细节值得关注:音频缓冲默认从 SoX 的 8192 字节降至 4096 字节,以减少延迟;默认使用 `mode: “agent”` 路径(STT → Agent → TTS),而 `mode: “bidi”` 保留为直接双向语音备选;Twilio 语音流现在会在背压时主动关闭过载的实时流,防止音频堆积。
从用户视角看:OpenClaw 不再是一个”等待用户结束发言再回复”的被动助手,而是一个可以实时插话、响应打断的语音 Agent。
同期重要修复:Windows 上 `SystemRoot`/`WINDIR` 环境变量验证被加入安全策略,`LOCALAPPDATA` 的 workspace `.env` 覆盖被阻止——这是第 7 类攻击向量的封堵。另外 Discord 心跳超时现在基于真实 ACK 时间计算,不再误判导致重连风暴。
03
v2026.5.5|5月6日凌晨:xAI/Grok 修复、Docker 安全加固、50+ 修复
v2026.5.5 是一个大型补丁版本,包含 50+ 修复,重点集中在以下领域:
xAI/Grok 关键修复:之前向 native Grok 模型发送了 OpenAI 风格的 `reasoning effort` 参数,导致 `grok-4.3` 报错 “Invalid reasoning effort”。v2026.5.5 移除了这个错误参数,并将 bundled xAI thinking profile 钳制为 `off`。Fireworks 的 Kimi 模型(K2.5/K2.6)也得到了类似处理——移除了不兼容的 `reasoning*` 参数。
Docker 安全基线提升:`NET_RAW` 和 `NET_ADMIN` capability 已从默认容器中移除,`no-new-privileges` 标志启用。这是企业级部署的重要加固。
平台整合修复:飞书的 Topic Session 路由被修复(首轮对话和后续对话不再跳到不同话题);LINE 的 open DM 策略现在有验证机制,无 wildcard `allowFrom` 的 `dmPolicy: “open”` 配置会被拒绝;Discord 的 `/steer` 控制命令重新纳入正常的 auth/mention 门禁。
OpenAI 流式输出修复:初始 chat stream chunk 现在能正确刷新,首个 token 可以立即可见——这是一个影响所有流式交互体验的底层修复。
04
v2026.5.6|5月6日下午:Codex OAuth 路由回归修复
v2026.5.6 是一个小版本,仅 4 个修复,但其中一个具有破坏性的 bug 需要立即关注:
Codex OAuth 路由回退(重要):v2026.5.5 的 `doctor –fix` 错误地将有效的 `openai-codex/` ChatGPT/Codex OAuth 路由重写为 `openai/`,可能导致纯 OAuth 配置的 GPT-5.5 用户被意外切换到 API-key 路由。如在 2026.5.5 版本运行过 `doctor –fix`,需手动执行: “`bash openclaw models set openai-codex/gpt-5.5 && openclaw config validate “`
Web Fetch 超时修复:bounded guarded dispatcher cleanup,超时请求现在正确返回工具错误,而不是卡住 Gateway 工具通道。这是生产环境 Agent 无响应的常见原因之一。
05
v2026.5.7|5月7日:安全架构全面加固
v2026.5.7 是本周的收尾版本,安全修复最为集中:
Native 命令权限:owner enforcement 对 native command handlers 的旁路被彻底封堵。Active Memory:全球内存开关操作现在要求 admin scope。Inline Skill 调度:工具调用新增 `before-tool-call` 授权钩子。Telegram:accessGroup 白名单现在在数字 ID 校验之前执行,覆盖私信、群组和 native commands。Codex Approvals:pre-guardian `PermissionRequest` hook 停止默认安装,”始终允许”决定在当前会话内持久化。
Cron 状态可见性:`cron list –json` 和 `cron show –json` 输出新增 computed `status` 字段,外部监控工具可以完整接入。
Context Engine 修复:缓存的 assembled context view 在历史记录缩减或组装失败时被主动失效,不再使用过期状态。这是一个长期存在的隐患修复。
Delivery 报告修复:当出站投递无 adapter 结果时,正确报告 `deliverySucceeded=false`——此前这类情况被静默处理。
06
趋势观察:OpenClaw 正在夯实的三个方向
四周五发的迭代节奏背后,OpenClaw 的战略重心清晰可见:
实时语音 → Agentic Gateway:Google Meet 从”文字/语音命令入口”演进为”实时语音交互 Agent”,是本次最具可见度的产品化突破。结合文件工具链(v2026.5.3)和上下文引擎修复(v2026.5.7),OpenClaw 正在把”Agent 与真实工作环境交互”这件事从 demo 级别推到生产级别。
安全从补丁到架构:从 Native 命令权限封堵(v2026.5.7)到 Windows 系统路径安全(v2026.5.4)到 Docker 容器加固(v2026.5.5),安全的覆盖范围在快速扩展。这与 AI Agent 进入企业关键业务场景的时间节点高度吻合。
平台整合深度化:从各平台分别修复(如飞书话题路由、Discord 心跳计算、WhatsApp LID 路由)来看,OpenClaw 的平台整合已进入”体验一致性”阶段——不是追求覆盖更多平台,而是让已支持的平台用起来更可靠。
附:Google I/O 2026 热点联想:Gemini 在 I/O 上展示了多模态实时能力,OpenClaw 在 I/O 后数日内落地 Meet + Gemini 桥接,迭代速度在同类产品中处于领先。
数据来源:GitHub openclaw/openclaw v2026.5.3–v2026.5.7 发布页面。
截止发稿,2026.5.9还处于beta版本没有正式发布,下个周报一起更新
夜雨聆风