OpenClaw 周报|一周五更,200+ 修复:安全、语音与平台整合的全面加固-夜雨聆风

OpenClaw 周报|一周五更,200+ 修复:安全、语音与平台整合的全面加固

2026-W20（5月3日—5月7日），OpenClaw 共发布 5 个版本：v2026.5.3 → v2026.5.4 → v2026.5.5 → v2026.5.6 → v2026.5.7。累计修复 / 新增功能超过 200 项。本周无重大新功能发布，全部是系统性加固——安全架构重写、多平台整合、Agent 可靠性补强、实时语音能力落地。

v2026.5.3｜5月3日：文件工具链与 Google Meet 实时音频桥接奠基

v2026.5.3 是本周的起点，提供了两个值得单独关注的能力：

文件操作工具链正式登场：`file_fetch`、`dir_list`、`dir_fetch`、`file_write` 四个新工具加上 `plugins.entries.file-transfer.config.nodes` 配置项，以及 `followSymlinks` 支持，意味着 OpenClaw 的 Agent 可以直接操作本地文件系统——这是让 Agent 真正进入工作流的关键一步。

Google Meet 实时音频桥接奠基（v2026.5.3 已有原始能力）：在这一版本，Google Meet 获得了：等待 `session.updated` 再认定桥接连接成功（解决 Meet 加入时序问题）、强制使用 OpenAI realtime output-audio 事件触发音频响应、路由 CLI 会话命令经由 gateway-owned runtime、刷新实时浏览器状态。这个能力在 v2026.5.4 被进一步扩展为完整的 Twilio 拨号 + Gemini 桥接方案。

此外 v2026.5.3 还修复了多个平台细节：WhatsApp 支持 `@newsletter` 独立推送目标、Telegram 论坛主题的最终消息确认逻辑重写、Feishu 流式传输可按账号配置、Mattermost 支持关闭预览草稿。

v2026.5.4｜5月5日：Google Meet + Gemini 实时语音桥接完整落地

这是本周最受关注的功能发布。

Google Meet 新增 Twilio 拨号接入能力：拨入会议的参与者现在可以通过 Gemini 实时语音桥接与 OpenClaw Agent 对话，配备 paced audio streaming（背压感知音频流控）和 barge-in queue clearing（插话队列清除），并完全绕过 TwiML 回退——这意味着延迟大幅降低，实时插话成为可能。

几个实现细节值得关注：音频缓冲默认从 SoX 的 8192 字节降至 4096 字节，以减少延迟；默认使用 `mode: “agent”` 路径（STT → Agent → TTS），而 `mode: “bidi”` 保留为直接双向语音备选；Twilio 语音流现在会在背压时主动关闭过载的实时流，防止音频堆积。

从用户视角看：OpenClaw 不再是一个”等待用户结束发言再回复”的被动助手，而是一个可以实时插话、响应打断的语音 Agent。

同期重要修复：Windows 上 `SystemRoot`/`WINDIR` 环境变量验证被加入安全策略，`LOCALAPPDATA` 的 workspace `.env` 覆盖被阻止——这是第 7 类攻击向量的封堵。另外 Discord 心跳超时现在基于真实 ACK 时间计算，不再误判导致重连风暴。

v2026.5.5｜5月6日凌晨：xAI/Grok 修复、Docker 安全加固、50+ 修复

v2026.5.5 是一个大型补丁版本，包含 50+ 修复，重点集中在以下领域：

xAI/Grok 关键修复：之前向 native Grok 模型发送了 OpenAI 风格的 `reasoning effort` 参数，导致 `grok-4.3` 报错 “Invalid reasoning effort”。v2026.5.5 移除了这个错误参数，并将 bundled xAI thinking profile 钳制为 `off`。Fireworks 的 Kimi 模型（K2.5/K2.6）也得到了类似处理——移除了不兼容的 `reasoning*` 参数。

Docker 安全基线提升：`NET_RAW` 和 `NET_ADMIN` capability 已从默认容器中移除，`no-new-privileges` 标志启用。这是企业级部署的重要加固。

平台整合修复：飞书的 Topic Session 路由被修复（首轮对话和后续对话不再跳到不同话题）；LINE 的 open DM 策略现在有验证机制，无 wildcard `allowFrom` 的 `dmPolicy: “open”` 配置会被拒绝；Discord 的 `/steer` 控制命令重新纳入正常的 auth/mention 门禁。

OpenAI 流式输出修复：初始 chat stream chunk 现在能正确刷新，首个 token 可以立即可见——这是一个影响所有流式交互体验的底层修复。

v2026.5.6｜5月6日下午：Codex OAuth 路由回归修复

v2026.5.6 是一个小版本，仅 4 个修复，但其中一个具有破坏性的 bug 需要立即关注：

Codex OAuth 路由回退（重要）：v2026.5.5 的 `doctor –fix` 错误地将有效的 `openai-codex/` ChatGPT/Codex OAuth 路由重写为 `openai/`，可能导致纯 OAuth 配置的 GPT-5.5 用户被意外切换到 API-key 路由。如在 2026.5.5 版本运行过 `doctor –fix`，需手动执行： “`bash openclaw models set openai-codex/gpt-5.5 && openclaw config validate “`

Web Fetch 超时修复：bounded guarded dispatcher cleanup，超时请求现在正确返回工具错误，而不是卡住 Gateway 工具通道。这是生产环境 Agent 无响应的常见原因之一。

v2026.5.7｜5月7日：安全架构全面加固

v2026.5.7 是本周的收尾版本，安全修复最为集中：

Native 命令权限：owner enforcement 对 native command handlers 的旁路被彻底封堵。Active Memory：全球内存开关操作现在要求 admin scope。Inline Skill 调度：工具调用新增 `before-tool-call` 授权钩子。Telegram：accessGroup 白名单现在在数字 ID 校验之前执行，覆盖私信、群组和 native commands。Codex Approvals：pre-guardian `PermissionRequest` hook 停止默认安装，”始终允许”决定在当前会话内持久化。

Cron 状态可见性：`cron list –json` 和 `cron show –json` 输出新增 computed `status` 字段，外部监控工具可以完整接入。

Context Engine 修复：缓存的 assembled context view 在历史记录缩减或组装失败时被主动失效，不再使用过期状态。这是一个长期存在的隐患修复。

Delivery 报告修复：当出站投递无 adapter 结果时，正确报告 `deliverySucceeded=false`——此前这类情况被静默处理。

趋势观察：OpenClaw 正在夯实的三个方向

四周五发的迭代节奏背后，OpenClaw 的战略重心清晰可见：

实时语音 → Agentic Gateway：Google Meet 从”文字/语音命令入口”演进为”实时语音交互 Agent”，是本次最具可见度的产品化突破。结合文件工具链（v2026.5.3）和上下文引擎修复（v2026.5.7），OpenClaw 正在把”Agent 与真实工作环境交互”这件事从 demo 级别推到生产级别。

安全从补丁到架构：从 Native 命令权限封堵（v2026.5.7）到 Windows 系统路径安全（v2026.5.4）到 Docker 容器加固（v2026.5.5），安全的覆盖范围在快速扩展。这与 AI Agent 进入企业关键业务场景的时间节点高度吻合。

平台整合深度化：从各平台分别修复（如飞书话题路由、Discord 心跳计算、WhatsApp LID 路由）来看，OpenClaw 的平台整合已进入”体验一致性”阶段——不是追求覆盖更多平台，而是让已支持的平台用起来更可靠。

附：Google I/O 2026 热点联想：Gemini 在 I/O 上展示了多模态实时能力，OpenClaw 在 I/O 后数日内落地 Meet + Gemini 桥接，迭代速度在同类产品中处于领先。

数据来源：GitHub openclaw/openclaw v2026.5.3–v2026.5.7 发布页面。

截止发稿，2026.5.9还处于beta版本没有正式发布，下个周报一起更新