OpenClaw v2026.5.4 发布:Google Meet 语音桥全面升级,多通道体验大幅优化
OpenClaw 发布 v2026.5.4 版本,带来 Google Meet 实时语音桥重大升级、多通道体验优化、启动性能大幅提升等核心改进。
🌟 核心亮点
Google Meet 实时语音桥全面升级
本次版本最大的亮点是 Google Meet / Voice Call 的 Twilio 拨入体验重构。拨入用户现在可以直接通过 Gemini 实时语音桥进行对话,实现了:
-
** paced 音频流** — 按自然节奏推送音频,避免堆积 -
反压感知缓冲 — 根据接收端能力动态调整 -
抢话队列清除 — 用户打断时立即清空旧音频队列 -
无 TwiML 回退 — 实时语音期间不再降级到 TwiML
整体效果:Meet 参与者获得了更灵敏、更自然的 AI 语音助手体验。
🔄 核心变更详解
🖥️ 网关与核心运行时
Windows 本地回环修复
将默认网关监听器绑定到 127.0.0.1,防止 libuv 双栈 ::1 导致 localhost HTTP 请求卡死。这个修复解决了 Windows 用户长期遇到的本地服务无响应问题。
启动性能大幅优化
-
从启动热路径中移除测试工具、运行会话查找、QR 配对和 TypeBox 模式构建 -
延迟非就绪边车(sidecar)的加载 -
避免热路径中的 channel 插件 barrel imports -
快速路径加载内置插件元数据 -
原生可加载插件启动路径不再导入 jiti
诊断增强
新增启动阶段 span、活跃工作标签、过期终端桥标记,以及 pnpm gateway:watch 中的默认同步 I/O 追踪。
会话管理
-
限制 sessions.listRPC 响应规模,上报截断元数据 -
缓存 thinking-option 的富化结果,减少每行处理开销
🔌 插件与 SDK
迁移提示
当 plugins.entries 或 plugins.allow 引用了缺失的官方外部插件时,自动发出目录支持的安装提示。
元数据缓存优化
通过复用工作区兼容的插件元数据快照,避免在热控制面路径上进行冷扫描。
Active-Memory 防护
跳过包含 : 的会话存储通道条目,防止 QQ C2C 智能体 ID 导致回忆崩溃。
SDK 新增能力
-
有界 before_agent_finalize重试指令 -
registerIfAbsent原子键值存储去重 -
插件拥有的 SessionEntry槽位投影和范围可信策略会话扩展读取
ClawHub 体验
为 429 错误添加 RateLimit-Reset/Retry-After 窗口标注和”登录以提高速率限制”提示。
📡 通道与集成
Slack
-
新增 streaming.progress.render: "rich"支持 Block Kit 进度草稿 -
裁剪时保留最新的富进度行 -
预览禁用时抑制独立的工具进度消息
Discord
-
优先使用 IPv4 进行 REST/WebSocket 启动 -
在状态命令中添加退化传输/事件循环饥饿信号 -
READY 等待重试增加退避策略
Telegram
-
支持数字版论坛话题目标 -
从 MIME 元数据派生无标题媒体占位符 -
长文本最终渲染复用活跃预览 -
渲染交互式回复按钮
-
支持 @newsletter出站目标 -
规范化设置/配对白名单为纯数字电话 ID -
登录 QR 通过活跃运行时路由
Google Meet
-
保留 realtime.introMessage: ""实现静默 Chrome 加入 -
分叉来电者转录到顾问会话 -
记录具体 TTS 提供商/模型/语音 -
新增 chrome.audioBufferBytes(默认 4096) -
拆分实时配置为 agent-mode/bidi-mode -
默认 mode: "agent"和realtime.strategy: "agent"
Matrix
-
将 streaming.progress.toolProgress限定在进度草稿模式 -
发布选项反应前绑定原生批准反应
Mattermost / 飞书
-
使用共享进度草稿格式化器 -
抑制独立的默认工具进度消息
🎨 UI 与控制面板
-
头部/面包屑 — 显示活跃智能体名称,不显示会话密钥 -
Cron 侧边栏 — 新建任务侧边栏可折叠 -
聊天 UX — 智能体优先过滤、响应式控件、连续重复文本合并为单个气泡并显示计数 -
性能 — 记录浏览器长动画帧/任务条目,在共享事件日志中限制长任务诊断 -
语音 — 可关闭启动失败错误、从失败会话重试、清除过期状态 -
媒体安全 — 为助手媒体获取签发短时效范围票据,替代长期暴露的访问凭证
🤖 提供商与模型
OpenAI / Codex 媒体
-
在运行时/清单元数据中声明 Codex 音频转录能力 -
将活跃 Codex 聊天模型路由到 OpenAI 转录默认
OpenRouter
-
新增可选响应缓存参数( X-OpenRouter-Cache、X-OpenRouter-Cache-TTL、缓存清除头) -
扩展应用归因分类
🔧 执行审批
新增 tree-sitter 驱动的 shell 命令解释器,在执行审批时为用户提供更清晰的命令意图说明,提升安全性。
📦 沙盒
将容器/浏览器注册表条目存储为每个运行时的分片文件,提升多实例部署的隔离性和可靠性。
📊 版本总结
| 维度 | 改进 |
|---|---|
| 🎤 语音通话 | Google Meet Twilio 拨入全面升级,Gemini 实时语音桥 |
| ⚡ 启动性能 | 热路径精简、延迟加载、元数据快速路径 |
| 🔌 插件系统 | 迁移提示、元数据缓存、SDK 扩展 |
| 📡 多通道 | Slack/Discord/Telegram/WhatsApp/Meet/Matrix 全面优化 |
| 🎨 UI 体验 | 聊天合并、响应式控件、Cron 可折叠 |
| 🔒 安全性 | 媒体短时效票据、shell 命令解释器 |
| 🪟 Windows | 修复本地回环卡死问题 |
📎 完整 Release Notes: github.com/openclaw/openclaw/releases/tag/v2026.5.4[1]
引用链接
[1]github.com/openclaw/openclaw/releases/tag/v2026.5.4: https://github.com/openclaw/openclaw/releases/tag/v2026.5.4
夜雨聆风