乐于分享
好东西不私藏

OpenClaw v2026.5.4 发布:Google Meet 语音桥全面升级,多通道体验大幅优化

OpenClaw v2026.5.4 发布:Google Meet 语音桥全面升级,多通道体验大幅优化

OpenClaw 发布 v2026.5.4 版本,带来 Google Meet 实时语音桥重大升级、多通道体验优化、启动性能大幅提升等核心改进。


🌟 核心亮点

Google Meet 实时语音桥全面升级

本次版本最大的亮点是 Google Meet / Voice Call 的 Twilio 拨入体验重构。拨入用户现在可以直接通过 Gemini 实时语音桥进行对话,实现了:

  • ** paced 音频流** — 按自然节奏推送音频,避免堆积
  • 反压感知缓冲 — 根据接收端能力动态调整
  • 抢话队列清除 — 用户打断时立即清空旧音频队列
  • 无 TwiML 回退 — 实时语音期间不再降级到 TwiML

整体效果:Meet 参与者获得了更灵敏、更自然的 AI 语音助手体验。


🔄 核心变更详解

🖥️ 网关与核心运行时

Windows 本地回环修复

将默认网关监听器绑定到 127.0.0.1,防止 libuv 双栈 ::1 导致 localhost HTTP 请求卡死。这个修复解决了 Windows 用户长期遇到的本地服务无响应问题。

启动性能大幅优化

  • 从启动热路径中移除测试工具、运行会话查找、QR 配对和 TypeBox 模式构建
  • 延迟非就绪边车(sidecar)的加载
  • 避免热路径中的 channel 插件 barrel imports
  • 快速路径加载内置插件元数据
  • 原生可加载插件启动路径不再导入 jiti

诊断增强

新增启动阶段 span、活跃工作标签、过期终端桥标记,以及 pnpm gateway:watch 中的默认同步 I/O 追踪。

会话管理

  • 限制 sessions.list RPC 响应规模,上报截断元数据
  • 缓存 thinking-option 的富化结果,减少每行处理开销

🔌 插件与 SDK

迁移提示

plugins.entriesplugins.allow 引用了缺失的官方外部插件时,自动发出目录支持的安装提示。

元数据缓存优化

通过复用工作区兼容的插件元数据快照,避免在热控制面路径上进行冷扫描。

Active-Memory 防护

跳过包含 : 的会话存储通道条目,防止 QQ C2C 智能体 ID 导致回忆崩溃。

SDK 新增能力

  • 有界 before_agent_finalize 重试指令
  • registerIfAbsent 原子键值存储去重
  • 插件拥有的 SessionEntry 槽位投影和范围可信策略会话扩展读取

ClawHub 体验

429 错误添加 RateLimit-Reset/Retry-After 窗口标注和”登录以提高速率限制”提示。


📡 通道与集成

Slack

  • 新增 streaming.progress.render: "rich" 支持 Block Kit 进度草稿
  • 裁剪时保留最新的富进度行
  • 预览禁用时抑制独立的工具进度消息

Discord

  • 优先使用 IPv4 进行 REST/WebSocket 启动
  • 在状态命令中添加退化传输/事件循环饥饿信号
  • READY 等待重试增加退避策略

Telegram

  • 支持数字版论坛话题目标
  • 从 MIME 元数据派生无标题媒体占位符
  • 长文本最终渲染复用活跃预览
  • 渲染交互式回复按钮

WhatsApp

  • 支持 @newsletter 出站目标
  • 规范化设置/配对白名单为纯数字电话 ID
  • 登录 QR 通过活跃运行时路由

Google Meet

  • 保留 realtime.introMessage: "" 实现静默 Chrome 加入
  • 分叉来电者转录到顾问会话
  • 记录具体 TTS 提供商/模型/语音
  • 新增 chrome.audioBufferBytes(默认 4096)
  • 拆分实时配置为 agent-mode/bidi-mode
  • 默认 mode: "agent"realtime.strategy: "agent"

Matrix

  • streaming.progress.toolProgress 限定在进度草稿模式
  • 发布选项反应前绑定原生批准反应

Mattermost / 飞书

  • 使用共享进度草稿格式化器
  • 抑制独立的默认工具进度消息

🎨 UI 与控制面板

  • 头部/面包屑 — 显示活跃智能体名称,不显示会话密钥
  • Cron 侧边栏 — 新建任务侧边栏可折叠
  • 聊天 UX — 智能体优先过滤、响应式控件、连续重复文本合并为单个气泡并显示计数
  • 性能 — 记录浏览器长动画帧/任务条目,在共享事件日志中限制长任务诊断
  • 语音 — 可关闭启动失败错误、从失败会话重试、清除过期状态
  • 媒体安全 — 为助手媒体获取签发短时效范围票据,替代长期暴露的访问凭证

🤖 提供商与模型

OpenAI / Codex 媒体

  • 在运行时/清单元数据中声明 Codex 音频转录能力
  • 将活跃 Codex 聊天模型路由到 OpenAI 转录默认

OpenRouter

  • 新增可选响应缓存参数(X-OpenRouter-CacheX-OpenRouter-Cache-TTL、缓存清除头)
  • 扩展应用归因分类

🔧 执行审批

新增 tree-sitter 驱动的 shell 命令解释器,在执行审批时为用户提供更清晰的命令意图说明,提升安全性。


📦 沙盒

将容器/浏览器注册表条目存储为每个运行时的分片文件,提升多实例部署的隔离性和可靠性。


📊 版本总结

维度 改进
🎤 语音通话 Google Meet Twilio 拨入全面升级,Gemini 实时语音桥
⚡ 启动性能 热路径精简、延迟加载、元数据快速路径
🔌 插件系统 迁移提示、元数据缓存、SDK 扩展
📡 多通道 Slack/Discord/Telegram/WhatsApp/Meet/Matrix 全面优化
🎨 UI 体验 聊天合并、响应式控件、Cron 可折叠
🔒 安全性 媒体短时效票据、shell 命令解释器
🪟 Windows 修复本地回环卡死问题

📎 完整 Release Notes: github.com/openclaw/openclaw/releases/tag/v2026.5.4[1]

引用链接

[1]github.com/openclaw/openclaw/releases/tag/v2026.5.4: https://github.com/openclaw/openclaw/releases/tag/v2026.5.4