OpenClaw v2026.5.4 发布:语音能力飞跃与全面性能优化
🚀 核心亮点:Google Meet 语音能力飞跃
这是本次更新最重磅的功能。
Twilio 拨号加入 + Gemini 实时语音桥接
之前 Google Meet 的 Twilio 拨号用户与 OpenClaw 语音代理交互时存在延迟和体验问题。现在:
-
• Paced audio streaming — 音频流速率控制,避免堆积 -
• Backpressure-aware buffering — 背压感知缓冲,智能处理网络波动 -
• Barge-in queue clearing — 支持打断队列,实时响应更灵敏 -
• No TwiML fallback during realtime speech — 实时语音期间不再降级到传统 TwiML
效果:Meet 参与者能感受到”更敏捷”的 OpenClaw 语音代理体验。
// Google Meet 语音代理现在默认使用 agent 模式
const config = {
realtime: {
mode: "agent", // 新的默认模式
strategy: "agent", // STT -> OpenClaw agent -> TTS
introMessage: "" // 可设置为空,静默加入
}
}
相关的 Google Meet 改进
-
• Chrome 实时语音传输测试现在在 Linux 预发布版本上也是隔离的 -
• 双工模式(bidi)依然可用,但需要显式配置 realtime.strategy: "bidi" -
• 添加了 chrome.audioBufferBytes配置项,默认 buffer 从 8192 降到 4096 字节,降低延迟
🛠 平台与渠道改进
WhatsApp Channel/Newsletter 支持
终于支持 WhatsApp Channel 了!现在可以向 @newsletter 目标发送广播消息,而不是走 DM 路由。
// 发送 WhatsApp 频道消息
await message.send({
channel: "whatsapp",
target: "@newsletter",
message: "Hello Channel subscribers!"
});
Telegram 论坛话题优化
-
• 支持插件所有的数字论坛话题目标 -
• 修复了媒体附件的 MIME 类型解析问题,非图像附件不再被错误标记为 <media:image> -
• 流式消息预览复用机制优化,不再产生瞬时多余气泡 -
• 按钮类交互回复现在正确渲染内联键盘
Discord 稳定性增强
-
• 添加了降级传输和事件循环饥饿信号检测 -
• 修复了 IPv4/IPv6 兼容性问题(IPv4 优先),避免在纯 IPv4 网络上卡顿 -
• 回复投递失败现在正确标记为失败,而不是静默完成
Slack 流式预览升级
# 新的富文本进度渲染
streaming:
progress:
render: "rich" # Block Kit 进度草案
长进度草案现在保留最新行,Block Kit 限制内保持最佳展示效果。
🏠 Control UI / Web 控制台改进
会话过滤器
聊天会话选择器现在支持以 agent 为优先的过滤方式,方便在多 agent 场景下快速定位。
响应式布局优化
-
• 手机/平板/桌面宽度下聊天控制和输入框都保持响应式 -
• 桌面端聊天控制栏现在在一行内显示 -
• 滚动时自动隐藏头像行,减少视觉干扰
重复消息折叠
连续重复的纯文本消息现在会折叠成一条气泡 + 数量标记,heartbeat 类的静默响应不再污染对话流。
Cron 侧边栏可折叠
新建任务的侧边栏现在可以折叠,给任务列表留出更多空间。
⚡ 性能优化:启动速度大幅提升
这次在性能方面下了大功夫。
Gateway 启动优化
// 优化前:大量同步 I/O 和不必要的导入
// 优化后:
- 模型目录测试助手移出热启动路径
- 运行会话查找代码优化
- QR 配对助手按需加载
- TypeBox memory-tool schema 构建延迟
效果:默认 gateway 基准测试的插件加载和内存压力显著降低。
插件加载优化
-
• 避免在原生可加载插件启动路径上导入 jiti(除非真的需要 source-transform) -
• 编译好的插件 surface 不再为 fallback loading 付出不必要的开销 -
• 延迟非就绪 sidecar 到 ready 信号之后
会话列表性能
# 限制默认输出为最新 100 行
openclaw sessions
# 可用 --limit <n|all> 自定义
大量会话的机器不再因为无限 enrichment 而卡死。
🔒 安全加固
Docker 安全强化
# docker-compose.yml 现在默认启用
security_opt:
- no-new-privileges:true
cap_drop:
- NET_RAW
- NET_ADMIN
Windows 安全修复
-
• 修复了 SystemRoot/WINDIR环境变量验证漏洞,防止恶意.env重定向系统工具 -
• git.exe路径解析现在从受信任的进程本地LOCALAPPDATA解析,防止 workspace dotenv 污染 -
• .cmd/.bat进程包装器走统一的 Windows 安装根解析器
Browser/SSRF 强化
截图、快照、控制台等 tab 作用域操作现在在执行前强制检查当前 tab URL 策略,避免政策绕过。
📦 依赖与插件系统
依赖更新
-
• Pi 0.73.0 -
• ACPX adapters -
• OpenAI / Anthropic / Slack / TypeScript 原生预览 -
• 修复了 Bedrock runtime installer 在 Windows ARM Node 24 上的 npm 解析失败问题
插件迁移改进
当 plugins.entries 或 plugins.allow 引用未安装的官方外部插件时,现在给出安装提示而不是要求删除配置:
# 旧行为:提示移除配置
# 新行为:
openclaw plugins install <官方插件名>
插件 SDK 增强
新增 openclaw/plugin-sdk/channel-message 生命周期助手:
-
• defineChannelMessageAdapter -
• deliverInboundReplyWithMessageSendContext -
• Send/receive/live/state 契约 -
• 持久化最终投递能力推导
ClawHub 限流提示优化
429 响应现在显示具体的 RateLimit-Reset/Retry-After 时间窗口,未认证请求额外提示”Sign in for higher rate limits”。
🐛 重要 Bug 修复
|
|
|
|
|---|---|---|
::1 阻塞 |
|
|
|
|
|
|
|
|
|
|
|
|
/codex bind
|
|
|
|
|
|
OPENCLAW_WORKSPACE_DIR |
|
|
📊 统计
-
• PR 合并数:200+ -
• 问题修复:100+ -
• 贡献者:75+ 人 -
• 测试用例:新增 Slack Desktop Smoke、WhatsApp Live QA、Matrix Approval 等
升级建议
# 升级 OpenClaw
openclaw update
# 或手动
npm install -g openclaw@latest
如果遇到问题:
# 医生检查
openclaw doctor --fix
# 回滚(如果需要)
openclaw update --rollback
总结
v2026.5.4 是一个体验优先的版本。语音能力的提升让 OpenClaw 作为 Meet 语音代理更加可用;性能优化让 gateway 启动和插件加载更快;安全加固让自托管更加放心;大量的 bug 修复让各平台渠道更加稳定。
建议所有用户升级到这个版本,特别是使用 Google Meet 语音代理或 Windows 环境的用户。
|
|
|
|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
技术没有捷径,但有方向
夜雨聆风