乐于分享
好东西不私藏

OpenClaw v2026.5.26 发布: Transcript 成核心,全渠道生产就绪,语音全面进化

OpenClaw v2026.5.26 发布: Transcript 成核心,全渠道生产就绪,语音全面进化

OpenClaw 2026.5.26:一次覆盖性能、安全、语音、全渠道的超级更新,130+ 项改进让 Agent 平台真正走向生产级。


5 月 27 日,OpenClaw 发布 v2026.5.26 版本。这是该项目历史上规模最大的版本更新之一——涵盖 7 大核心方向、130+ 项功能改进与 Bug 修复,涉及 Gateway 性能、Transcript 架构、全渠道生产就绪、语音/Talk 进化、安全边界、多模型稳定性以及可观测性。

作为 GitHub 上 37.5 万 Star 的开源 AI Agent 平台,OpenClaw 正在用一次比一次密集的更新节奏,定义”AI Agent 操作系统”的标准。


🚀 性能革命:Gateway 启动速度大幅提升

本次更新最核心的性能改进集中在 Gateway 层:

  • 启动零重复扫描:Gateway 启动时不再重复扫描 plugin、channel、session、usage-cost、warning、scheduled-service 和 filesystem,消除大量冗余 I/O
  • 可见回复分离:用户可见的回复与较慢的后续工作分离,降低首字节延迟
  • 缓存优化:plugin 元数据快照、package realpaths、gateway 元数据、model cost index、channel resolution、usage-cost index 等全部缓存,Gateway 在负载下的缓存抖动大幅减少
  • Cron 并发默认提升cron.maxConcurrentRuns 默认值从 1 提升到 8,定时任务无需手动配置即可并行执行

📝 Transcript 成为核心架构

Transcript 从辅助功能升级为一级公民:

  • Transcript 驱动会议纪要:支持 source-provider chunks、cleaned user turns、media provenance
  • 全渠道统一路径:Codex 镜像、WebChat 回复、CLI/TUI 回放全部走同一条可靠的 transcript 路径
  • 持久化保障:CLI、WebChat、media、follow-up、hook、Codex-mirror 用户 turn 全部持久化到 admitted session target
  • 元数据转义:transcript metadata field names 自动转义,防止注入

这意味着 OpenClaw 的每一次对话、每一次语音交互、每一次工具调用,都有了完整可追溯的记录。


📱 全渠道生产就绪

本次更新让各大通讯渠道真正达到生产级标准:

Telegram

  • 保持 typing/progress 上下文,避免用户看到”机器人正在输入…”后长时间无响应
  • Forum topic 名称通过 account-scoped topic cache 传播
  • /command@TargetBot 实体被识别为显式提及,不再漏掉定向命令
  • ENETDOWN 作为瞬态网络故障处理,自动恢复

iMessage

  • 从本地 Messages attachment roots 读取图片附件
  • 去重重复的 local Messages-source 账户
  • 直接 DM 历史种子注入
  • 缩略图审批反应支持

WhatsApp

  • 恢复 ack 身份和 group-drop 警告
  • 缩略图审批反应
  • 群组/媒体行为恢复正常

Discord

  • 语音播放和 wake 回复改进
  • 大模型选择器菜单分桶显示(A-G / H-N / O-Z)
  • 媒体标题合并为一条消息
  • 元数据通过配置的代理路由

Signal

  • 新增 reaction approvals,移动端审批无需输入 /approve 命令

🎙️ 语音与 Talk 全面进化

语音模块是本次更新的重头戏,涉及 10+ 项改进:

  • iOS 实时 Talk 模式:直接实时语音会话、紧凑工具栏状态、响应式语音波形反馈
  • Android 离线恢复:voice/gateway 断连后自动恢复
  • Wake-name 容错增强:接受 “Monty”、”Moti” 等模糊唤醒词,同时保持环境语音门控
  • Discord 说话人归因:复用共享实时 turn-context 追踪
  • Google Meet 命令:复用共享实时输出活动追踪,支持本地 barge-in 检测
  • Consult 协调:共享实时 consult question matching、speakable-result 提取、alias-aware forced-consult

🔒 安全边界全面加固

安全是本次更新的另一个重点方向:

  • SSRF 防护:Browser snapshot 读取前验证 tab URL 是否符合 SSRF 策略
  • Prompt 注入防护memory_store 工具拒绝 prompt-like 文本,匹配现有 auto-capture 过滤
  • 系统事件文本净化:防止不可信的 plugin/channel 标签伪造嵌套 prompt 标记
  • 外部内容包装:抓取的文件文本和 metadata 被包装为外部内容
  • ClickClack 发送者白名单allowFrom 在 agent dispatch 前执行
  • 设备令牌轮换:失效的设备令牌 RPC 被拒绝
  • 工具调用文本清理:序列化后的 tool-call 文本从回复中清除
  • Docker 令牌隐藏:避免在 Docker 中打印 Gateway tokens
  • 安全审计openclaw security audit 检测 webhook token 复用 Gateway 密码

🤖 多模型提供商稳定性提升

  • 命名认证配置文件:支持 Hermes、OpenCode、Codex 的命名 auth profiles,支持凭证迁移
  • OpenAI 采样参数透传:Gateway 转发 OpenAI sampling params,暴露 context-budget 状态
  • Codex 恢复机制:app-server resume/timeout/usage-limit 恢复,native compaction 在 budget-triggered 场景下保持禁用
  • xAI 使用限制暴露:usage-limit 错误本地化显示
  • Ollama top-p 归一化:修复贪婪模式下的 top_p 值
  • Google Vertex ADC:支持 Workload Identity Federation、service-account credentials、metadata-server ADC
  • 动态工具 schema 防护:隔离不支持的动态工具 schema

📊 安装、更新与发布路径加固

  • Alpine Linux 支持:apk 安装覆盖 Git、验证 Node runtime floor、尝试 nodejs-current
  • Docker 构建超时控制:package build、inventory、pack、tarball 准备全部带 process-group timeout
  • Windows 计划任务:保持 Gateway 在电池供电下运行,避免域用户提示
  • macOS 重启和 dSYM 打包加固
  • 稳定更新通道:prerelease 标签从 stable channel 排除
  • Testbox/Crabbox 委托加固

🔍 可观测性飞跃

  • Activity 标签页:Control UI 新增实时工具活动摘要,不持久化原始遥测
  • OpenTelemetry LLM spans:完整的 LLM 调用链路追踪
  • Gateway 密钥准备追踪:secret-prep traces 可见
  • 工具/模型流进度:model stream progress 实时可见
  • 快速模式状态:显式 fast-mode 状态显示
  • systemd Gateway 卫生:更清晰的生命周期管理
  • 告警遥测信号:blocked tools、failover、stale sessions、liveness、oversized payloads、webhook ingress

📋 版本数据

指标 数值
版本 v2026.5.26
发布日期 2026-05-27
GitHub Stars 375,078
Forks 78,212
主要改进方向 7 大方向
功能/修复项 130+ 项
bundled plugins 46 个
语言 TypeScript

🎯 悟空点评

OpenClaw v2026.5.26 是一次”从玩具到武器”的蜕变。几个关键信号值得关注:

  1. Transcript 成为核心架构:这意味着 OpenClaw 不再只是一个”聊天机器人”,而是在构建完整的 AI 对话操作系统——每一次交互都可追溯、可回放、可分析。

  2. 全渠道生产就绪:Telegram、iMessage、WhatsApp、Discord、Signal 同时达到生产级,OpenClaw 正在成为唯一真正覆盖所有主流通讯渠道的开源 AI Agent 平台。

  3. 语音/Talk 的 10+ 项改进:从 iOS 实时 Talk 到 Discord 说话人归因,从 wake-name 容错到 Google Meet barge-in,OpenClaw 的语音能力正在快速追赶商业产品。

  4. 安全边界的全面加固:SSRF 防护、prompt 注入防御、外部内容包装——OpenClaw 正在为”Agent 与不可信数据交互”的场景做好充分准备。

  5. 37.5 万 Star 的生态势能:作为 2025 年 11 月才诞生的项目,OpenClaw 在半年内冲到 37.5 万 Star,更新频率和质量都在加速。

一句话:如果你在用 AI Agent,OpenClaw 现在可能是开源世界里功能最全、渠道最广、安全最扎实的选择。


📎 官方链接:https://github.com/openclaw/openclaw/releases/tag/v2026.5.26[1]

🐵 悟空 AI 观察 · 用 AI 的视角,看懂科技世界

引用链接

[1]https://github.com/openclaw/openclaw/releases/tag/v2026.5.26