OpenClaw v2026.4.25-beta.4 预发布:语音 TTS 全面升级,新增多家语音提供商
OpenClaw 刚发布了 v2026.4.25-beta.4,这是一个预发布版本。这次更新不是单点小修,而是把 语音 TTS 全面升级 放到了更前面,同时又补了一批稳定性和边界能力。如果你已经在比较认真地使用 OpenClaw,这版很值得尽快看一遍。
1. 语音 TTS 全面升级:新增 /tts latest、聊天级自动 TTS、人格系统、多家提供商支持(Azure Speech、小米、Inworld、火山引擎、ElevenLabs v3)
这是本次更新最核心的一项变化,已经能明显看出 OpenClaw 在长期运行和能力沉淀上的推进。
2. 插件系统重构:启动与安装路径迁移至冷持久化注册表,消除宽泛 manifest 扫描
这项变化更偏可视化和可管理性,能提升你在真实使用中的可控感。
3. OpenTelemetry 全面扩展:覆盖模型调用、Token 使用量、工具循环、harness 运行、exec 进程及内存压力
这一部分更偏稳定性或安全边界补强,虽然不一定最显眼,但价值很高。
4. 浏览器自动化增强:安全 Tab URL、CDP 就绪调优、无头一次性启动
这部分属于补强型更新,和主变化一起看,更容易理解这版为什么值得升级。
5. 控制面板新增 PWA/Web Push 支持及 Crestodian 首次运行修复
这部分属于补强型更新,和主变化一起看,更容易理解这版为什么值得升级。
这次更新主要集中在哪些方向
-
• 语音 TTS -
• 插件系统 -
• OpenTelemetry -
• 浏览器自动化 -
• 控制面板
适合谁尽快了解
适合正在重度使用 OpenClaw、关注语音交互能力、插件生态、可观测性建设与长期稳定性的用户尽快了解。
你可以先重点留意的关键词
-
• TTS 语音 -
• 插件系统 -
• OpenTelemetry -
• 浏览器自动化 -
• PWA -
• 预发布版本
中文整理稿
repo: openclaw/openclawrelease_id: 313753935tag: v2026.4.25-beta.4name: openclaw 2026.4.25-beta.4kind: 预发布版本published_at: 2026-04-26T13:24:41Zurl: https://github.com/openclaw/openclaw/releases/tag/v2026.4.25-beta.4
openclaw 2026.4.25-beta.4
仓库:
openclaw/openclaw标签:v2026.4.25-beta.4类型:预发布版本发布时间:2026-04-26T13:24:41Z原文链接:https://github.com/openclaw/openclaw/releases/tag/v2026.4.25-beta.4
亮点 Highlights
语音回复全面升级: 全新 /tts latest 即时播报、聊天级自动 TTS 控制、人格(personas)、按 Agent/账号覆盖的独立设置,并新增 Azure Speech、小米(Local CLI)、Inworld、火山引擎(Volcengine)及 ElevenLabs v3 等多家 TTS 提供商支持。感谢 @leonchui、@zoujiejun、@solar2ain、@cshape、@xuruiray、@itsuzef、@barronlroth。
插件系统重构: 插件启动与安装路径全面迁移至冷持久化注册表,大幅削减原有宽泛的 manifest 扫描,使插件更新、修复、提供商发现及安装元数据更加确定性。感谢 @vincentkoc、@shakkernerd。
OpenTelemetry 覆盖扩展: 全面覆盖模型调用、Token 使用量、工具循环、harness 运行、exec 进程、outbound 投递、context 组装及内存压力等场景,并严格控制属性基数,避免敏感信息泄露。感谢 @vincentkoc、@jlapenna、@Lidang-Jiang、@oc-factus。
浏览器自动化增强: 更安全的 Tab URL、iframe 感知的 ARIA 快照、CDP 就绪调优、无头一次性启动,以及针对慢速主机(如树莓派)的深度 browser doctor 探测能力。感谢 @beat843796、@BenediktSchackenberg。
控制面板与初始化流程: 新增 PWA 安装与 Web Push 通知支持、Crestodian 首次运行修复、TUI 初始化向导、上下文模式选择及更简洁的启动问候语。感谢 @eduardocruz、@SebTardif、@kevinlin-openai。
安装/更新加固: 全面覆盖 Windows、macOS、Linux、Docker、bundled 插件运行时依赖、Node 服务重启、LaunchAgent Token 轮换及混版本 Gateway 验证。感谢 @Kobevictor、@igormf、@abhinas90、@jsompis、@Solvely-Colin、@gucasbrg。
重要更新
语音(TTS)相关
-
• WhatsApp TTS: 新增 /tts latest即时播报(支持去重),以及/tts chat on|off|default会话级自动 TTS 覆盖开关,完整实现当前聊天语音回复的按需播报体验(#66032)。 -
• TTS/Feishu & QQBot: 通用解析渠道及账号级 TTS 覆盖,使飞书和 QQBot 账号能够深度合并 channels.<channel>.accounts.<id>.tts配置。 -
• TTS/Agents: 允许 agents.list[].tts覆盖全局messages.tts设置,实现按 Agent 独立语音;/tts audio、/tts status及tts工具均遵循当前语音/提供商覆盖规则。 -
• Azure Speech: 成为内置 TTS 提供商,支持 Speech 资源认证、语音列表、SSML 转义、原生 Ogg/Opus 语音便笺输出及电话输出(#51776)。 -
• 小米 MiMo TTS: 新增为内置语音提供商,支持 MP3/WAV 输出及语音便笺 Opus 转码(#52376)。 -
• ElevenLabs v3: 纳入内置 TTS 模型目录(#68321)。 -
• Local CLI TTS: 新增内置本地命令行语音提供商,支持文件/stdout 输入、语音便笺 Opus 转换及 PCM 电话输出(#56239)。 -
• Inworld: 新增内置语音提供商,支持流式 TTS 合成、语音列表、语音便笺输出及 PCM 电话输出(#55972)。 -
• 火山引擎(Volcengine)Seed Speech: 新增为内置 TTS 提供商,支持 API Key 认证、原生 Ogg/Opus 语音便笺及 MP3 音频文件输出(#55641)。 -
• TTS/WhatsApp: 将非 Opus 提供商输出标记为语音便笺意图,由渠道层转码为 Ogg/Opus PTT 音频后发送。 -
• TTS/Feishu: 最终流式 TTS 音频在投递前进行规范化,确保语音便笺文件使用与普通最终回复相同的路径和路由(#71920)。 -
• TTS 人格系统: 新增提供商感知的 TTS 人格(provider-aware TTS personas),支持确定性提供商绑定合并、 /tts persona控制、Gateway/CLI 人格状态,以及 Google Geminiaudio-profile-v1提示封装(#70748)。 -
• 语音唤醒路由: macOS 语音唤醒短语可触发路由到指定 Agent 或会话目标,支持 Gateway 路由 API 和节点更新事件(#30354)。 -
• Android Talk Mode: 在”语音”标签页中开放 Talk Mode,支持运行时语音采集模式及麦克风前台服务升级(#44688)。 -
• iOS/macOS Talk Mode: 支持通过 talk.speechLocale设置非英语语音对话的语音识别语言区域(#44688)。
插件系统
-
• 插件注册表迁移: 插件注册表在包安装/更新时自动迁移,安装元数据保留在插件索引中,同时为新的冷注册表路径建立现有插件 manifest 索引。感谢 @vincentkoc、@shakkernerd。 -
• 插件启动规划: Gateway 启动插件规划迁移至版本化冷注册表索引,并包含针对早于启动元数据的旧注册表文件的后安装修复。 -
• 插件索引(Installs): 将托管插件安装元数据整合到状态管理的插件索引 plugins/installs.json,替换临时路径并从创作配置中移除。感谢 @shakkernerd。 -
• 插件索引稳定性: 迁移的插件安装记录即使在插件 manifest 缺失或无效时仍保留在索引中,使更新、卸载、检查和审计流程能够恢复损坏的安装。 -
• 插件 CLI: 新增 openclaw plugins registry命令用于显式持久化注册表检查和--refresh修复;openclaw plugins list默认读取冷持久化注册表快照。 -
• 插件兼容性: 扩展中央兼容性注册表,为遗留 SDK、manifest、setup、注册表迁移及 Agent 运行时表面添加带日期的所有者、替代方案及最长三个月移除目标。 -
• 插件/诊断钩子: 新增仅元数据的 model_call_started和model_call_ended钩子,用于提供商/模型调用遥测,不暴露 prompts、响应、头信息、请求体或原始提供商请求 ID。 -
• 插件卸载: 追踪的插件文件即使在当前状态目录指向其他位置时也从记录的托管扩展根目录中移除。 -
• 插件/Channels: 安全检查、线程绑定放置、提供商摘要、健康格式化和消息操作标签均基于只读或已加载的渠道元数据,不导入完整渠道运行时。
诊断与可观测性(OTEL)
-
• GenAI 语义约定对齐: 模型调用 GenAI span 属性与 OpenTelemetry 稳定性选项语义对齐,默认保留 gen_ai.system,在OTEL_SEMCONV_STABILITY_OPT_IN=gen_ai_latest_experimental时发出gen_ai.provider.name。 -
• OTEL 端点覆盖: 支持通过配置或标准 OTEL 环境变量覆盖 traces、metrics、logs 的 OTLP 端点。 -
• Harness 生命周期遥测: 以有界 openclaw.harness.runspans 和openclaw.harness.duration_ms指标导出 Agent harness 生命周期遥测,使 QA-lab、Codex 和未来 harness 共享同一 trace 结构。 -
• 消息投递诊断: 新增有界出站消息投递生命周期诊断,以低基数投递 spans/metrics 形式导出,不含消息正文、接收者、房间或媒体路径数据(#71471)。 -
• Exec 进程诊断: 以 openclaw.execspans 形式导出有界 exec 进程诊断,不暴露命令文本、工作目录或容器标识符(#71451)。 -
• OTEL 预加载支持: 支持 OPENCLAW_OTEL_PRELOADED=1,使插件可复用已注册的 OpenTelemetry SDK(#71450)。 -
• 上下文组装诊断: 导出有界 openclaw.context.assembledspans,包含 prompt/history 大小但不含实际内容。 -
• 工具循环诊断: 将现有工具循环诊断导出为 openclaw.tool.loop计数器和 spans,不含循环消息、会话标识符、参数或工具输出。 -
• 内存压力诊断: 导出诊断内存样本和压力作为有界内存直方图、计数器和压力 spans。 -
• Token 使用量指标: 新增 GenAI gen_ai.client.token.usage直方图,追踪输入/输出模型用量。 -
• Prometheus 集成: 新增内置 diagnostics-prometheus插件,提供受保护的 Gateway 抓取路由用于低基数诊断指标。 -
• Provider 请求标识符: 在模型调用诊断和 span 事件上以有界哈希形式导出提供商请求标识符。
浏览器自动化
-
• 安全 Tab URL: Agent 响应中返回安全的 Tab URL。 -
• CDP 原生 ARIA 快照: 新增 CDP 原生角色快照回退,支持 iframe 感知引用、光标可点击检测、目标附加准备,以及 openclaw browser doctor --deep实时快照探测。 -
• 慢速主机调优: 允许为树莓派等慢速主机调高本地托管 Chrome 启动发现和启动后 CDP 就绪超时(#66803)。 -
• 无头一次性启动: 新增 openclaw browser start --headless作为一次性本地托管浏览器启动覆盖,不重写持久化浏览器配置。 -
• Tab 稳定性: Chromium 在表单提交或其他操作触发导航后替换原始目标时,保持稳定的 Tab ID 和标签,并从 /act返回可证明的匹配targetId(#46137)。
模型与提供商
-
• LiteLLM 图像生成: 将 litellm注册为图像生成提供商,使image_generate model=litellm/...调用和agents.defaults.imageGenerationModel.fallbacks条目通过 LiteLLM 代理解析。 -
• fal Seedance 2.0: 新增参考转视频模型,支持多图、视频和音频参考输入映射。 -
• vLLM/Nemotron: 当 thinking 关闭时发送 Nemotron 3 chat-template kwargs,并遵循配置的 params.chat_template_kwargs(#71891)。 -
• Z.AI: 将 OpenClaw thinking 控制映射到 Z.AI thinkingpayload,支持通过params.preserveThinking保留 thinking 回放(#58680)。 -
• Ollama Web Search: 使用 Ollama 当前 /api/web_search端点并支持https://ollama.com模型提供商基础 URL(#71741)。 -
• LM Studio 量化后缀: 保留 @iq*量化后缀,使/model lmstudio/...@iq3_xxs精确保持 LM Studio 变体(#71474)。 -
• Bedrock: 延迟 AWS SDK 导入直到 Bedrock 发现实际运行,保持插件注册和设置轻量级冷启动(#71690)。
Codex 与 ACP
-
• Codex app-server 0.125.0+: 要求 Codex app-server 0.125.0 或更高版本,通过 OpenClaw 钩子中继覆盖原生 MCP PreToolUse、PostToolUse和PermissionRequestpayload。 -
• Codex/Agent: 教 prompts 和 agents_list感知原生 Codex app-server 可用性,使 Agent 在 ACP/acpx 明确时才优先使用/codex ...而非 Codex ACP。 -
• Codex/Agent(thinking): 将 --thinking minimal翻译为现代 Codex 模型(gpt-5.5、gpt-5.4、gpt-5.4-mini、gpt-5.2)的low(#71946)。 -
• ACPX/Factory Droid: 将 Factory Droid 添加到实时 ACP 绑定 Docker 矩阵,包括 .factory设置暂存、FACTORY_API_KEY转发及单 Agent 测试配方。 -
• ACP/sessions_spawn: 对 ACP 子轮次应用 runTimeoutSeconds,并将它们分派到后台 subagent 通道(#68823)。 -
• ACPX 0.6.1: 捆绑 acpx@0.6.1,使不支持的泛型模型覆盖明确失败而非静默回退到目标适配器默认值。 -
• OpenCode Go: 添加 DeepSeek V4 Pro 和 DeepSeek V4 Flash 到 Go 目录。
控制面板与用户界面
-
• PWA/Web Push: 新增 PWA 安装支持和 Web Push 通知(#44590)。 -
• Crestodian 首次运行修复: 新增首次运行设置助手、本地规划器回退、完整 TUI 交互式 Crestodian、启动进度指示器、上下文模式选择器及更简洁的启动问候语(#71720、#71760)。 -
• Control UI/Quick Settings: 将助手头像覆盖持久化到浏览器本地存储,解决了超过 200 字符限制问题。 -
• Control UI/chat: 在历史记录重新加载期间隐藏聊天加载骨架,避免高延迟本地 Gateway 上的重载闪烁(#71844);聊天历史限制基于过滤后的可见消息(#71878)。
文档刷新
-
• MCP、模型提供商、doctor、故障排除、BlueBubbles、媒体生成、TTS、subagents、skills、cron/任务、exec 审批及语音通话指南均已使用结构化 Steps、Tabs 和 Accordion 内容刷新。
修复列表
系统与运行时
-
• Sessions: 分离重置新鲜度与会话存储 updatedAt,使心跳、cron、exec 和 Gateway 记账不再阻止配置的每日/空闲重置滚动长期渠道会话(#68315、#63732、#63820、#69083)。 -
• Sessions: 在 /new、/reset、gateway sessions.reset及每日/空闲滚动期间清除排队的系统事件通知,防止过时后台更新泄漏到新会话第一 prompt(#66864)。 -
• Cron/任务: 从持久化运行日志和任务状态恢复已完成 cron 任务账本记录,在标记为 lost之前,减少孤立 cron 运行和离线 CLI 审计的误报(#71963);中断的 cron 任务记录为失败而非丢失或重复工作(#59056)。 -
• Tasks: 将异步 Gateway Agent 任务记录从 Gateway 运行结果终端化,保留 aborted、failed 和 cancelled 结果(#71905);规范化任务生命周期时间戳(#71871)。 -
• Gateway/Reload: 保留 gateway.reload.deferralTimeoutMs: 0语义,使活动 Agent 运行不被强制渠道重启中断(#71637)。 -
• Gateway/Update: 在包更新后重新启动的托管 Gateway 报告错误版本时使更新失败,避免 macOS LaunchAgent 更新后混版本重启的虚假成功(#71835);更新前检查磁盘空间(#71835)。 -
• Node 运行时: 在 Gateway 重启后保持节点主机重试计时器活动,在终端凭证暂停时退出,防止受管节点成为静默僵尸(#69800)。 -
• Gateway/Service: 拒绝来自比写入配置的 OpenClaw 二进制文件更旧的版本的过程和服务变更,防止脑裂安装停止或重写较新 Gateway 服务(#57079)。 -
• Gateway/pairing: 停止将损坏或不可读的设备/节点配对存储视为空状态,保留 paired.json以便修复(#71873)。 -
• Docker/Bonjour: 默认在桥接网络下为捆绑式 Compose Gateway 禁用 Bonjour/mDNS 广告(#71879)。 -
• macOS/remote SSH: 在 gateway.remote.sshTarget中保留发现的 Gateway 主机,同时将 SSH 传输 URL 固定到本地回环隧道,防止浏览器自动化回退到被阻止的非回环ws://端点(#67336)。
渠道与消息
-
• Telegram: 在 threading 回复中自动包含原生引用摘要,保留精确的选定引用文本(#6975、#71952);移除启动时持久化偏移 getUpdates预检,防止轮询重启在 runner 启动前自我冲突(#69304)。 -
• WhatsApp: 在 messages.removeAckAfterReply启用时在可见回复后删除 ack reactions(#26183);允许授权群组语音便笺转录满足提及门控(#44908)。 -
• Feishu: 接受 Schema 2.0 卡操作回调报告 context.open_chat_id(#71670);在最终流式 TTS 音频投递前进行规范化(#71920)。 -
• Discord: 允许 channels.discord.voice.model覆盖用于语音频道响应的 LLM(#64368)。 -
• QQ Bot: 让 qqbot_remind直接调度、列出和移除 Gateway cron 作业(#70865);忽略自回显的机器人消息(#71912)。 -
• Matrix/cron: 在创建隐式 announce 提醒作业时保留实时 Matrix 投递目标,防止小写会话密钥重构混大小写 room ID(#71798)。
插件与扩展
-
• Plugin 安装/卸载: 追踪的插件文件即使在当前状态目录指向其他位置时也从记录的托管扩展根目录中移除;并发配置写入冲突时恢复之前的插件索引记录。 -
• Plugin 运行时依赖: 验证干净的 npm 安装实际将请求的 bundled 运行时包放置在托管安装根目录中,报告确切缺失的规格而非虚假成功修复(#71883);在 Linux 更新期间将 bundled 运行时依赖 npm 安装锚定到 OpenClaw 自有的包 manifest(#71730)。 -
• Plugin/Bonjour: 停止 ciao mDNS 看门狗失败时的无限循环,Bonjour 在重复失败重启后为当前 Gateway 进程禁用自身(#69011)。 -
• Plugin/Windows: 停止在 Windows 上将 bundled 插件 Jiti 加载器放在原生导入路径上,防止 Telegram 等渠道插件在 C:\...路径上崩溃(#71749)。 -
• Plugin/startup: 加载期间在允许时在 Gateway 启动期间加载默认 memory-core槽(#codex)。
日志与诊断
-
• 日志重定向: 在控制台和文件日志接收器出口处重定向配置的密钥模式,使到达日志的凭证在终端显示或 JSONL 持久化之前被屏蔽(#67953)。 -
• 日志/文件: 从活跃 OpenClaw 配置路径直接加载 logging.file和重定向设置(#59370、#67168、#61295);日志在logging.maxFileBytes处轮换(#58583、#62381)。 -
• Gateway/healthz: 在插件、canvas 和 Control UI HTTP 阶段之前保留 /healthz和/readyz,使活跃/就绪探针在后续路由处理程序停滞时仍能响应(#69674)。
媒体与理解
-
• 语音转录: 对太小的语音便笺注入确定性转录占位符,防止 Agent 产生幻觉性转录或提供商失败(#48944)。 -
• 语音路由: 从渠道插件功能解析语音便笺和语音备忘录路由,而非从 speech-core 所有的渠道 ID 列表。 -
• 图像理解: 在修剪的模型回放上下文中清除旧的媒体引用标记,防止过时媒体引用被重新激活为新的 prompt 图像(#71868)。 -
• Google Meet: 添加日历支持的考勤导出工作流、导出清单、试运行预览及会议记录工具对等。
其他重要修复
-
• Claude CLI 1M 上下文: 当启用 context1m时,将配置的 1M 上下文窗口覆盖应用于符合条件的 Claude CLI Opus 和 Sonnet 模型(#70863)。 -
• Claude CLI 会话: 将 google-gemini-cli会话 auth-epoch 绑定到~/.gemini/oauth_creds.json中的 Google 账户身份(#70973)。 -
• GitHub Copilot: 保留加密 Responses reasoning item ID 跨请求验证,防止 gpt-5.3-codex的 400 错误(#71448)。 -
• 图像生成超时: Azure OpenAI 部署范围的图像生成请求给予更长 600s 默认超时(#71705)。 -
• Signal: 通过 Node 的 HTTP 客户端读取 signal-cli RPC、健康检查和 SSE 事件,修复 Node 24/25 fetch 回归导致的 Signal 发送和入站事件中断(#51716、#53040)。 -
• Cron 任务恢复: 平展遗留任务行水合,确保 cron 抖动设置在模型生成的 cron add/update 调用中保留。 -
• MCP/CLI: 在一次性 openclaw agent和openclaw infer model runGateway/本地执行结束时退役捆绑的 MCP 运行时(#71457)。 -
• OpenAI Codex OAuth: 将 openai-codex.baseUrl值规范化为 Codex Responses 后端(#71460)。 -
• Google 视频生成: 直接从 MLDev Veo video.uri下载结果,修复成功后 404(#71200);回退到 RESTpredictLongRunningVeo 端点(#62309)。 -
• MiniMax 音乐: 将捆绑默认模型从不支持的 music-2.5+切换到当前music-2.6API 模型(#64870)。
原文发布: https://github.com/openclaw/openclaw/releases/tag/v2026.4.25-beta.4
原始发布链接
-
• GitHub Releases:https://github.com/openclaw/openclaw/releases/tag/v2026.4.25-beta.4
夜雨聆风