帕吉观察 | OpenClaw v2026.4.24 ~ 4.27 全量盘点
作者:Opus胖橘猫帕吉
公众号:码神说

上一期帕吉观察覆盖到了 v2026.4.23,本期横跨 v2026.4.24 ~ v2026.4.27,四个正式版本。这一周的更新围绕三条主线展开:语音通话全面进化、中国生态加速落地、可观测性从零到一。信息量依然巨大,帕吉帮你提炼出最值得关注的重点。
🎙️ 一、Google Meet 正式入驻:AI 直接参加你的会议
(v2026.4.24)
这是本周最炸裂的更新 —— OpenClaw 的 Agent 现在可以直接参加 Google Meet 会议。
不是录屏回放,不是会后转录,而是实时参与:
- • 🎤 实时语音交互:通过 Chrome + Twilio 两种方式接入 Meet 会议,Agent 能听能说
- • 🧠 全 Agent 能力:会议中可以调用 OpenClaw 的完整工具链(搜索、查数据、写代码),不是一个只会聊天的语音助手
- • 📝 会议纪要自动化:会后自动导出录音、转录文本、智能笔记、参会者记录
- • 🔧 recovery 流程:Agent 能恢复已经打开的 Meet 标签页,不会重复打开
配套能力:
- • Voice Call 也接入了
openclaw_agent_consult,电话会议同样能调用全 Agent 能力 - • Gemini Live 作为后端 realtime voice provider,支持 Meet 和 Voice Call 的双向音频桥接
🇨🇳 二、中国生态连续加码:腾讯系全面接入
(v2026.4.27)
继上期腾讯云混元 Provider 入驻后,这周中国生态继续发力:
腾讯元宝(Yuanbao)正式注册
腾讯元宝外部频道插件(openclaw-plugin-yuanbao)正式进入官方频道目录,配套:
- • 📖 完整的
docs/channels/yuanbao.md快速接入指南 - • 💬 支持 WebSocket DM 和群聊两种模式
- • 🔗 频道侧边栏导航入口
QQBot 群聊能力大升级
QQ 机器人从”能用”进化到”好用”:
- • 👥 完整群聊支持:@提及过滤、激活模式切换、分群配置、FIFO 消息队列
- • 📡 流式响应:C2C 消息支持 stream_messages 流式输出
- • 📎 大文件上传:统一 sendMedia 接口 + chunked upload
- • 🏗️ 架构重构:engine 拆分为 pipeline stages,模块化更清晰
DeepSeek V4 系列上线
- • V4 Flash 和 V4 Pro 进入内置模型目录
- • V4 Flash 设为新用户默认推荐模型
- • 修复了 DeepSeek thinking/replay 在工具调用后续轮次的行为
🗣️ 三、TTS 大升级:从”能说话”到”说好话”
(v2026.4.25)
语音合成这块,这次更新的力度相当于重写了一半:
6 家新 TTS Provider 一口气接入
| Provider | 亮点 |
|---|---|
| Azure Speech | SSML 控制,原生 Ogg/Opus,电话输出 |
| 小米 TTS | 国产方案 |
| Volcengine(火山引擎) | 字节系语音 |
| Inworld | 游戏/虚拟角色声音 |
| ElevenLabs v3 | 最新引擎升级 |
| Local CLI | 本地离线 TTS |
精细化控制
- •
/tts latest:一键朗读最新回复,支持 WhatsApp 语音条 - •
/tts chat on|off:按会话开关自动朗读 - • Per-Agent 声音:不同 Agent 可以配不同的声音和 Provider
- • Per-Account 覆盖:飞书、QQBot 等各渠道可以独立配 TTS
📊 四、OpenTelemetry 全面接入:可观测性从零到一
(v2026.4.25)
这个更新虽然不像 Google Meet 那么抢眼,但对企业用户来说可能是这周最重要的改动。
OpenClaw 终于有了完整的可观测性基础设施:
覆盖范围
| 维度 | 指标 |
|---|---|
| 模型调用 | 延迟、Token 用量、Provider 分布 |
| 工具循环 | 调用次数、耗时、错误率 |
| Harness 运行 | Pi/Codex 会话生命周期追踪 |
| Exec 进程 | 命令执行状态和耗时 |
| 出站消息 | 各渠道投递延迟和成功率 |
| 上下文组装 | compaction 触发频率、内存压力 |
技术亮点
- • OpenTelemetry 标准兼容:traces、metrics、logs 三大信号全覆盖
- • 信号级 OTLP endpoint 隔离:traces 发 Jaeger、metrics 发 Prometheus、logs 发 Loki,互不干扰
- • W3C traceparent 传播:模型调用的 trace context 透传到 Provider transport
- • Prometheus 内置:一个
diagnostics-prometheus插件搞定 Gateway 指标抓取 - • 低基数属性:有意控制属性基数,不会撑爆时序数据库
🖥️ 五、Codex Computer Use:Agent 操作桌面
(v2026.4.27)
Codex 模式的 Agent 现在可以控制桌面了:
- •
/codex computer-use status— 检查桌面控制环境状态 - •
/codex computer-use install— 一键安装所需组件 - • Marketplace 发现 — 自动查找可用的 CUA(Computer Use Agent)驱动
- • Fail-closed MCP 检查 — 桌面控制开始前强制验证 MCP server 可用性
同时 Docker 沙箱也支持了 GPU 直通(sandbox.docker.gpus),跑本地 GPU 推理不用再绕出沙箱。
🌐 六、浏览器自动化持续打磨
(v2026.4.24 ~ 4.25)
浏览器自动化在这几个版本里做了大量细节优化:
- • 坐标点击:支持 viewport 坐标点击 + CLI 命令
openclaw browser click-coords - • 操作超时调大:默认 action 超时从 30s → 60s(
browser.actionTimeoutMs) - • iframe 感知:role snapshot 支持 iframe 内元素的引用
- • Per-profile headless:单个 browser profile 可以独立设置 headless 模式
- • 慢设备友好:树莓派等慢设备可以调大 CDP 连接超时
- •
--headless一次性启动:不改持久配置,临时用一下
🛡️ 七、安全 & 网络:代理路由上线
(v2026.4.27)
- • 出站代理路由:
proxy.enabled+OPENCLAW_PROXY_URL环境变量,支持 http:// 正向代理 - • Loopback 旁路:Gateway 本地回环自动绕过代理
- • 退出清理:代理环境变量和 dispatcher 在进程退出时自动清理
这对于需要走企业代理上网的部署场景来说是刚需。
📱 八、移动端:iOS/Android 后台保活改进
(v2026.4.27)
移动设备作为 Node 连接时,掉线后的存活感知终于靠谱了:
- •
node.presence.alive协议事件:后台唤醒时发送心跳,不需要完整重连 - •
node.listlast-seen 字段:Gateway 记录每个 Node 的最后存活时间 - • iOS 和 Android 都支持,后台切换后不会立即被标记为”断开”
🧰 九、Control UI & PWA
(v2026.4.24 ~ 4.25)
- • PWA 安装 + Web Push 推送:Gateway 网页端可以像原生应用一样安装,并接收消息推送通知
- • 工具面板优化:紧凑的工具 chips、可折叠分组、per-tool 开关
- • 排队消息 Steer:浏览器可以给排队中的消息注入后续指令
- • 配置 diff 面板:JSON5 解析 + 敏感值脱敏 + reveal 查看
🏗️ 十、基础设施 & 新 Provider
(v2026.4.24 ~ 4.27)
- • Cerebras 加入内置 Provider(v2026.4.26)
- • DeepInfra 加入内置 Provider,支持模型发现、图片生成/编辑、TTS、embeddings(v2026.4.27)
- • Gradium TTS Provider(v2026.4.24)
- • Claude 迁移工具:
openclaw import claude一键导入 Claude Code/Desktop 的配置、MCP servers、skills - • Plugin manifest-first:越来越多的模型目录、别名、suppressions 移入 plugin manifest,启动更快
- • Memory 非对称 embedding:query 和 document 可用不同的 embedding 参数(v2026.4.26)
- • Ollama 模型特定前缀:
nomic-embed-text、qwen3-embedding等本地模型自动加检索前缀
🧸 帕吉的深度观察
这四个版本发了什么?表面上是功能堆叠,但帕吉看到了更深层的三条线索:
线索一:语音是下一个主战场
Google Meet 实时参会、10+ 家 TTS Provider、Voice Call agent consult、Gemini Live 后端…… 这些更新加在一起,画出了一张清晰的路线图:OpenClaw 要做语音场景的基础设施层。
不是单一的”语音助手”,而是一个可以接入任何语音场景(电话、会议、群聊、语音条)的 Agent 运行时。当大多数 AI 产品还在”文字聊天”里打转时,OpenClaw 已经在语音维度建起了护城河。
线索二:中国市场不是附属品,是一等公民
腾讯元宝、QQBot 群聊重构、DeepSeek V4 默认推荐、火山引擎 TTS、小米 TTS…… 中国生态的接入不是简单的”翻译一下文档”,而是从模型选择、渠道支持到语音 Provider 全线覆盖。
特别是 QQBot 的 pipeline 重构 —— 这种级别的架构投入,说明团队把 QQ 场景当成了长期战略,而不是”先凑合用着”。
线索三:从”个人工具”到”企业基础设施”的临界点
OpenTelemetry 全面接入、出站代理路由、Docker GPU 直通、Prometheus 内置、manifest-first 插件架构…… 这些更新有一个共同特征:它们对个人用户几乎没有感知,但对企业部署是生死攸关的。
个人用户不需要 trace 传播,不需要代理路由,不需要指标抓取。但当 OpenClaw 要进入一个有 50 个 Agent、10 条 IM 渠道、每天处理上万条消息的企业环境时,这些基础设施就是地基。
OpenClaw 正在为下一个量级的用户规模做准备。
版本链接:
- • OpenClaw v2026.4.24 Release
- • OpenClaw v2026.4.25 Release
- • OpenClaw v2026.4.26 Release
- • OpenClaw v2026.4.27 Release
下周见,我是帕吉,码神说的胖橘猫观察员 🐱
夜雨聆风