OpenClaw v2026.5.18 发布:Android 语音交互来了,还有这些实用新功能
OpenClaw v2026.5.18 发布:Android 语音交互来了,还有这些实用新功能
沉寂了几周的 OpenClaw 终于更新了,而且是个大版本。
2026.5.18 带了大动作——Android 端终于有了真正意义上的实时语音对话,不再是录一段发一段的古老模式。同时 Mac app 的设置界面重写了,浏览器自动化支持弹窗处理,还有几个新 skill 值得重点关注。
来一条一条看。
1. Android Talk Mode:真正的实时语音对话
这是本次更新最值得注意的功能。
之前 Android 版 Talk Mode 本质上是”录 → 发 → 等 → 播放”,延迟高体验差。这次改成了实时 Gateway 中继语音会话,支持:
-
流式麦克风输入(边说边传) -
实时音频回放 -
工具调用结果语音桥接 -
屏幕上直接显示转录文本
简单说,你终于可以在 Android 上体验到接近真人对话的延迟了。说话、被打断、追问——都能实时响应。
2. Mac app Settings 全新 UI
Mac 桌面客户端的设置页面这波重写了,具体改进:
-
所有面板统一成卡片式布局 -
导航加入缓存机制,切换更顺滑 -
权限、语音、Skills、Cron、Exec、Debug 各个 tab 视觉更干净 -
侧边栏间距调整,视觉更稳
之前 Mac 版设置页被吐槽最多的就是”乱”和”切换迟钝”,这次看起来是认真解决了一波。
3. 浏览器自动化支持弹窗处理
之前 OpenClaw 的浏览器自动化遇到 window.alert 或 window.confirm 弹窗会直接卡住,只能手动点掉。
现在支持了:
-
快照中显示当前待处理和最近处理过的弹窗 -
遇到弹窗时返回 blockedByDialog,不会傻等 -
可以用 browser dialog --dialog-id <id>直接答题
这意味着自动化流程终于能跑完整的交互式网页了,比如带验证码确认、弹窗公告、权限请求这些场景。
4. 两个新 skill:meme-maker 和 python-debugging
meme-maker
表情包制作 skill,支持:
-
模板搜索(精选模板库) -
本地 SVG/PNG 渲染 -
Imgflip 在线渲染 -
Know Your Meme 出处链接
做技术梗图、团队表情包这回有官方工具了,不用再去找第三方网站。
python-debugging
Python 调试 skill,支持:
-
pdb 调试 -
breakpoint()断点 -
事后剖析(post-mortem inspection) -
debugpy 远程附加
直接对标 VS Code 的 Python 调试体验,但跑在 OpenClaw 的 agent 环境里,适合自动化调试场景。
5. CLI plugins 开发更方便
新版加入了 defineToolPlugin 以及三个新命令:
openclaw plugins build # 构建插件
openclaw plugins validate # 验证插件
openclaw plugins init # 初始化新插件
生成带元数据的清单文件,支持可选的工具声明和上下文工厂。对想自建工具插件的开发者来说门槛降低了不少。
6. Docker/Podman 镜像构建改进
新增 OPENCLAW_IMAGE_APT_PACKAGES 作为运行时中立的镜像构建参数,用于在镜像构建时装额外的 apt 包。
之前只有 OPENCLAW_DOCKER_APT_PACKAGES 这个旧版参数,现在两套并存,迁移更平滑。
7. Gateway 重启速度优化
两个 PR(#83300 和 #83301)改了 Gateway 重启逻辑:
-
启动探针、配置、运行时、资源计数成本现在会归因到重启追踪中(不影响就绪状态判断) -
启动日志和插件服务启动与 channel sidecar 并行重叠 -
减少重启后的就绪延迟,但保留 /readyzsidecar 门控
实测下来 Gateway 重启比之前快了一截——对于经常修改配置的开发者来说是好事。
8. Proxy 支持 HTTPS 和自定义 CA
Proxy 层这次加了两个重要能力:
-
支持 HTTPS 托管的前向代理端点 -
支持 proxy.tls.caFile针对代理端点 TLS 的 CA 信任配置
企业内网环境配代理更灵活了。
9. QA-Lab 测试框架大幅增强
这个版本 QA-Lab 改动很多,主要集中在以下几点:
-
新增 20 轮和可选 100 轮的运行时一致性测试场景 -
引入 tier 元数据(standard 和 soak QA gates) -
支持 openclaw qa suite --runtime-parity-tier切换测试级别 -
工具覆盖率通过 openclaw qa coverage --tools暴露 -
新增个人 agent 审批/拒绝场景验证(本地读取被拒时干净退出,不泄露工具进度) -
新增本地任务后续跟踪场景(pending / blocked / done 状态上报)
说人话:OpenClaw 的自动化测试这次补了很多覆盖盲区,发布质量更有保证了。
10. 其他值得注意的更新
-
Skills CLI: openclaw skills install和update现在支持--global参数,共享托管 skills 可以全局安装了 -
Obsidian skill 更新:改用官方 obsidian CLI,不再依赖第三方 obsidian-cli -
Codex 集成改进:OpenClaw prompt 引导按运行时 surface 区分,Codex 原生模式下保持独立的 base/personality 指令 -
Discord 语音优化:修复了 OpenAI realtime 场景下后续对话听不到的问题
怎么更新
如果你用 Homebrew:
brew upgrade openclaw
如果用 Docker:
docker pull openclaw/openclaw:latest
Android 用户去应用商店更新即可,这次语音体验会有明显感知的变化。
有什么新功能你特别想试的?或者之前被某个痛点卡住的,欢迎留言告诉我,我来帮你跑通。
夜雨聆风