乐于分享
好东西不私藏

OpenClaw v2026.5.18 发布:Android 语音交互来了,还有这些实用新功能

OpenClaw v2026.5.18 发布:Android 语音交互来了,还有这些实用新功能

OpenClaw v2026.5.18 发布:Android 语音交互来了,还有这些实用新功能

沉寂了几周的 OpenClaw 终于更新了,而且是个大版本。

2026.5.18 带了大动作——Android 端终于有了真正意义上的实时语音对话,不再是录一段发一段的古老模式。同时 Mac app 的设置界面重写了,浏览器自动化支持弹窗处理,还有几个新 skill 值得重点关注。

来一条一条看。


1. Android Talk Mode:真正的实时语音对话

这是本次更新最值得注意的功能。

之前 Android 版 Talk Mode 本质上是”录 → 发 → 等 → 播放”,延迟高体验差。这次改成了实时 Gateway 中继语音会话,支持:

  • 流式麦克风输入(边说边传)
  • 实时音频回放
  • 工具调用结果语音桥接
  • 屏幕上直接显示转录文本

简单说,你终于可以在 Android 上体验到接近真人对话的延迟了。说话、被打断、追问——都能实时响应。


2. Mac app Settings 全新 UI

Mac 桌面客户端的设置页面这波重写了,具体改进:

  • 所有面板统一成卡片式布局
  • 导航加入缓存机制,切换更顺滑
  • 权限、语音、Skills、Cron、Exec、Debug 各个 tab 视觉更干净
  • 侧边栏间距调整,视觉更稳

之前 Mac 版设置页被吐槽最多的就是”乱”和”切换迟钝”,这次看起来是认真解决了一波。


3. 浏览器自动化支持弹窗处理

之前 OpenClaw 的浏览器自动化遇到 window.alertwindow.confirm 弹窗会直接卡住,只能手动点掉。

现在支持了:

  • 快照中显示当前待处理和最近处理过的弹窗
  • 遇到弹窗时返回 blockedByDialog,不会傻等
  • 可以用 browser dialog --dialog-id <id> 直接答题

这意味着自动化流程终于能跑完整的交互式网页了,比如带验证码确认、弹窗公告、权限请求这些场景。


4. 两个新 skill:meme-maker 和 python-debugging

meme-maker

表情包制作 skill,支持:

  • 模板搜索(精选模板库)
  • 本地 SVG/PNG 渲染
  • Imgflip 在线渲染
  • Know Your Meme 出处链接

做技术梗图、团队表情包这回有官方工具了,不用再去找第三方网站。

python-debugging

Python 调试 skill,支持:

  • pdb 调试
  • breakpoint() 断点
  • 事后剖析(post-mortem inspection)
  • debugpy 远程附加

直接对标 VS Code 的 Python 调试体验,但跑在 OpenClaw 的 agent 环境里,适合自动化调试场景。


5. CLI plugins 开发更方便

新版加入了 defineToolPlugin 以及三个新命令:

openclaw plugins build     # 构建插件
openclaw plugins validate   # 验证插件
openclaw plugins init       # 初始化新插件

生成带元数据的清单文件,支持可选的工具声明和上下文工厂。对想自建工具插件的开发者来说门槛降低了不少。


6. Docker/Podman 镜像构建改进

新增 OPENCLAW_IMAGE_APT_PACKAGES 作为运行时中立的镜像构建参数,用于在镜像构建时装额外的 apt 包。

之前只有 OPENCLAW_DOCKER_APT_PACKAGES 这个旧版参数,现在两套并存,迁移更平滑。


7. Gateway 重启速度优化

两个 PR(#83300 和 #83301)改了 Gateway 重启逻辑:

  • 启动探针、配置、运行时、资源计数成本现在会归因到重启追踪中(不影响就绪状态判断)
  • 启动日志和插件服务启动与 channel sidecar 并行重叠
  • 减少重启后的就绪延迟,但保留 /readyz sidecar 门控

实测下来 Gateway 重启比之前快了一截——对于经常修改配置的开发者来说是好事。


8. Proxy 支持 HTTPS 和自定义 CA

Proxy 层这次加了两个重要能力:

  • 支持 HTTPS 托管的前向代理端点
  • 支持 proxy.tls.caFile 针对代理端点 TLS 的 CA 信任配置

企业内网环境配代理更灵活了。


9. QA-Lab 测试框架大幅增强

这个版本 QA-Lab 改动很多,主要集中在以下几点:

  • 新增 20 轮和可选 100 轮的运行时一致性测试场景
  • 引入 tier 元数据(standard 和 soak QA gates)
  • 支持 openclaw qa suite --runtime-parity-tier 切换测试级别
  • 工具覆盖率通过 openclaw qa coverage --tools 暴露
  • 新增个人 agent 审批/拒绝场景验证(本地读取被拒时干净退出,不泄露工具进度)
  • 新增本地任务后续跟踪场景(pending / blocked / done 状态上报)

说人话:OpenClaw 的自动化测试这次补了很多覆盖盲区,发布质量更有保证了。


10. 其他值得注意的更新

  • Skills CLIopenclaw skills installupdate 现在支持 --global 参数,共享托管 skills 可以全局安装了
  • Obsidian skill 更新:改用官方 obsidian CLI,不再依赖第三方 obsidian-cli
  • Codex 集成改进:OpenClaw prompt 引导按运行时 surface 区分,Codex 原生模式下保持独立的 base/personality 指令
  • Discord 语音优化:修复了 OpenAI realtime 场景下后续对话听不到的问题

怎么更新

如果你用 Homebrew:

brew upgrade openclaw

如果用 Docker:

docker pull openclaw/openclaw:latest

Android 用户去应用商店更新即可,这次语音体验会有明显感知的变化。


有什么新功能你特别想试的?或者之前被某个痛点卡住的,欢迎留言告诉我,我来帮你跑通。