OpenClaw 2026.5.18:Android 实时语音、Mac 设置改版、HTTPS 正向代理、类型化插件 SDK、更快
OpenClaw 2026.5.18:Android 实时语音、Mac 设置改版、HTTPS 正向代理、类型化插件 SDK、更快的 Gateway 重启
本次更新横跨 Gateway 性能优化、Mac 应用界面大改、Android 实时语音通话、插件 SDK 类型化支持、HTTPS 正向代理及 QA 自动化测试框架扩展等多个方向,同时修复了 Telegram、Discord、QQBot、Codex app-server、Milvus 等领域的一批稳定性问题。
版本概览
-
Android Talk Mode:切换到 Gateway 实时语音中继,支持流式麦克风输入、实时音频播放、工具结果桥接和屏幕文字转录(感谢 @sliekens) -
Mac 设置页重新设计:统一卡片布局、缓存导航、更整洁的权限/语音/Skills/Cron/Exec/Debug 面板 -
Gateway 启动加速:优化启动日志与插件服务启动时序,与 channel sidecar 重叠降低重启就绪延迟 -
HTTPS 正向代理:支持托管正向代理端点 HTTPS 及作用域 proxy.tls.caFile CA 信任 -
类型化插件 SDK:新增 defineToolPlugin+openclaw plugins build|validate|init,从清单元数据生成类型化工具插件 -
新 Skills:meme-maker(梗图制作)、node inspector 调试、Python pdb/debugpy 技能、fused diagram 生成技能 -
Browser 对话框增强:快照中显示待处理和刚处理的模态对话框,支持 dialog-id应答 -
QA-Lab 大幅扩展:新增 20-turn/100-turn 运行对比场景、工具覆盖率报告、实时 canary 检测、审批拒绝场景等 -
Docker/Podman:新增 OPENCLAW_IMAGE_APT_PACKAGES构建参数 -
依赖更新:@openclaw/proxyline → 0.3.3,Pi packages → 0.75.1,Node.js 最低版本提升至 22.19
完整更新日志
Changes
-
Agents:明确修复应默认采用干净的有界重构、精简内部逻辑,并给出显式的插件 SDK/API 弃用路径 -
依赖:@openclaw/proxyline 更新至 0.3.3 -
依赖:Pi packages 更新至 0.75.1,Node.js 最低版本提升至 22.19 -
Docker/Podman:新增 OPENCLAW_IMAGE_APT_PACKAGES作为运行时无关的镜像构建参数,保留OPENCLAW_DOCKER_APT_PACKAGES作为向后兼容 -
Gateway/ACPX:在重启 trace 中标记启动探测、配置、运行时和资源计数开销,不影响就绪行为(感谢 @samzong) -
Gateway:将启动日志和插件服务启动与 channel sidecar 重叠,降低重启就绪延迟(感谢 @samzong) -
Plugins/admin-http-rpc:允许受信的管理员 HTTP RPC 客户端启动并等待 Web QR 登录流程(感谢 @liorb-mountapps) -
Mac 应用:重新设计设置页面,采用统一卡片布局、缓存导航、更整洁的权限/语音/Skills/Cron/Exec/Debug 面板 -
Skills:重命名仓库内的 Codex closeout review 技能和助手为 autoreview,保留 Codex 优先的回退行为 -
Skills:新增 meme-maker 技能,支持精选模板搜索、本地 SVG/PNG 渲染、Imgflip 托管渲染和 Know Your Meme 出处链接 -
Browser:在快照中显示待处理和刚处理的模态对话框,当动作打开模态框时返回 blockedByDialog,支持 dialog-id应答 -
Agents/tools:缩短内置工具描述和模式提示,保留路由护栏 -
Skills:新增 node inspector 调试、fused diagram 生成和 throwaway spike workflow 技能 -
CLI/plugins:新增 defineToolPlugin及openclaw plugins build|validate|init,用于类型化简单工具插件,支持清单元数据、可选工具声明和上下文工厂 -
Agents/skills:收紧内置技能提示和元数据,引用技能描述,刷新 CLI/API 指引 -
Skills:更新 Obsidian 技能,目标为官方 obsidian CLI,要求注册二进制而非第三方 obsidian-cli -
Skills:新增 Python 调试技能,支持 pdb、breakpoint()、事后检查和 debugpy 远程附加 -
Plugins/messages:为 channel renderer 添加呈现能力限制,适配富消息控件,标记旧版 interactive/Slack 指令生产者 API 为弃用 -
Proxy:支持 HTTPS 托管正向代理端点及作用域 proxy.tls.caFile CA 信任(感谢 @jesse-merhi) -
QA-Lab:新增首次 20-turn 及可选的 100-turn 运行时对比场景,包含标准和浸泡 QA 门禁元数据 -
QA-Lab:新增 openclaw qa suite --runtime-parity-tier,将标准 Codex-vs-Pi 层级接入发布检查 -
QA-Lab:新增仅在线 Codex Pi-shaped Read 词汇 canary,捕获原生 workspace-read 提示兼容性漂移 -
QA-Lab:新增仅在线 harness 自检场景,覆盖插件钩子崩溃、清单合约错误和 WebChat 直接回复自消息路由 -
QA-Lab:新增运行时工具 fixture 场景和覆盖率报告,覆盖 Codex 原生 workspace 工具、OpenClaw 动态工具和可选插件工具 -
QA-Lab:通过 openclaw qa coverage --tools暴露运行时工具 fixture 覆盖率 -
QA-Lab:在所有在线 QA 工作流中调度 live-frontier Codex-vs-Pi 运行时 token 效率产物 lane -
QA-Lab:在标准 Codex-vs-Pi 层级中硬门禁 OpenClaw 动态运行时工具漂移 -
QA-Lab:新增个人代理审批拒绝场景,确保拒绝的本地读取干净停止 -
QA-Lab:扩展个人代理基准包,增加本地任务跟进场景 -
Gateway/performance:新增 pnpm test:restart:gateway基准测试工具集 -
Android:切换到 Gateway 实时语音中继会话,支持流式麦克风输入、实时音频播放、工具结果桥接和屏幕文字转录(感谢 @sliekens)
Fixes
-
Discord/OpenAI:保持实时 Discord 语音会话在 OpenAI realtime 下能听到后续轮次,预缓冲助手播放避免卡顿(感谢 @Solvely-Colin) -
Media:防止图片元数据探测调用未识别的外部解码器,阻止真实处理错误后的回退链 -
Media:Sharp 不可用时回退到 sips、Windows 原生成像、ImageMagick、GraphicsMagick 或 ffmpeg(感谢 @scotthuang) -
Telegram:通过保留 topic ID,将生成的媒体补全投递回论坛主题(感谢 @fuller-stack-dev) -
Gateway:将更新检查启动推迟到就绪后,不再阻塞 sidecar 就绪启动 -
Telegram:防止 /btw 和只读状态命令中止正在运行的会话 -
Agents/video:除非注册的视频提供商支持音频输入,否则隐藏 video_generate 的参考音频参数 -
Plugins/xAI:在 OAuth 授权码 token 交换中回显 PKCE challenge 字段(感谢 @fuller-stack-dev) -
Codex app-server:在排队运行之前水合当前入站图片附件,使 Responses 后端代理接收 Discord 图片作为原生视觉输入(感谢 @iannwu) -
Codex app-server:保持原生代码模式可用,不强制仅代码模式,使 OpenClaw 动态工具轮次可通过 app-server 工具桥完成(感谢 @daswass) -
发布稳定性:恢复卡顿的会话诊断和 Codex OAuth 回退状态(感谢 @100yenadmin) -
Messages/TTS:在消息工具发送到达核心、Gateway 或插件投递前应用 TTS 指令(感谢 @CG-Intelligence-Agent-Jack 和 @CoronovirusG10) -
Codex app-server:在 OpenClaw 沙箱允许出站时保持沙箱化 Codex 代码模式的网络访问(感谢 @YusukeIt0) -
QA-Lab:保持 OTLP 烟雾检测器独立于已移除的内部 OpenTelemetry 生成根 -
Messages:将群组/频道可见回复默认恢复为自动最终投递 -
CLI/TUI:强制独立 /exit 运行在 runTui 返回后终止(感谢 @fuller-stack-dev) -
Agents/code mode:在每个代理基础上遵守 code-mode 配置(感谢 @Kaspre) -
Agents/code mode:在 before_tool_call 钩子中保留代理、会话、运行和频道上下文 -
QQBot:缩短 C2C 输入指示器为 5 秒窗口,每 5 秒续期 -
Replies:在实时预览更新后保持最终负载投递 -
Discord:在进度模式预览流中投递最终回复而非去重 -
Providers/Xiaomi:将 MiMo Anthropic 兼容的 reasoning_content 重播为提供商要求的 thinking 块(感谢 @Xgenious7) -
Agents/exec approvals:在代理拥有的 Gateway 审批调用上转发审批运行时凭据(感谢 @IWhatsskill、@Patrick-Erichsen 和 @jesse-merhi) -
Gateway/skills:预检远程 macOS skill-bin 刷新,使用 WebSocket 连接检查 -
CLI/config:确保未引用失效已发现插件不导致 config validate 失败 -
GitHub Copilot:在分发前丢弃不安全的原生 Responses reasoning 回放项(感谢 @galiniliev) -
Agents/Codex:当显式请求的 Codex harness 未注册时失败关闭而非静默尝试配置的模型回退(感谢 @r2-vibes) -
QA-Lab:使运行时工具覆盖率在缺少必需工具练习时失败 -
Core/plugins:加固 clawpatch 上报的边缘情况 -
UI:以纯标签而非泄露内部覆写文本显示 reasoning 选项 -
Mac 应用:多个 UI 修复(避免标题重复、保持侧边栏可见、改善 SSH 隧道、Gateway 断开时功能可达等) -
Gateway/webchat:隐藏内部运行时上下文和其他 display:false 抄送消息(感谢 @EmpireCreator) -
CLI/help:保持 gateway/doctor/status/health 帮助注册脱离 action/runtime 导入(感谢 @dfguerrerom) -
Cron/Discord:保持显式 announce 运行在消息工具仅源回复模式(感谢 @Theralley) -
Telegram:保留论坛主题源目标在入站、音频预检和跳过消息钩子上下文中(感谢 @M00zyx) -
Telegram:在临时回退传输上重试 HTTP 421 Misdirected Request 发送失败(感谢 @MarsDoge) -
Telegram:当 Telegram 报告未找到消息线程时失败关闭主题发送 -
Config/subagents:移除被忽略的 agent-model timeoutMs 键(感谢 @giodl73-repo) -
Mac 应用:对齐 Sessions 设置面板边距 -
OpenAI/Codex:停止拒绝可用的 openai-codex GPT-5.1/GPT-5.2/GPT-5.3 模型引用(感谢 @galiniliev) -
Plugins/xAI:完成 OAuth 支持的 xAI 登录和 sidecar 身份验证修复(感谢 @Jaaneek) -
Codex app-server:在镜像抄送和轨迹导出中保留流式原生命令输出(感谢 @rozmiarD) -
Codex app-server:当聊天或发送者策略拒绝工具时失败关闭(感谢 @VACInc) -
Codex app-server:在过大的投影历史被截断时保留最近的上下文引擎消息(感谢 @VACInc) -
Codex app-server:保持 OpenClaw 会话生成可搜索,同时将 Codex 原生委托引导至原生子代理(感谢 @fuller-stack-dev) -
Codex app-server:在维护期间恢复孤立的无子 Codex 原生子代理任务镜像(感谢 @100yenadmin)
夜雨聆风