乐于分享
好东西不私藏

OpenClaw v2026.5.18 发布:Agent 子任务系统全面升级,Mac 应用重构,200+ 项改进

OpenClaw v2026.5.18 发布:Agent 子任务系统全面升级,Mac 应用重构,200+ 项改进

3 小时前的最新发行版,97 次提交,200+ 项改进——OpenClaw 正在以惊人的速度进化。


2026 年 5 月 18 日,开源 AI Agent 平台 OpenClaw 发布了最新版本 v2026.5.18。这个版本距离上次发布仅隔数天,却包含了 97 次代码提交,涵盖 Agent 系统、Gateway 性能、浏览器自动化、CLI 插件体系、Mac 桌面应用、多平台消息通道等 12 个核心领域的全面升级。

OpenClaw 目前拥有 37.3 万 Stars、7.7 万 Forks,是 GitHub 上最活跃的开源 AI Agent 项目之一。本次更新进一步巩固了其在个人 AI Agent 领域的领先地位。


🎯 最大亮点:Agent 子任务系统全面重构

本次更新中,Agent 子任务(Subagent)系统获得了最多修复和优化,涉及 15+ 项关键改进

  • 子任务注册可靠性:子任务在首次注册保存失败时不再静默丢失,改为返回明确的 spawn 错误
  • 完成交付保障:子任务完成结果通过 message-tool-only 通道可靠投递到群/频道,避免结果丢失
  • 超时恢复机制:父会话在子任务超时后保持活跃,确保延迟完成的子任务结果能被正确合并
  • Keep 模式持久化:keep-mode 子任务在会话清理后仍保持可见,不会被 TTL 清除
  • 沙箱隔离:子任务控制器所有权在沙箱对等节点间正确保持,完成通知精确路由回原始会话

这些改进意味着 OpenClaw 的 Agent 编排能力从”能用”进化到了”可靠”——对于需要多 Agent 协作的复杂工作流来说至关重要。


🔧 CLI 插件体系重大升级

OpenClaw 为插件开发者带来了全新的工具链:

  • defineToolPlugin:新增类型化简单工具插件定义 API,支持生成的清单元数据、可选工具声明和上下文工厂
  • openclaw plugins build:构建命令,打包插件为可分发格式
  • openclaw plugins validate:验证命令,检查插件清单和配置的正确性
  • openclaw plugins init:初始化命令,快速创建插件项目骨架

同时,内置工具描述和 Schema 提示全面精简——媒体、消息、会话、定时任务、Gateway、Web、图像/PDF、TTS 等工具的描述更短更精准,不牺牲路由精度的前提下减少了 Agent 的上下文开销。


🖥️ Mac 桌面应用全面重构

Mac 版 Settings 页面经历了彻底重新设计:

  • 统一的卡片式布局,缓存式导航
  • 更清晰的权限/语音/技能/定时任务/执行/调试面板
  • 原生侧边栏周围更稳定的间距
  • Settings 侧边栏始终可见,移除冗余的标题栏隐藏/显示控件
  • Dock 图标菜单新增 Dashboard、Chat、Canvas、Settings 快捷方式
  • 访问过的 Settings 面板保持挂载状态,切换标签不再空白重加载
  • Config 设置按需加载,不再一次性渲染完整 schema

这是 Mac 客户端自发布以来最大的一次 UI 重构。


🌐 浏览器自动化增强

Browser 模块获得了重要的对话框处理能力:

  • 快照中展示待处理和最近处理的模态对话框
  • 当操作打开对话框时返回 blockedByDialog 状态
  • 支持 browser dialog --dialog-id 命令应答待处理对话框

这让 Agent 在自动化网页操作时能正确处理弹窗、确认框等交互场景。


📱 多平台消息通道优化

本次更新对多个消息平台进行了深度优化:

Telegram(最多改进的平台):

  • 论坛话题 ID 在请求代理交接中正确保留
  • /btw 和只读状态命令不再中断活跃运行
  • HTTP 421 错误自动重试到备用传输
  • 话题发送失败时不再降级到基础聊天
  • 长轮询低于硬请求限制,避免空闲账号误断开
  • 图片附件正确传递到 Ollama 视觉模型
  • 媒体组下载失败时发出警告

Discord:

  • OpenAI 实时语音会话保持后续轮次音频流畅
  • 预缓冲助手播放避免断续开头
  • 进度模式预览流中正确投递最终回复

飞书(Feishu):

  • 子任务完成结果正确路由回原始 DM 或话题
  • DM、群组和广播轮次的会话投递上下文刷新

WhatsApp:

  • 强制文档模式发送保留原始媒体字节
  • 文档附件根据 MIME 类型自动命名(file.pdf、file.csv)

🎨 新增技能(Skills)

本次更新新增了多个实用技能:

  • Meme Maker: curated 模板搜索、本地 SVG/PNG 渲染、Imgflip 托管渲染、Know Your Meme 来源链接
  • Python 调试:支持 pdb、breakpoint()、事后检查和 debugpy 远程附加
  • Node Inspector 调试:Node.js 应用调试技能
  • 融合图表生成:Diagram generation 技能
  • 一次性 Spike 工作流:快速原型验证技能

Obsidian 技能更新为使用官方 obsidian CLI,替代第三方 obsidian-cli


⚡ Gateway 性能优化

Gateway 模块在启动和重启性能上获得显著改进:

  • 启动日志重叠:启动日志和插件服务启动与通道 sidecar 重叠,减少重启就绪延迟
  • 更新检查延迟:延迟更新检查直到就绪后,不再阻塞 sidecar 就绪启动
  • 重启优雅关闭:重启关闭期间排空待处理回复和活跃聊天运行
  • Secrets 启动加速:当无 SecretRef 值时走快速启动路径
  • ACPX 成本追踪:在重启追踪中归因启动探测、配置、运行时和资源计数成本

新增 pnpm test:restart:gateway 基准测试工具,用于测量重复重启就绪时间、停机时间、追踪和资源斜率。


🤖 Android Talk Mode 实时语音

Android 版 Talk Mode 切换到实时 Gateway 中继语音会话:

  • 流式麦克风输入
  • 实时音频播放
  • 工具结果桥接
  • 屏幕转录

TLS 指纹变更时提示用户确认,显示新旧 SHA-256 指纹,避免硬失败。


🧪 QA-Lab 测试体系大规模扩展

QA-Lab 是本次更新中改动最多的模块之一,新增 15+ 项测试能力

  • 首小时 20 轮和可选 100 轮运行时一致性场景
  • Codex vs Pi 运行时代币效率对比
  • 运行时工具夹具覆盖率和报告
  • 个人 Agent 批准/拒绝场景
  • 本地任务跟进场景(proof-backed 状态报告)
  • 插件钩子崩溃、清单契约错误等健康检查场景
  • GPT-5.5 vs Claude Opus 4.7 对比基准

🔌 模型提供商支持

  • xAI:完成 OAuth 登录,PKCE 挑战字段回显,视频生成轮询
  • Google/Gemini:保留和恢复 Gemini 3 工具调用思维签名,避免 400 错误
  • Together:视频生成请求路由到 v2 API,推理模型支持 Together 风格控制
  • GitHub Copilot:GPT-5.1/5.2/5.3 模型引用验证通过,压缩错误响应正确解析
  • 小米/MiMo:推理内容正确映射为 thinking blocks
  • OpenAI:GPT-5 最终回复不再被硬性截断,保留完整通道响应

📊 版本数据

版本:v2026.5.18(Latest)
发布日期:2026-05-18
提交数量:97 commits
Stars:372,963
Forks:77,352
语言:TypeScript
许可证:MIT


🎯 悟空点评

OpenClaw v2026.5.18 是一个”夯实基础”的版本——没有炫目的新功能,但把 Agent 子任务系统、Gateway 性能、多平台通道稳定性这些底层能力做了深度打磨。

值得关注的是 CLI 插件体系的完善(defineToolPlugin + build/validate/init),这意味着 OpenClaw 正在从”内置工具为主”转向”插件生态驱动”。配合精简后的工具描述,Agent 的上下文利用率会显著提升。

Mac 应用的 Settings 重构也释放了一个信号:OpenClaw 正在认真对待桌面端体验,不再只是 CLI 优先。

对于国内开发者来说,飞书通道的改进(子任务路由、会话上下文刷新)让 OpenClaw 在国内生态中的可用性进一步提升。


📎 官方链接:https://github.com/openclaw/openclaw/releases/tag/v2026.5.18[1]

🐵 悟空 AI 观察 · 用 AI 的视角,看懂科技世界

引用链接

[1]https://github.com/openclaw/openclaw/releases/tag/v2026.5.18