乐于分享
好东西不私藏

OpenClaw 5.18 更新解读:从多渠道助手到完整 Agent 底座

OpenClaw 5.18 更新解读:从多渠道助手到完整 Agent 底座

OpenClaw 2026.5.18 已发布。官方 Release 里列出的变化很多,如果逐条看会显得零散:有 Gateway 启动和重启链路,有 Codex app-server,有插件 CLI,有 Mac App 设置页,也有 Telegram、Feishu、Discord、QQBot 等通道修复。

但把这些变化串起来看,方向其实非常明确:OpenClaw 正在从“多渠道 AI 助手”,走向一个更完整的个人 Agent Runtime。

5.18 的关键,不是“又多了几个功能”,而是 OpenClaw 开始补齐 Agent 真正长期运行时必须具备的底层能力。

本文拆解 6 个重点变化

01|Gateway:从入口服务到运行中枢
02|Codex:从代码生成到任务闭环
03|插件体系:从能扩展到可验证
04|Skills:从工具说明到工作流沉淀
05|多渠道:修的是细节,补的是真实场景
06|移动语音:Talk Mode 开始接近随身 Agent
CHANGE 01

Gateway:从入口服务,升级为运行中枢

Gateway 是 OpenClaw 的核心控制层。5.18 对 Gateway 的改动,不只是“启动更快”,而是让启动、重启、插件加载、通道 sidecar 准备状态变得更清楚。

这次变化主要集中在三点:

  • restart traces 会归因 startup probe、config、runtime、resource-count 等成本来源。
  • startup logging、plugin-service startup 和 channel sidecars 被部分重叠执行,用来减少 restart ready latency。
  • /readyz继续作为 sidecar gating 的就绪判断,保证启动状态可追踪。

这说明 OpenClaw 已经不再把 Gateway 当成一个“能跑起来就行”的入口服务,而是在把它打磨成长期在线 Agent 的运行中枢。

CHANGE 02

Codex:从“写代码”,走向任务闭环

这一版 Codex 相关更新非常密集。重点不是“能不能写代码”,而是 Codex 在 OpenClaw 的 Agent 链路中,能不能稳定接收上下文、处理多模态输入、调用工具并返回结果。

Codex app-server 的几个关键信号:

  • queued runs 前会补齐 inbound image attachments,让 Discord 等通道图片可以进入 Responses-backed agents 的原生视觉输入。
  • native code mode 不再被强制 code-mode-only,OpenClaw dynamic tool turns 可以通过 app-server tool bridge 完成。
  • stale session diagnostics、Codex OAuth fallback state、旧oauthRef兼容、上下文窗口预压缩等问题都被修复。

换句话说,Codex 在 OpenClaw 里正在从“代码生成入口”,变成一个更可靠的任务执行节点。

CHANGE 03

插件体系:从能扩展,到可构建、可校验

5.18 新增了defineToolPlugin,并加入openclaw plugins initbuildvalidate等流程。

这不是小改动,而是插件生态标准化的开始:

  • init用来初始化插件模板,降低插件开发门槛。
  • build用来生成 manifest metadata,让插件可以更规范地分发。
  • validate用来检查工具声明、插件配置和上下文工厂,减少运行时踩坑。

Agent 框架能不能长期发展,不只看内置工具有多少,更要看第三方能力能不能稳定接入、验证、分发和升级。5.18 在这个方向上迈了一步。

CHANGE 04

Skills:不只是工具说明,而是工作流沉淀

Skills 的变化也很有意思。它们不只是告诉模型“有哪些工具”,而是在沉淀具体工作场景。

5.18 新增或调整的 Skills 包括:

  • Python debugging skill:覆盖 pdb、breakpoint、post-mortem inspection、debugpy remote attach。
  • node inspector debugging、fused diagram generation、throwaway spike workflow skills。
  • meme-maker skill:支持模板搜索、本地 SVG/PNG 渲染、Imgflip hosted rendering 和 Know Your Meme provenance links。
  • Obsidian skill 改为面向官方obsidianCLI,而不是第三方obsidian-cli

这说明 OpenClaw 的 Skills 正在从“工具调用说明”变成“工程工作流模板”。对开发者来说,这比单纯多几个工具更重要。

CHANGE 05

多渠道:修的是细节,补的是真实场景

Telegram、Feishu、Discord、QQBot、Messages/TTS 都有修复。这类更新看起来不炫,但恰恰是多渠道 Agent 最容易翻车的地方。

这次多渠道相关变化非常具体:

  • Telegram 生成媒体后会保留 forum topic ID,避免回复跑到错误话题。
  • Telegram 对 HTTP 421 Misdirected Request 增加 fresh fallback transport 重试。
  • Feishu 会刷新 DM、群组、broadcast 的 inbound session delivery context,避免后续回复继承过期 WebChat 路由。
  • Discord realtime voice sessions 能继续听到 follow-up turns,并优化 assistant playback。
  • QQBot 缩短 C2C typing indicators,同时保留最终被动回复槽位。
  • final replies 在 preview streams 后仍能送达,避免只看到预览而丢失最终答案。

一个真正可用的 Agent,不只是模型会回答,而是回答必须回到正确的人、正确的群、正确的话题和正确的消息状态里。

CHANGE 06

Android Talk Mode:手机端开始接近“随身 Agent”

Android Talk Mode 切换到 realtime Gateway relay voice sessions,支持 streaming mic input、realtime audio playback、tool-result bridging 和 on-screen transcripts。

这意味着移动端不再只是聊天窗口:

  • 用户可以通过实时语音输入与 Agent 对话。
  • 模型和工具的结果可以回流到语音链路。
  • 屏幕上可以同步显示 transcript,让语音交互不再是黑盒。

如果未来桌面端、手机端、聊天通道都围绕 Gateway 打通,OpenClaw 会越来越像一个跨设备、跨通道、可调用本地工具的个人 AI 操作入口。

FINAL TAKE

这次更新真正释放的信号

OpenClaw 5.18 不是靠单点功能吸引注意力的版本。它更像是在补齐 Agent 系统的底层能力:运行中枢、任务执行、插件扩展、工作流沉淀、多渠道一致性和移动语音闭环。

一句话总结:OpenClaw 正在从“多渠道 AI 助手”,变成一个更完整的个人 Agent 底座。

5.18 重点变化速览

Gateway:启动、重启、sidecar 就绪链路更可观测
Codex:多模态输入、动态工具桥接、上下文与 OAuth 修复
Plugins:defineToolPlugin+ init/build/validate 流程
Skills:调试、图表、spike workflow、meme-maker 等工作流能力
Channels:Telegram、Feishu、Discord、QQBot 多通道消息补强
Mobile:Android Talk Mode 进入实时语音与工具闭环

— AI技术雷达 · 持续关注 AI Agent、开源模型与工程化工具 —

资料来源:OpenClaw v2026.5.18 Release