OpenClaw 大版本发布:AI员工终于能唱歌了
今天凌晨(2026年5月17日),OpenClaw 发布了 v2026.5.16-beta.4,距离上一个版本只隔了不到一天。在过去72小时内,OpenClaw 连发了四个 beta 版本,节奏相当快。
这一波更新的核心不是修修补补,而是三个实质性新能力:内置音乐生成、三语本地化安装、以及 xAI Grok 免 API Key 登录。加上大量 bug 修复和性能优化,我来逐个说清楚。
01 内置音乐生成:AI 员工终于能”唱歌”了
这是本次最显眼的变化。
OpenClaw 在图片生成之后,正式新增了音乐生成能力。底层接入了 fal 和 OpenRouter 两个 provider,具体支持的模型包括:
- fal 侧:MiniMax、ACE、Stable Audio
- OpenRouter 侧:Lyria

图片生成和音乐生成现在走统一的任务生命周期。这意味着三件事:
第一,有状态跟踪。生成任务开始后,你可以在 Chat 里看到任务状态,而不是发出去就石沉大海。
第二,重复保护。同一个 prompt 短时间内重复发送,不会真的生成两份。
第三,message-tool 完成投递。音乐生成完成后,文件直接通过消息工具送到对话里,不用去找别的地方下载。
对普通用户来说,这意味着你的 AI 员工现在不只是打字,还可以给你”唱歌”。比如运营场景下需要一段背景音乐,直接让 Agent 调用即可。
02 xAI Grok OAuth:SuperGrok 用户免配置

如果你订阅了 SuperGrok,之前用 OpenClaw 调用 Grok 模型,需要自己在环境变量里配置 XAI_API_KEY。麻烦的地方在于:这个 Key 管理起来麻烦,而且换设备要重新配。
这次更新之后,SuperGrok 订阅用户可以直接用 Grok OAuth 登录。登录完成后,xai/* 全系模型和 xAI 的媒体/tool provider 全部免配置直接可用。
另外还有一个小优化:xAI 视频生成之前经常在 pending 阶段就失败报超时,新版改成持续轮询,直到真正拿到结果。这个问题困扰了不少人。
03 中文本地化:安装向导终于有中文了

这是国内用户等了很久的更新。
OpenClaw 的安装向导和频道设置流程,现在支持 简体中文、繁体中文、English 三种语言,由社区贡献者 @GaosCode 提交。
之前中文用户装 OpenClaw,看的是英文安装界面,很多专业名词卡在第一步。现在从安装到配置频道,全程中文,体验和英文用户对齐了。
04 Mac 远程配置:跳过引导,直接连
Mac 用户升级幅度也很大。OpenClaw 的 Mac App 远程配置做了四项改进:
预配置。通过 openclaw-mac configure-remote 可以预先写入配置,首次打开 App 直接跳过 onboarding 流程。
直连 LAN/Tailnet。支持直接填写局域网 IP 或 Tailnet gateway URL,不用绕弯。
SSH 隧道自管理。选 SSH 方式连接时,SSH 隧道进程由 App 自己拥有和管理,断开时自动清理。
对经常在多台 Mac 之间切换的用户,这个改进相当实用。
05 CLI / Cron 增强:定时任务可以”等待”了
定时任务一直有个痛点:任务触发之后,你没法让它”等某个事情完成再继续”。
新版新增了 openclaw cron run --wait 命令,支持:
--timeout:最长等待时间--poll-interval:轮询间隔--run-id精确过滤:只等特定的那一次手动运行
这个功能适合自动化场景:比如你有一条流水线,希望等人工确认某个环节之后,再自动跑下一步——现在可以写进 cron 里了。
06 Skills 缓存:响应速度提升
每次对话时,Skills 要经过”加载 → 解析 → 构建 snapshot”的过程。这个 snapshot 在每次新的 Gateway turn 里会重建一遍,浪费算力。
新版把解析好的 resolvedSkills 在热 Gateway turns 之间缓存,按 redacted effective config 复用。有两个好处:响应更快,token 消耗也更低。
07 其他值得注意的更新

Provider 配额显示。Control UI 的 Overview 卡和 Chat 页头,现在会直接显示当前 provider 的配额使用量。之前查配额要跳到别的地方,现在一目了然。
Group Chat 静默模式。新增 messages.groupChat.unmentionedInbound: "room_event" 配置。开启后,房间里的静默消息可以作为上下文存在,但只有通过 message tool 主动发送时才对外可见。这个模式适合”只听不说”的监控场景。
Agent / Subagent 任务交接可靠性。任务完成后,系统会标记为 “ready for parent review”,要求请求方 Agent 验证结果后再结束。多 Agent 协作场景下,不会再出现”任务说完成了,实际上还没做完”的情况。
大量 provider 兼容性修复。Kimi K2.6/Q2 推理内容回放、Qwen thinking 配置、xAI 视频轮询、MiniMax CN 端点等均有修复,覆盖了大部分国内常用模型。
08 升级建议

当前文章写作环境运行的是 v2026.5.10-beta.5(6天前的版本),最新版本为 v2026.5.16-beta.4。
升级方法:
openclaw update
或者直接去 GitHub Releases 页面下载最新安装包。
从功能上来说,这次更新的三个新能力(音乐生成、三语界面、xAI 免 Key)都是实质性功能,值得升级。不过 beta 版本建议看 changelog 确认没有阻断性 bug 再上生产。
你最想要哪个功能? 音乐生成、三语界面、还是 xAI 免 Key 登录?欢迎留言告诉我。
来源:OpenClaw v2026.5.16-beta.4 Release Notes
夜雨聆风