OpenClaw 2026.4.22 重磅更新:全面拥抱 xAI Grok,图像+语音多模态全面爆发!

OpenClaw 2026.4.22是 OpenClaw 的最新版本更新(发布于 2026 年 4 月 23 日左右),重点新增了xAI(Grok)的图像生成、语音合成(TTS)和语音转文字(STT)全面支持,以及多项功能增强和修复。
主要 Changes(新增/改进功能)
Providers/xAI:新增图像生成(包括grok-imagine-image/grok-imagine-image-pro和参考图像编辑)、文本转语音(支持 6 个实时 xAI 语音、MP3/WAV/PCM/G.711 格式)、语音转文字(grok-stt音频转录和 Voice Call 实时转录)。
github.com
Providers/STT:为 Deepgram、ElevenLabs 和 Mistral 添加 Voice Call 流式转录支持;ElevenLabs 额外支持 Scribe v2 批量音频转录。
TUI:新增本地嵌入模式,可在无 Gateway 的情况下运行终端聊天,同时保持插件批准门控。
Onboarding:自动安装缺失的 provider 和 channel 插件,简化首次配置。
Models/commands:新增/models add命令,从聊天中注册模型,无需重启 Gateway。
Providers/Tencent:新增捆绑的 Tencent Cloud provider 插件,支持 Hy3 模型等。
WhatsApp:支持可配置的原生回复引用(replyToMode)和 per-group/per-direct systemPrompt 配置。
Agents/sessions:新增 mailbox-style 会话列表过滤(label、agent、search)和预览。
Control UI:新增浏览器本地个人身份(名称 + 头像),优化布局和个性化显示。
Gateway/diagnostics:默认启用稳定性记录,并支持导出诊断包(日志、状态、配置等)。
其他:OpenAI Responses 自动使用原生 web_search;GPT-5 prompt overlay 共享;本地后端 token 统计优化;插件加载性能提升等。
github.com
Fixes(修复)
-
思考(thinking)默认级别调整、更准确的状态报告。 -
插件安装、会话维护、图像生成(Azure 支持)、Telegram 缓存等多个 bug 修复。
权限、认证、内存搜索、性能优化等多项改进。
夜雨聆风