OpenClaw 2026.4.22 重磅更新:全面拥抱 xAI Grok,图像+语音多模态全面爆发!

OpenClaw 2026.4.22是 OpenClaw 的最新版本更新（发布于 2026 年 4 月 23 日左右），重点新增了xAI（Grok）的图像生成、语音合成（TTS）和语音转文字（STT）全面支持，以及多项功能增强和修复。

主要 Changes（新增/改进功能）

Providers/xAI：新增图像生成（包括grok-imagine-image/grok-imagine-image-pro和参考图像编辑）、文本转语音（支持 6 个实时 xAI 语音、MP3/WAV/PCM/G.711 格式）、语音转文字（grok-stt音频转录和 Voice Call 实时转录）。

github.com

Providers/STT：为 Deepgram、ElevenLabs 和 Mistral 添加 Voice Call 流式转录支持；ElevenLabs 额外支持 Scribe v2 批量音频转录。

TUI：新增本地嵌入模式，可在无 Gateway 的情况下运行终端聊天，同时保持插件批准门控。

Onboarding：自动安装缺失的 provider 和 channel 插件，简化首次配置。

Models/commands：新增/models add命令，从聊天中注册模型，无需重启 Gateway。

Providers/Tencent：新增捆绑的 Tencent Cloud provider 插件，支持 Hy3 模型等。

WhatsApp：支持可配置的原生回复引用（replyToMode）和 per-group/per-direct systemPrompt 配置。

Agents/sessions：新增 mailbox-style 会话列表过滤（label、agent、search）和预览。

Control UI：新增浏览器本地个人身份（名称 + 头像），优化布局和个性化显示。

Gateway/diagnostics：默认启用稳定性记录，并支持导出诊断包（日志、状态、配置等）。

其他：OpenAI Responses 自动使用原生 web_search；GPT-5 prompt overlay 共享；本地后端 token 统计优化；插件加载性能提升等。

github.com

Fixes（修复）

思考（thinking）默认级别调整、更准确的状态报告。
插件安装、会话维护、图像生成（Azure 支持）、Telegram 缓存等多个 bug 修复。

权限、认证、内存搜索、性能优化等多项改进。