乐于分享
好东西不私藏

OpenClaw 2026.4.22 重磅更新:全面拥抱 xAI Grok,图像+语音多模态全面爆发!

OpenClaw 2026.4.22 重磅更新:全面拥抱 xAI Grok,图像+语音多模态全面爆发!

OpenClaw 2026.4.22是 OpenClaw 的最新版本更新(发布于 2026 年 4 月 23 日左右),重点新增了xAI(Grok)的图像生成、语音合成(TTS)和语音转文字(STT)全面支持,以及多项功能增强和修复。

主要 Changes(新增/改进功能)

Providers/xAI:新增图像生成(包括grok-imagine-image/grok-imagine-image-pro和参考图像编辑)、文本转语音(支持 6 个实时 xAI 语音、MP3/WAV/PCM/G.711 格式)、语音转文字(grok-stt音频转录和 Voice Call 实时转录)。

github.com

Providers/STT:为 Deepgram、ElevenLabs 和 Mistral 添加 Voice Call 流式转录支持;ElevenLabs 额外支持 Scribe v2 批量音频转录。

TUI:新增本地嵌入模式,可在无 Gateway 的情况下运行终端聊天,同时保持插件批准门控。

Onboarding:自动安装缺失的 provider 和 channel 插件,简化首次配置。

Models/commands:新增/models add命令,从聊天中注册模型,无需重启 Gateway。

Providers/Tencent:新增捆绑的 Tencent Cloud provider 插件,支持 Hy3 模型等。

WhatsApp:支持可配置的原生回复引用(replyToMode)和 per-group/per-direct systemPrompt 配置。

Agents/sessions:新增 mailbox-style 会话列表过滤(label、agent、search)和预览。

Control UI:新增浏览器本地个人身份(名称 + 头像),优化布局和个性化显示。

Gateway/diagnostics:默认启用稳定性记录,并支持导出诊断包(日志、状态、配置等)。

其他:OpenAI Responses 自动使用原生 web_search;GPT-5 prompt overlay 共享;本地后端 token 统计优化;插件加载性能提升等。

github.com

Fixes(修复)

  • 思考(thinking)默认级别调整、更准确的状态报告。
  • 插件安装、会话维护、图像生成(Azure 支持)、Telegram 缓存等多个 bug 修复。

权限、认证、内存搜索、性能优化等多项改进。