一眼看完
这次 2026.4.11 不是单点更新,而是一版同时包含新功能扩展、跨平台能力补强、工程侧改进,以及多条实际使用链路修复的综合更新。
最明显的变化是:
- • Dreaming / memory-wiki 可以直接查看更多导入内容
- • webchat 的媒体、回复、语音指令展示更完整了
- • 视频生成工具支持更多输入方式、交付方式、角色提示和比例控制能力
- • 飞书、Microsoft Teams、插件配置能力继续扩展
- • Codex OAuth、音频转写、Talk Mode、WhatsApp、Telegram、MiniMax OAuth 等链路修了一批实际问题
1. 新增功能
记忆与内容查看
- • Dreaming / memory-wiki 新增 ChatGPT 导入摄取能力
- • 新增了
Imported Insights和Memory Palace两个日记子标签。 - • 现在 Dreaming 可以直接在界面里查看导入的源聊天、编译后的 wiki 页面和完整来源页面。
界面展示与富内容输出
- • Control UI / webchat 的富内容展示继续补强
- • 助手输出的媒体、回复、语音指令,现在会以结构化聊天气泡的形式展示。
- • 同时新增了
[embed ...]富输出标签。 - • 外部 embed URL 改成受配置控制,而不是默认直接放开。
语音与生成
- •
- • 新增仅返回 URL 的生成资产交付方式。
- • 增加了类型化的
providerOptions。 - • 增加了参考音频输入支持。
- • 增加了每个资产的角色提示。
- • 增加了
adaptive自适应宽高比支持。 - • 提高了图片输入上限。
- • 这组改动的重点是,让视频提供方能暴露更丰富的生成模式,同时避免把大文件直接塞进内存。
video_generate 增加更多生成输入和交付能力平台与接口
- • Feishu 改进文档评论会话体验
- • 改进了文档评论会话的上下文解析。
- • 增加了评论反应能力。
- • 增加了输入中反馈。
- • 目标是让文档线程里的会话行为更接近普通聊天。
- • Microsoft Teams 新增 reaction 相关能力
- • 新增了消息表情反应支持。
- • 新增了反应列表。
- • 新增了 Graph 分页支持。
- • 新增了 delegated OAuth 配置流程,用于发送 reactions,同时保留 application-auth 的读取路径。
- • Plugins 的 setup 描述能力更强了
- • 插件 manifest 现在可以声明 activation descriptors。
- • 插件 manifest 现在也可以声明 setup descriptors。
- • 这样插件 setup 流程可以更明确地描述需要哪些授权、配对和配置步骤,而不必依赖核心层的硬编码特判。
模型与调试
- • Ollama 减少模型发现阶段的重复请求
- • 在模型发现阶段,会缓存
/api/show的上下文窗口元数据和能力元数据。 - • 重复刷新模型选择器时,不会再重新抓取没有变化的模型。
- • 如果响应为空,仍然会继续重试;如果 digest 发生变化,缓存会自动失效。
- • Models / providers 的调试信息更清楚了
- • 在嵌入式代理调试日志中,现在会显示已配置 OpenAI-compatible 端点的分类结果。
- • 这样本地端点和代理端点的路由问题会更容易排查。
QA 与测试
- • QA / parity 增加了新的模型对比闸门
- • 新增了 GPT-5.4 与 Opus 4.6 的 agentic parity report gate。
- • 同时增加了共享场景覆盖检查、更严格的证据启发式,以及 skipped scenario 统计,方便维护者审查。
2. 重点修复
登录与认证
- • OpenAI / Codex OAuth
- • 不再改写上游授权 URL 的 scopes。
- • 这样新的 Codex 登录流程,就不会在返回 authorization code 之前先因为
invalid_scope失败。 - • MiniMax / OAuth
- • 在
openclaw configure期间,会把api: "anthropic-messages"和authHeader: true写入minimax-portal配置补丁。 - • 这样重新认证后的 portal 配置还能继续正确走 Bearer 鉴权路由。
音频与语音
- • Audio transcription
- • 现在只对 OpenAI-compatible 的 multipart 请求关闭 pinned DNS。
- • 同时仍然保留 hostname 校验。
- • 这样 OpenAI、Groq、Mistral 的 transcription 能恢复正常工作,同时也没有把其他请求路径的约束一起放松。
- • macOS / Talk Mode
- • 第一次启用并授予麦克风权限后,Talk Mode 会继续启动。
- • 不再要求用户手动再切一次开关。
webchat 与代理输出
- • Control UI / webchat
- • agent-run 产生的 TTS 音频回复,现在会持久化到 webchat 历史记录里。
- • 同时也保留了交错 tool card 的正确配对关系。
- • 这样生成的音频和混合工具输出能继续挂在正确的消息上。
- • ACP / agents
- • commentary 阶段的 child assistant relay text,不再出现在 ACP 父会话的流式更新里。
- • 这样子助手运行时的内部进度文本不会再泄漏到父会话。
- • Codex / QA
- • Codex app-server 的协调杂音,不再出现在用户可见回复里。
- • 同时新增了 live QA leak 场景。
- • 如果出现泄漏的 harness 元文本,会被判定为 QA failure,而不是 successful reply。
平台消息链路
- • WhatsApp 默认账号问题修复
- • 当 active listener helper 没有显式提供 account id 时,现在会正确使用配置的默认账号。
- • 不再把具名默认账号错误注册到
default。 - • WhatsApp reaction 通路修复
- •
message react现在改走 gateway-owned action path。 - • 这样 reactions 在私聊和群聊里,都会使用 live WhatsApp listener,并和
message send、message poll走同一条通路。 - • Auto-reply / WhatsApp 图片路径保留修复
- • 在媒体理解之后,会继续保留入站图片附件说明。
- • 这样图片编辑时会保留真实保存下来的媒体路径,不再凭空生成一个不存在的本地路径。
- • Telegram / sessions
- • 当入站 turn 缺少
MessageThreadId时,topic-scoped session 初始化仍会落到标准的话题 transcript 路径上。 - • 同一个 topic session 不会再在 bare transcript 和 topic-qualified transcript 文件之间来回切换。
配置与运行时
- • Agents / timeouts
- • LLM idle watchdog 现在会遵守显式设置的 run timeout。
- • 默认 timeout 配置也做了对齐。
- • 这样慢模型可以工作到设定时限,而不会因为错误使用别的 idle window 被提前打断。
- • Agents / failover
- • assistant 侧的 fallback classification,现在只作用于当前 attempt。
- • 暴露给用户的 provider errors,也只来自当前 attempt。
- • 不再从旧 session history 里继承上一次 provider 的失败结果。
- • Config
- • 生成的 zod schema 现在包含
asyncCompletion。 - • 这样文档里已经说明的 async completion 配置,不会再被误判成 unrecognized-key。
生成与打包链路
- • Google / Veo
- • 不再发送不被支持的
numberOfVideos请求字段。 - • 这样 Gemini Developer API 的 Veo 调用,就不会在 OpenClaw 进入预期视频生成流程之前先失败。
- • QA / packaging
- • 打包后的 CLI 启动过程,不再读取仓库专用的 QA scenario markdown。
- • completion cache 生成过程,也不再读取这些仅仓库内部使用的 QA 文件。
- • npm release 现在会带上 bundled QA scenario pack。
- • 即使 QA setup 异常,
openclaw completion --write-state也还能继续工作。
3. 安全加固 / 配置变化 / 底层增强
- • 外部 embed URL 改成受配置控制
- • 这属于富内容展示边界的收紧。
- • 音频转写修复里仍保留 hostname 校验
- • 说明这次不是靠整体放松安全策略来换兼容性。
- •
- • 这是配置层一致性的修正。
- • 代理输出边界和错误归属范围继续收紧
- • 包括 ACP 子助手 commentary 泄漏、Codex / QA harness meta 泄漏、Agents / failover 错误归属范围等问题,都在继续往更可控的方向收紧。
asyncCompletion 被纳入 zod schema4. 用户反馈与版本观察
截至目前,在公开反馈渠道、issue 区、社区讨论区或其他可确认来源中,还没有看到明确指向“升级到这个版本后出现新问题”的集中反馈。
这说明目前暂时没有明显翻车迹象。
不过,这仍然不代表这个版本已经完全没有风险,因为:
- • 新版本发布时间还不长
- • 用户反馈通常会有滞后
- • 有些问题要等更多人升级后才会慢慢暴露
所以更实际的建议是:
- • 个人使用者:可以继续关注后续反馈,不必过度紧张
- • 正式环境或长期运行环境:升级前最好先备份
- • 如果不着急升级:可以先观察一两天再决定
5. 一句话总结
这是一版既在继续扩能力,也在补一批分散但关键的真实使用链路问题的综合更新。
夜雨聆风