OpenClaw v2026.4.11发布

版本：v2026.4.11
发布日期：2026-04-12
https://github.com/openclaw/openclaw/releases/tag/v2026.4.11

📋 更新概览（10秒速读）

本次更新新增 9 项功能，修复 15 个问题，主要涉及 记忆系统、视频生成、多平台支持、用户体验优化。最重要的是 ChatGPT 记忆导入功能，让你能把 ChatGPT 的对话历史无缝迁移到 OpenClaw 的记忆宫殿中，跨平台的 AI 对话记忆终于可以统一管理了。

📣 功能更新

1. ChatGPT 记忆导入 + 记忆宫殿可视化

💡 大白话： 就像给 AI 的"大脑"装了个"导入窗口"，把你在 ChatGPT 聊过的内容一键搬过来。比如：你在 ChatGPT 上聊了 100 多次编程问题，积累了很多有用的经验，现在可以直接导入 OpenClaw，它会自动整理成"主题记忆卡片"，你还能在"记忆宫殿"里查看所有提炼出来的知识点、待解决的问题、发现的矛盾点。

影响范围：

原来是什么： 用户在不同平台（ChatGPT、Claude 等）积累的对话经验和知识点分散在各处，无法统一查看和复用，跨平台记忆管理成本高（来源：https://github.com/openclaw/openclaw/issues/64505）
现在是什么： 新增 Imported Insights 和 Memory Palace 两个日记子标签页，可以查看导入的 ChatGPT 对话、编译的 wiki 页面、完整源页面，直接从 UI 查看主题聚类、综合摘要、候选信号、矛盾点
针对哪些人群： 在多平台使用 AI、需要跨平台记忆管理的用户，希望复用历史对话经验的用户
有什么影响： 记忆变得可观测、可管理，ChatGPT 的对话经验不再"丢失"，可以持续积累和复用

实际更新内容： Dreaming 日记新增两个子标签页：Imported Insights（导入的 ChatGPT 对话，按主题聚类，含综合摘要、候选信号、修正信号，可点击查看完整源页面）和 Memory Palace（编译的 wiki 页面视图，包含主张、问题、矛盾或真实的综合/实体/概念内容）。

2. 控制台 UI 结构化聊天气泡 + 嵌入标签

💡 大白话： 就像把 AI 的"原生指令"翻译成"人类友好"的显示方式。比如：以前 AI 说要发一段语音，屏幕上会显示奇怪的 [[audio_as_voice]] 代码，现在会直接显示一个语音气泡，点击就能播放，体验更自然。

影响范围：

原来是什么： AI 的 MEDIA 指令、回复标签、语音指令等原生输出直接暴露在聊天界面，用户看到的是技术代码而非友好提示（来源：https://github.com/openclaw/openclaw/issues/64104）
现在是什么： 新增渲染层，将助理指令转换为结构化聊天气泡，新增 [embed ...] 富输出标签，外部嵌入 URL 需配置授权
针对哪些人群： 使用 Web 控制台的用户，需要查看 AI 生成内容（语音、图片、回复）的用户
有什么影响： 聊天界面更直观友好，不再显示原始技术代码，AI 输出可视化体验提升

实际更新内容： Control UI 新增助理指令渲染层，将 MEDIA 行、回复标签、[[audio_as_voice]] 转换为结构化 UI 元数据而非原始文本；新增 [embed ...] 富输出标签；外部嵌入 URL 需配置 gate；支持托管文档/助理媒体服务和授权管道。

3. 视频生成工具大升级：URL 直接输出 + 多音频输入 + 自适应宽高

💡 大白话： 就像把视频生成的"操控面板"变得更灵活、更省内存。比如：你想让 AI 生成一段带背景音乐的视频，以前要把音频文件上传到内存里处理，现在可以直接传音频 URL，还能指定第一帧用什么图片、最后一帧用什么图片，视频服务返回的链接直接能用，不用再转存。

影响范围：

原来是什么： 视频生成工具不支持厂商特定参数、参考音频输入、图片角色分配，且需要将大文件加载到内存中处理，资源消耗大（来源：https://github.com/openclaw/openclaw/issues/61987）
现在是什么： 支持 URL-only 输出（不强制文件进内存）、typed providerOptions、参考音频输入、每资产角色提示、adaptive 宽高比支持、更高的图片输入上限
针对哪些人群： 使用视频生成功能的用户，需要精细控制视频生成参数的用户，使用 Seedance 2.0 等高级模型的用户
有什么影响： 视频生成更灵活可控，内存占用更低，厂商高级功能都能用上了

实际更新内容： 扩展 video_generate 工具和 VideoGenerationRequest 类型：providerOptions（厂商特定参数如 seed、draft、camerafixed）、inputAudios（最多 3 个参考音频，用于 Seedance 2.0）、imageRoles（语义角色如 first_frame、last_frame）、adaptive 宽高比支持、更高的图片输入上限。感谢 @xieyongliang 贡献。

4. 飞书文档评论体验优化：上下文增强 + 打字反馈

💡 大白话： 就像把飞书文档的评论区变成了"真正的聊天窗口"。比如：你在飞书文档里 @ 某人问问题，以前 AI 可能不太理解这个 @ 是什么意思，现在它能准确识别谁被提到了、链接了什么文档，还能在你输入时显示"正在输入..."的状态，体验更像即时聊天。

影响范围：

原来是什么： 飞书文档评论会话有四大体验问题：评论会话不按文档范围、富文本解析无法理解 @ 提人和文档/wiki 链接、文档范围对话缺少评论上下文恢复、没有打字反应反馈（来源：https://github.com/openclaw/openclaw/issues/63785）
现在是什么： 文档评论会话增强上下文解析、评论反应支持、打字反馈，文档线程对话更像聊天对话
针对哪些人群： 使用飞书文档评论功能的用户，在飞书文档中与 AI 协作的用户
有什么影响： 文档评论体验更流畅，AI 能更准确理解评论内容中的 @ 提人、链接等富文本元素

实际更新内容： 飞书插件改进文档评论会话：增强上下文解析（识别 @ 提人、文档/wiki 链接）、评论反应支持、打字反馈，文档线程对话行为更像聊天对话。

5. Microsoft Teams 新增反应支持 + 委托授权

💡 大白话： 就像让 OpenClaw 在 Teams 里"会表情管理"了。比如：有人在 Teams 群里发了个消息，你想让 AI 点个赞或发个笑脸，以前做不到，现在 AI 可以直接在消息上加反应表情了，而且授权流程更规范——读消息用应用权限，发表情用你的个人权限，各司其职。

影响范围：

原来是什么： MS Teams 插件不支持反应功能，无法在消息上添加或移除表情反应，缺少 Graph API 分页工具，用户范围 Graph 端点无法访问（来源：https://github.com/openclaw/openclaw/issues/51646）
现在是什么： 完整反应支持（收发）、Graph 分页工具、委托 OAuth 流程，发反应用用户权限、读消息用应用权限
针对哪些人群： 使用 Microsoft Teams 的用户，需要在 Teams 中使用 AI 反应功能的用户
有什么影响： Teams 体验更完整，AI 可以在消息上添加表情反应，授权流程更规范安全

实际更新内容： MS Teams 插件新增完整反应支持：入站反应处理（DM 和群组策略授权）、出站反应（setReaction/unsetReaction Graph API）、Graph 分页工具、委托 OAuth 设置（发反应保留用户权限，读消息保留应用权限）。

6. 插件声明式激活和设置描述

💡 大白话： 就像让插件"自带说明书"，安装流程更清晰。比如：你安装一个新插件，以前可能不知道它需要什么配置、要绑定什么账号，现在插件自己的配置文件里就写着"需要 OAuth 授权"、"需要配对设备"，安装时一眼就能看出需要做什么。

影响范围：

原来是什么： 插件设置流程无法通过 manifest 描述所需的 auth、配对、配置步骤，只能硬编码特殊情况（来源：https://github.com/openclaw/openclaw/issues/64780）
现在是什么： 插件 manifest 可声明 activation 和 setup 描述块，设置/控制面板流程可检查插件元数据
针对哪些人群： 插件开发者，安装和管理插件的用户
有什么影响： 插件安装流程更清晰规范，设置步骤一目了然，减少配置困惑

实际更新内容： 插件 manifest 新增可选 activation 和 setup 描述块，在 manifest 加载时规范化，在 manifest-registry 中暴露。感谢 @ImLukeF 贡献。

7. Ollama 模型发现缓存优化

💡 大白话： 就像给模型列表加了个"缓存快照"，不用每次都重新问。比如：你在 Ollama 里装了几个模型，每次刷新模型选择器都要重新获取信息，现在它会记住上次的结果，只有模型真的变了才重新获取，刷新更快了。

影响范围：

原来是什么： Ollama /api/show 模型发现每次刷新都重新获取上下文窗口和能力元数据，即使模型没变也重复请求（来源：https://github.com/openclaw/openclaw/issues/64753）
现在是什么： 缓存 /api/show 结果，当 digest 或修改时间稳定时复用缓存，digest 变化时才失效
针对哪些人群： 使用 Ollama 本地模型的用户，频繁刷新模型选择器的用户
有什么影响： 模型选择器刷新更快，减少不必要的 API 请求，体验更流畅

实际更新内容： Ollama 插件缓存 /api/show 上下文窗口和能力元数据，当模型 digest 或修改时间稳定时复用缓存，空响应时重试，digest 变化时失效。感谢 @ImLukeF 贡献。

8. 模型/提供商调试日志增强

💡 大白话： 就像给本地模型的"路由路径"装了监控摄像头，排查问题更方便。比如：你配置了一个本地 OpenAI 兼容端点，但 AI 调用老是出错，以前不知道是本地模型的问题还是代理的问题，现在日志里会明确显示"这个请求被分类为本地端点"，问题定位更清晰。

影响范围：

原来是什么： 配置的 OpenAI 兼容端点分类信息不显示在调试日志中，本地和代理路由问题难以诊断（来源：https://github.com/openclaw/openclaw/issues/64754）
现在是什么： 嵌入式代理调试日志显示 OpenAI 兼容端点分类，本地和代理路由问题更容易诊断
针对哪些人群： 使用本地模型或 OpenAI 兼容代理的用户，需要排查模型路由问题的开发者
有什么影响： 调试信息更丰富，路由问题排查更高效，减少排查时间

实际更新内容： 模型/提供商层在嵌入式代理调试日志中显示配置的 OpenAI 兼容端点分类方式。感谢 @ImLukeF 贡献。

9. QA/Parity：GPT-5.4 vs Opus 4.6 代理能力对比报告

💡 大白话： 就像给 AI 的"能力考试"加了更严格的评分标准。比如：OpenClaw 团队想确保自家 AI 的代理能力不落后于 GPT-5.4 和 Opus 4.6，现在有了统一的测试框架和评分规则，哪些场景通过、哪些场景跳过、证据够不够充分，都一目了然。

影响范围：

原来是什么： 缺少 GPT-5.4 vs Opus 4.6 代理能力对比报告门控和共享场景覆盖检查，证据启发不够严格，跳过场景未记录（来源：https://github.com/openclaw/openclaw/issues/64441）
现在是什么： 新增代理能力对比报告门控，共享场景覆盖检查，更严格的证据启发，跳过场景会计入
针对哪些人群： OpenClaw 维护者，关注模型能力对比的用户
有什么影响： 质量把关更严格，能力对比更科学，维护者能更好地了解模型差距

实际更新内容： 新增 GPT-5.4 vs Opus 4.6 代理能力对比报告门控，共享场景覆盖检查，更严格的证据启发，跳过场景会计入，供维护者审阅。感谢 @100yenadmin 贡献。

⚠️ 升级风险提示

本次更新无明显重大风险，均为功能增强和 Bug 修复。但请注意：

视频生成参数变化：如果你使用了视频生成工具，新版本参数结构有调整（新增 providerOptions、inputAudios 等），请检查是否需要更新调用方式
飞书评论会话：文档评论会话体验有变化，如果依赖旧的行为可能需要适应
Teams 反应授权：如果使用 Teams 反应功能，需要配置委托 OAuth 流程

🐛 Bug 修复（技术细节，不建议普通用户查看）

本版本修复了以下问题，内容较为技术化，普通用户可跳过此部分。

OAuth 和认证相关

OpenAI/Codex OAuth：停止重写上游授权 URL scopes，避免新 Codex 登录因 invalid_scope 失败（来源：https://github.com/openclaw/openclaw/issues/64713）。感谢 @fuller-stack-dev。
MiniMax/OAuth：在 openclaw configure 时写入 api: "anthropic-messages" 和 authHeader: true 到 minimax-portal 配置补丁，确保重新授权的 portal 设置保持 Bearer auth 路由工作（来源：https://github.com/openclaw/openclaw/issues/64964）。感谢 @ryanlee666。

音频和语音相关

音频转录：仅对 OpenAI 兼容 multipart 请求禁用 pinned DNS，其他请求路径仍验证主机名，恢复 OpenAI、Groq、Mistral 转录功能（来源：https://github.com/openclaw/openclaw/issues/64766）。感谢 @GodsBoy。
macOS Talk Mode：首次授予麦克风权限后继续启动 Talk Mode，无需二次切换（来源：https://github.com/openclaw/openclaw/issues/62459）。感谢 @ggarber。
Webchat TTS：将 agent-run TTS 音频回复持久化到 webchat 历史，保持交错工具卡片配对，音频和工具输出附着到正确消息（来源：https://github.com/openclaw/openclaw/issues/63514）。感谢 @bittoby。

多平台频道相关

WhatsApp：使用配置的默认账号时，命名默认账号不再注册为 default（来源：https://github.com/openclaw/openclaw/issues/53918）。感谢 @yhyatt。
WhatsApp：将 message react 路由到 gateway-owned 动作路径，反应在 DM 和群聊中都使用实时 WhatsApp 监听器。感谢 @mcaxtr。
WhatsApp 自动回复：保留入站图片附件笔记，图片编辑保持真实保存媒体路径而非幻觉缺失路径（来源：https://github.com/openclaw/openclaw/issues/64918）。感谢 @ngutman。
Telegram/sessions：保持话题范围会话初始化在规范话题转录路径，避免一个话题会话交替使用裸路径和话题限定转录文件（来源：https://github.com/openclaw/openclaw/issues/64869）。感谢 @jalehman。

代理和会话相关

ACP/agents：抑制评论阶段子助理转发文本，子运行不再泄漏内部进度聊天到父会话。感谢 @vincentkoc。
Agents/timeouts：在 LLM 空闲看门狗中遵守显式运行超时，对齐默认超时配置，慢模型可继续工作到配置限制。
Agents/failover：将助理侧回退分类和 surfaced 提供商错误限定到当前尝试而非陈旧会话历史，跨提供商回退运行不再继承前提供商失败（来源：https://github.com/openclaw/openclaw/issues/62907）。感谢 @stainlu。
Codex/QA：将 Codex app-server 协调聊天排除出可见回复，添加实时 QA 泄漏场景，将泄漏的 harness 元文本分类为 QA 失败而非成功回复。感谢 @vincentkoc。

配置和视频生成相关

Config：在生成的 zod schema 中包含 asyncCompletion，文档化的异步完成配置不再因未识别键错误失败（来源：https://github.com/openclaw/openclaw/issues/63618）。
Google/Veo：停止发送不支持的 numberOfVideos 请求字段，Gemini Developer API Veo 运行不再失败（来源：https://github.com/openclaw/openclaw/issues/64723）。感谢 @velvet-shark。

打包和 QA 相关

QA/packaging：停止打包 CLI 启动和完成缓存生成读取 repo-only QA 场景 markdown，在 npm 发布中打包 QA 场景包，保持 openclaw completion --write-state 即使 QA 设置损坏也能工作（来源：https://github.com/openclaw/openclaw/issues/64648）。感谢 @obviyus。

📝 总结

本次更新 v2026.4.11 是一次功能性增强版本，核心亮点是 ChatGPT 记忆导入 和 视频生成工具大升级，同时优化了飞书、Teams、WhatsApp 等多平台体验，修复了大量 Bug。

适合升级的用户：

需要 ChatGPT 记忆导入的用户（强烈推荐）
使用视频生成功能的用户
使用飞书文档评论、Microsoft Teams 的用户
使用 Ollama 本地模型的用户
遇到过 Talk Mode、TTS、WhatsApp 等问题的用户

感谢所有贡献者： @xieyongliang、@ImLukeF、@100yenadmin、@fuller-stack-dev、@GodsBoy、@ggarber、@bittoby、@yhyatt、@vincentkoc、@mcaxtr、@ngutman、@jalehman、@stainlu、@velvet-shark、@obviyus、@ryanlee666。

#AI #OpenClaw #开源 #AIAgent #ChatGPT #记忆系统 #视频生成 #效率工具