版本:v2026.4.11
发布日期:2026-04-12
https://github.com/openclaw/openclaw/releases/tag/v2026.4.11
📋 更新概览(10秒速读)
本次更新新增 9 项功能,修复 15 个问题,主要涉及 记忆系统、视频生成、多平台支持、用户体验优化。最重要的是 ChatGPT 记忆导入功能,让你能把 ChatGPT 的对话历史无缝迁移到 OpenClaw 的记忆宫殿中,跨平台的 AI 对话记忆终于可以统一管理了。
📣 功能更新
1. ChatGPT 记忆导入 + 记忆宫殿可视化
💡 大白话: 就像给 AI 的"大脑"装了个"导入窗口",把你在 ChatGPT 聊过的内容一键搬过来。比如:你在 ChatGPT 上聊了 100 多次编程问题,积累了很多有用的经验,现在可以直接导入 OpenClaw,它会自动整理成"主题记忆卡片",你还能在"记忆宫殿"里查看所有提炼出来的知识点、待解决的问题、发现的矛盾点。
影响范围:
原来是什么: 用户在不同平台(ChatGPT、Claude 等)积累的对话经验和知识点分散在各处,无法统一查看和复用,跨平台记忆管理成本高(来源:https://github.com/openclaw/openclaw/issues/64505) 现在是什么: 新增 Imported Insights和Memory Palace两个日记子标签页,可以查看导入的 ChatGPT 对话、编译的 wiki 页面、完整源页面,直接从 UI 查看主题聚类、综合摘要、候选信号、矛盾点针对哪些人群: 在多平台使用 AI、需要跨平台记忆管理的用户,希望复用历史对话经验的用户 有什么影响: 记忆变得可观测、可管理,ChatGPT 的对话经验不再"丢失",可以持续积累和复用
实际更新内容: Dreaming 日记新增两个子标签页:Imported Insights(导入的 ChatGPT 对话,按主题聚类,含综合摘要、候选信号、修正信号,可点击查看完整源页面)和 Memory Palace(编译的 wiki 页面视图,包含主张、问题、矛盾或真实的综合/实体/概念内容)。
2. 控制台 UI 结构化聊天气泡 + 嵌入标签
💡 大白话: 就像把 AI 的"原生指令"翻译成"人类友好"的显示方式。比如:以前 AI 说要发一段语音,屏幕上会显示奇怪的
[[audio_as_voice]]代码,现在会直接显示一个语音气泡,点击就能播放,体验更自然。
影响范围:
原来是什么: AI 的 MEDIA 指令、回复标签、语音指令等原生输出直接暴露在聊天界面,用户看到的是技术代码而非友好提示(来源:https://github.com/openclaw/openclaw/issues/64104) 现在是什么: 新增渲染层,将助理指令转换为结构化聊天气泡,新增 [embed ...]富输出标签,外部嵌入 URL 需配置授权针对哪些人群: 使用 Web 控制台的用户,需要查看 AI 生成内容(语音、图片、回复)的用户 有什么影响: 聊天界面更直观友好,不再显示原始技术代码,AI 输出可视化体验提升
实际更新内容: Control UI 新增助理指令渲染层,将 MEDIA 行、回复标签、[[audio_as_voice]] 转换为结构化 UI 元数据而非原始文本;新增 [embed ...] 富输出标签;外部嵌入 URL 需配置 gate;支持托管文档/助理媒体服务和授权管道。
3. 视频生成工具大升级:URL 直接输出 + 多音频输入 + 自适应宽高
💡 大白话: 就像把视频生成的"操控面板"变得更灵活、更省内存。比如:你想让 AI 生成一段带背景音乐的视频,以前要把音频文件上传到内存里处理,现在可以直接传音频 URL,还能指定第一帧用什么图片、最后一帧用什么图片,视频服务返回的链接直接能用,不用再转存。
影响范围:
原来是什么: 视频生成工具不支持厂商特定参数、参考音频输入、图片角色分配,且需要将大文件加载到内存中处理,资源消耗大(来源:https://github.com/openclaw/openclaw/issues/61987) 现在是什么: 支持 URL-only 输出(不强制文件进内存)、typed providerOptions、参考音频输入、每资产角色提示、adaptive 宽高比支持、更高的图片输入上限 针对哪些人群: 使用视频生成功能的用户,需要精细控制视频生成参数的用户,使用 Seedance 2.0 等高级模型的用户 有什么影响: 视频生成更灵活可控,内存占用更低,厂商高级功能都能用上了
实际更新内容: 扩展 video_generate 工具和 VideoGenerationRequest 类型:providerOptions(厂商特定参数如 seed、draft、camerafixed)、inputAudios(最多 3 个参考音频,用于 Seedance 2.0)、imageRoles(语义角色如 first_frame、last_frame)、adaptive 宽高比支持、更高的图片输入上限。感谢 @xieyongliang 贡献。
4. 飞书文档评论体验优化:上下文增强 + 打字反馈
💡 大白话: 就像把飞书文档的评论区变成了"真正的聊天窗口"。比如:你在飞书文档里 @ 某人问问题,以前 AI 可能不太理解这个 @ 是什么意思,现在它能准确识别谁被提到了、链接了什么文档,还能在你输入时显示"正在输入..."的状态,体验更像即时聊天。
影响范围:
原来是什么: 飞书文档评论会话有四大体验问题:评论会话不按文档范围、富文本解析无法理解 @ 提人和文档/wiki 链接、文档范围对话缺少评论上下文恢复、没有打字反应反馈(来源:https://github.com/openclaw/openclaw/issues/63785) 现在是什么: 文档评论会话增强上下文解析、评论反应支持、打字反馈,文档线程对话更像聊天对话 针对哪些人群: 使用飞书文档评论功能的用户,在飞书文档中与 AI 协作的用户 有什么影响: 文档评论体验更流畅,AI 能更准确理解评论内容中的 @ 提人、链接等富文本元素
实际更新内容: 飞书插件改进文档评论会话:增强上下文解析(识别 @ 提人、文档/wiki 链接)、评论反应支持、打字反馈,文档线程对话行为更像聊天对话。
5. Microsoft Teams 新增反应支持 + 委托授权
💡 大白话: 就像让 OpenClaw 在 Teams 里"会表情管理"了。比如:有人在 Teams 群里发了个消息,你想让 AI 点个赞或发个笑脸,以前做不到,现在 AI 可以直接在消息上加反应表情了,而且授权流程更规范——读消息用应用权限,发表情用你的个人权限,各司其职。
影响范围:
原来是什么: MS Teams 插件不支持反应功能,无法在消息上添加或移除表情反应,缺少 Graph API 分页工具,用户范围 Graph 端点无法访问(来源:https://github.com/openclaw/openclaw/issues/51646) 现在是什么: 完整反应支持(收发)、Graph 分页工具、委托 OAuth 流程,发反应用用户权限、读消息用应用权限 针对哪些人群: 使用 Microsoft Teams 的用户,需要在 Teams 中使用 AI 反应功能的用户 有什么影响: Teams 体验更完整,AI 可以在消息上添加表情反应,授权流程更规范安全
实际更新内容: MS Teams 插件新增完整反应支持:入站反应处理(DM 和群组策略授权)、出站反应(setReaction/unsetReaction Graph API)、Graph 分页工具、委托 OAuth 设置(发反应保留用户权限,读消息保留应用权限)。
6. 插件声明式激活和设置描述
💡 大白话: 就像让插件"自带说明书",安装流程更清晰。比如:你安装一个新插件,以前可能不知道它需要什么配置、要绑定什么账号,现在插件自己的配置文件里就写着"需要 OAuth 授权"、"需要配对设备",安装时一眼就能看出需要做什么。
影响范围:
原来是什么: 插件设置流程无法通过 manifest 描述所需的 auth、配对、配置步骤,只能硬编码特殊情况(来源:https://github.com/openclaw/openclaw/issues/64780) 现在是什么: 插件 manifest 可声明 activation和setup描述块,设置/控制面板流程可检查插件元数据针对哪些人群: 插件开发者,安装和管理插件的用户 有什么影响: 插件安装流程更清晰规范,设置步骤一目了然,减少配置困惑
实际更新内容: 插件 manifest 新增可选 activation 和 setup 描述块,在 manifest 加载时规范化,在 manifest-registry 中暴露。感谢 @ImLukeF 贡献。
7. Ollama 模型发现缓存优化
💡 大白话: 就像给模型列表加了个"缓存快照",不用每次都重新问。比如:你在 Ollama 里装了几个模型,每次刷新模型选择器都要重新获取信息,现在它会记住上次的结果,只有模型真的变了才重新获取,刷新更快了。
影响范围:
原来是什么: Ollama /api/show模型发现每次刷新都重新获取上下文窗口和能力元数据,即使模型没变也重复请求(来源:https://github.com/openclaw/openclaw/issues/64753)现在是什么: 缓存 /api/show结果,当 digest 或修改时间稳定时复用缓存,digest 变化时才失效针对哪些人群: 使用 Ollama 本地模型的用户,频繁刷新模型选择器的用户 有什么影响: 模型选择器刷新更快,减少不必要的 API 请求,体验更流畅
实际更新内容: Ollama 插件缓存 /api/show 上下文窗口和能力元数据,当模型 digest 或修改时间稳定时复用缓存,空响应时重试,digest 变化时失效。感谢 @ImLukeF 贡献。
8. 模型/提供商调试日志增强
💡 大白话: 就像给本地模型的"路由路径"装了监控摄像头,排查问题更方便。比如:你配置了一个本地 OpenAI 兼容端点,但 AI 调用老是出错,以前不知道是本地模型的问题还是代理的问题,现在日志里会明确显示"这个请求被分类为本地端点",问题定位更清晰。
影响范围:
原来是什么: 配置的 OpenAI 兼容端点分类信息不显示在调试日志中,本地和代理路由问题难以诊断(来源:https://github.com/openclaw/openclaw/issues/64754) 现在是什么: 嵌入式代理调试日志显示 OpenAI 兼容端点分类,本地和代理路由问题更容易诊断 针对哪些人群: 使用本地模型或 OpenAI 兼容代理的用户,需要排查模型路由问题的开发者 有什么影响: 调试信息更丰富,路由问题排查更高效,减少排查时间
实际更新内容: 模型/提供商层在嵌入式代理调试日志中显示配置的 OpenAI 兼容端点分类方式。感谢 @ImLukeF 贡献。
9. QA/Parity:GPT-5.4 vs Opus 4.6 代理能力对比报告
💡 大白话: 就像给 AI 的"能力考试"加了更严格的评分标准。比如:OpenClaw 团队想确保自家 AI 的代理能力不落后于 GPT-5.4 和 Opus 4.6,现在有了统一的测试框架和评分规则,哪些场景通过、哪些场景跳过、证据够不够充分,都一目了然。
影响范围:
原来是什么: 缺少 GPT-5.4 vs Opus 4.6 代理能力对比报告门控和共享场景覆盖检查,证据启发不够严格,跳过场景未记录(来源:https://github.com/openclaw/openclaw/issues/64441) 现在是什么: 新增代理能力对比报告门控,共享场景覆盖检查,更严格的证据启发,跳过场景会计入 针对哪些人群: OpenClaw 维护者,关注模型能力对比的用户 有什么影响: 质量把关更严格,能力对比更科学,维护者能更好地了解模型差距
实际更新内容: 新增 GPT-5.4 vs Opus 4.6 代理能力对比报告门控,共享场景覆盖检查,更严格的证据启发,跳过场景会计入,供维护者审阅。感谢 @100yenadmin 贡献。
⚠️ 升级风险提示
本次更新无明显重大风险,均为功能增强和 Bug 修复。但请注意:
视频生成参数变化:如果你使用了视频生成工具,新版本参数结构有调整(新增 providerOptions、inputAudios 等),请检查是否需要更新调用方式 飞书评论会话:文档评论会话体验有变化,如果依赖旧的行为可能需要适应 Teams 反应授权:如果使用 Teams 反应功能,需要配置委托 OAuth 流程
🐛 Bug 修复(技术细节,不建议普通用户查看)
本版本修复了以下问题,内容较为技术化,普通用户可跳过此部分。
OAuth 和认证相关
OpenAI/Codex OAuth:停止重写上游授权 URL scopes,避免新 Codex 登录因 invalid_scope失败(来源:https://github.com/openclaw/openclaw/issues/64713)。感谢 @fuller-stack-dev。MiniMax/OAuth:在 openclaw configure时写入api: "anthropic-messages"和authHeader: true到 minimax-portal 配置补丁,确保重新授权的 portal 设置保持 Bearer auth 路由工作(来源:https://github.com/openclaw/openclaw/issues/64964)。感谢 @ryanlee666。
音频和语音相关
音频转录:仅对 OpenAI 兼容 multipart 请求禁用 pinned DNS,其他请求路径仍验证主机名,恢复 OpenAI、Groq、Mistral 转录功能(来源:https://github.com/openclaw/openclaw/issues/64766)。感谢 @GodsBoy。 macOS Talk Mode:首次授予麦克风权限后继续启动 Talk Mode,无需二次切换(来源:https://github.com/openclaw/openclaw/issues/62459)。感谢 @ggarber。 Webchat TTS:将 agent-run TTS 音频回复持久化到 webchat 历史,保持交错工具卡片配对,音频和工具输出附着到正确消息(来源:https://github.com/openclaw/openclaw/issues/63514)。感谢 @bittoby。
多平台频道相关
WhatsApp:使用配置的默认账号时,命名默认账号不再注册为 default(来源:https://github.com/openclaw/openclaw/issues/53918)。感谢 @yhyatt。WhatsApp:将 message react路由到 gateway-owned 动作路径,反应在 DM 和群聊中都使用实时 WhatsApp 监听器。感谢 @mcaxtr。WhatsApp 自动回复:保留入站图片附件笔记,图片编辑保持真实保存媒体路径而非幻觉缺失路径(来源:https://github.com/openclaw/openclaw/issues/64918)。感谢 @ngutman。 Telegram/sessions:保持话题范围会话初始化在规范话题转录路径,避免一个话题会话交替使用裸路径和话题限定转录文件(来源:https://github.com/openclaw/openclaw/issues/64869)。感谢 @jalehman。
代理和会话相关
ACP/agents:抑制评论阶段子助理转发文本,子运行不再泄漏内部进度聊天到父会话。感谢 @vincentkoc。 Agents/timeouts:在 LLM 空闲看门狗中遵守显式运行超时,对齐默认超时配置,慢模型可继续工作到配置限制。 Agents/failover:将助理侧回退分类和 surfaced 提供商错误限定到当前尝试而非陈旧会话历史,跨提供商回退运行不再继承前提供商失败(来源:https://github.com/openclaw/openclaw/issues/62907)。感谢 @stainlu。 Codex/QA:将 Codex app-server 协调聊天排除出可见回复,添加实时 QA 泄漏场景,将泄漏的 harness 元文本分类为 QA 失败而非成功回复。感谢 @vincentkoc。
配置和视频生成相关
Config:在生成的 zod schema 中包含 asyncCompletion,文档化的异步完成配置不再因未识别键错误失败(来源:https://github.com/openclaw/openclaw/issues/63618)。Google/Veo:停止发送不支持的 numberOfVideos请求字段,Gemini Developer API Veo 运行不再失败(来源:https://github.com/openclaw/openclaw/issues/64723)。感谢 @velvet-shark。
打包和 QA 相关
QA/packaging:停止打包 CLI 启动和完成缓存生成读取 repo-only QA 场景 markdown,在 npm 发布中打包 QA 场景包,保持 openclaw completion --write-state即使 QA 设置损坏也能工作(来源:https://github.com/openclaw/openclaw/issues/64648)。感谢 @obviyus。
📝 总结
本次更新 v2026.4.11 是一次功能性增强版本,核心亮点是 ChatGPT 记忆导入 和 视频生成工具大升级,同时优化了飞书、Teams、WhatsApp 等多平台体验,修复了大量 Bug。
适合升级的用户:
需要 ChatGPT 记忆导入的用户(强烈推荐) 使用视频生成功能的用户 使用飞书文档评论、Microsoft Teams 的用户 使用 Ollama 本地模型的用户 遇到过 Talk Mode、TTS、WhatsApp 等问题的用户
感谢所有贡献者: @xieyongliang、@ImLukeF、@100yenadmin、@fuller-stack-dev、@GodsBoy、@ggarber、@bittoby、@yhyatt、@vincentkoc、@mcaxtr、@ngutman、@jalehman、@stainlu、@velvet-shark、@obviyus、@ryanlee666。
夜雨聆风