乐于分享
好东西不私藏

OpenClaw 2026.5.24-beta.2预发布:开会自动记录带发言标注,任务跑着能喊停,启动快了4100倍

OpenClaw 2026.5.24-beta.2预发布:开会自动记录带发言标注,任务跑着能喊停,启动快了4100倍

上周我开了三个小时的会,全程没记一个字,最后 OpenClaw 给了我一份带发言人标注的逐字稿。这个功能在 v2026.5.24-beta.2 里正式出来了,我觉得值得单独说一下。

这个版本的变化很杂,但有几条放在一起看,会发现它们指向同一件事——让 AI 在你不盯着它的时候,也能把活干完。

开会,AI 帮你记

Meeting Notes 这个功能终于有了完整的形态。它作为一个外部插件发布,接入 Discord 语音频道作为第一个「现场音源」。开会的时候不用做任何操作,它自动捕获,会后生成摘要,每段话旁边标着是谁说的

如果你不方便实时连 Discord,也可以手动导入会议转录文本。完事之后用 openclaw meeting-notes 这个 CLI 命令查,只读,不会意外触发什么动作。

说实在的,我以前也试过各种会议记录工具,要么记录质量差,要么操作繁琐。这次直接嵌进 OpenClaw 的语音链路里,没有额外的 app,就是顺带把事情做了。

任务跑着,也能插一嘴

Talk/realtime 这块做了一个我一直想要的功能:任务在跑的时候,可以通过 WebUI 或者 Discord 语音频道问它现在跑到哪了,也可以取消、调整方向,或者排一个后续任务。

以前的体验是——把任务扔出去,然后等。你不知道它跑到哪了,你想改个方向,得等它跑完再说。现在不用了,过程中随时插话。对那些需要跑十几分钟的长任务来说,这个改动很实用。

Discord 语音那边同步加了「唤醒词」机制,可以配置叫 Agent 什么名字才响应,不会动不动被其他对话触发。

启动快了多少

这个数字我看到的时候愣了一下:/models 接口从 ~20 秒降到了 ~5 毫秒,快了大约 4100 倍。原因是以前每次调用都要走一遍 provider 插件发现流程,现在改成网关启动时预热一次,之后命中缓存直接返回。

Gateway 整体这次做了一批懒加载和缓存优化,把启动时不必要的工作往后推:插件元数据、channel catalog、ACPX runtime——能延迟的全延迟。健康检查和 ready 信号不再等这些东西,网关启动的响应时间明显短了一截。

iMessage 点赞就能审批

这个功能是从 WhatsApp 那边同步过来的。以前在 iMessage 里审批任务要发文字命令 /approve,现在直接点个 👍 就是 allow-once,点 👎 就是 deny,跟正常聊天一样,不用切换思路。

allow-always 这种永久授权的权限因为影响面大,还是保留文字命令,不接受 tapback。合理的权衡。

图片压缩也能按需调

Image tool 加了自适应压缩,新增了 agents.defaults.imageQuality 配置项,三档可选:省 token、平衡、高清。以前不管什么图都按同一套处理,现在可以根据任务类型决定——调试用省 token 档,出图类任务用高清档。

完整变更列表

  • NEWiMessage:支持 👍/👎 tapback 审批反应,👍 解析为 allow-once,👎 解析为 deny
  • NEWTalk/realtime:WebUI 和 Discord 语音频道可在任务运行中查询状态、取消、调整或排队后续任务
  • NEWMeeting Notes:新增外部插件,支持自动捕获、手动转录导入、openclaw meeting-notes CLI,Discord 语音为第一个现场音源
  • NEWMeeting Notes/Discord:生成摘要时含发言人标注逐字稿段落
  • NEWDiscord/voice:添加实时唤醒词门控,支持按 Agent 名称配置,提升 USER.md/SOUL.md 较长时的 profile 上下文预算
  • NEWGateway/perf:懒加载启动空闲插件、核心 handler 树和 ACPX runtime,健康检查不再等待未使用的组件
  • NEWGateway/perf:缓存 channel catalog、plugin 元数据快照、SDK 别名映射,避免重复文件读取和 manifest 解析
  • NEWModels/perf:网关启动预热 provider auth 状态,/models 响应从 ~20s 降至 ~5ms(快约 4100 倍)
  • NEWImage tool:新增 agents.defaults.imageQuality 配置,支持省 token / 平衡 / 高清三档自适应压缩
  • NEWAgents/subagents:默认限制子 Agent 启动上下文为 AGENTS.md 和 TOOLS.md,隔离 persona/memory/heartbeat 等文件
  • NEWPlugin SDK:新增通用 channel-message poll 发送器;新增 embeddingProviders 能力注册 API
  • NEWCLI/models:openclaw models auth login 支持 –profile-id 存储指定 provider auth profile
  • NEWControl UI/chat:会话选择器加入搜索和分页加载
  • NEWCLI/onboarding:裸运行 openclaw 时若无配置文件则自动启动引导流程
  • NEWDiagnostics:输出 secrets.prepare 时间线 span 和工具调用来源/归属标签,不暴露敏感信息
  • NEWSecurity/sessions:agent 间访问检查改为预编译线性匹配,避免正则回溯安全风险
  • NEWPackaging:npm tarball 排除文档图片,减小包体积
  • FIXDiscord/voice:序列化并发 voice join、重试中断的就绪等待、会议记录与 realtime 会话的生命周期隔离
  • FIXGateway/boot:BOOT.md 启动检查在独立 session 运行,避免覆盖主 session 映射
  • FIXConfig/secrets:写入前预检 SecretRef,写后刷新失败时回滚文件/env 状态
  • FIXCLI/models:models status 重新生成 models.json 时保留 SecretRef 标记,不将密钥明文写入磁盘
  • FIXAgents/subagents:中止的子 Agent 正确上报错误,不再静默成功
  • FIXAgents/providers:修复严格模式本地/兼容服务器因上下文窗口计算错误拒绝请求的问题
  • FIXAgents/compaction:跳过 provider 自有 CLI runtime session 的 agent-harness 预检,Claude CLI 会话超阈值时可正常走压缩
  • FIXWebChat:run-complete 指示器延迟到 assistant 回复渲染完毕再显示,不再提前出现
  • FIXMiniMax:OAuth token 过期时间改存绝对毫秒值,不再每次请求都被判为过期
  • FIXWhatsApp/auto-reply:延迟媒体回复通过前台 fence 送出,避免重叠 no-reply turn 隐藏已有响应
  • FIXGateway/update:git 更新时不拉取无关 tag,避免 tag 移动阻塞分支更新

会议记录和任务实时干预这两个功能加在一起,让我感觉 OpenClaw 开始认真做「后台运转」这件事了,不只是你盯着才能工作。感兴趣的可以去试一下,GitHub 链接在评论区。

⭐点赞、转发、关注和推荐一键三连⭐