OpenClaw 2026.5.24-beta.2预发布:开会自动记录带发言标注,任务跑着能喊停,启动快了4100倍
上周我开了三个小时的会,全程没记一个字,最后 OpenClaw 给了我一份带发言人标注的逐字稿。这个功能在 v2026.5.24-beta.2 里正式出来了,我觉得值得单独说一下。
这个版本的变化很杂,但有几条放在一起看,会发现它们指向同一件事——让 AI 在你不盯着它的时候,也能把活干完。
开会,AI 帮你记
Meeting Notes 这个功能终于有了完整的形态。它作为一个外部插件发布,接入 Discord 语音频道作为第一个「现场音源」。开会的时候不用做任何操作,它自动捕获,会后生成摘要,每段话旁边标着是谁说的。
如果你不方便实时连 Discord,也可以手动导入会议转录文本。完事之后用 openclaw meeting-notes 这个 CLI 命令查,只读,不会意外触发什么动作。
说实在的,我以前也试过各种会议记录工具,要么记录质量差,要么操作繁琐。这次直接嵌进 OpenClaw 的语音链路里,没有额外的 app,就是顺带把事情做了。
任务跑着,也能插一嘴
Talk/realtime 这块做了一个我一直想要的功能:任务在跑的时候,可以通过 WebUI 或者 Discord 语音频道问它现在跑到哪了,也可以取消、调整方向,或者排一个后续任务。
以前的体验是——把任务扔出去,然后等。你不知道它跑到哪了,你想改个方向,得等它跑完再说。现在不用了,过程中随时插话。对那些需要跑十几分钟的长任务来说,这个改动很实用。
Discord 语音那边同步加了「唤醒词」机制,可以配置叫 Agent 什么名字才响应,不会动不动被其他对话触发。
启动快了多少
这个数字我看到的时候愣了一下:/models 接口从 ~20 秒降到了 ~5 毫秒,快了大约 4100 倍。原因是以前每次调用都要走一遍 provider 插件发现流程,现在改成网关启动时预热一次,之后命中缓存直接返回。
Gateway 整体这次做了一批懒加载和缓存优化,把启动时不必要的工作往后推:插件元数据、channel catalog、ACPX runtime——能延迟的全延迟。健康检查和 ready 信号不再等这些东西,网关启动的响应时间明显短了一截。
iMessage 点赞就能审批
这个功能是从 WhatsApp 那边同步过来的。以前在 iMessage 里审批任务要发文字命令 /approve,现在直接点个 👍 就是 allow-once,点 👎 就是 deny,跟正常聊天一样,不用切换思路。
allow-always 这种永久授权的权限因为影响面大,还是保留文字命令,不接受 tapback。合理的权衡。
图片压缩也能按需调
Image tool 加了自适应压缩,新增了 agents.defaults.imageQuality 配置项,三档可选:省 token、平衡、高清。以前不管什么图都按同一套处理,现在可以根据任务类型决定——调试用省 token 档,出图类任务用高清档。
完整变更列表
- NEWiMessage:支持 👍/👎 tapback 审批反应,👍 解析为 allow-once,👎 解析为 deny
- NEWTalk/realtime:WebUI 和 Discord 语音频道可在任务运行中查询状态、取消、调整或排队后续任务
- NEWMeeting Notes:新增外部插件,支持自动捕获、手动转录导入、openclaw meeting-notes CLI,Discord 语音为第一个现场音源
- NEWMeeting Notes/Discord:生成摘要时含发言人标注逐字稿段落
- NEWDiscord/voice:添加实时唤醒词门控,支持按 Agent 名称配置,提升 USER.md/SOUL.md 较长时的 profile 上下文预算
- NEWGateway/perf:懒加载启动空闲插件、核心 handler 树和 ACPX runtime,健康检查不再等待未使用的组件
- NEWGateway/perf:缓存 channel catalog、plugin 元数据快照、SDK 别名映射,避免重复文件读取和 manifest 解析
- NEWModels/perf:网关启动预热 provider auth 状态,/models 响应从 ~20s 降至 ~5ms(快约 4100 倍)
- NEWImage tool:新增 agents.defaults.imageQuality 配置,支持省 token / 平衡 / 高清三档自适应压缩
- NEWAgents/subagents:默认限制子 Agent 启动上下文为 AGENTS.md 和 TOOLS.md,隔离 persona/memory/heartbeat 等文件
- NEWPlugin SDK:新增通用 channel-message poll 发送器;新增 embeddingProviders 能力注册 API
- NEWCLI/models:openclaw models auth login 支持 –profile-id 存储指定 provider auth profile
- NEWControl UI/chat:会话选择器加入搜索和分页加载
- NEWCLI/onboarding:裸运行 openclaw 时若无配置文件则自动启动引导流程
- NEWDiagnostics:输出 secrets.prepare 时间线 span 和工具调用来源/归属标签,不暴露敏感信息
- NEWSecurity/sessions:agent 间访问检查改为预编译线性匹配,避免正则回溯安全风险
- NEWPackaging:npm tarball 排除文档图片,减小包体积
- FIXDiscord/voice:序列化并发 voice join、重试中断的就绪等待、会议记录与 realtime 会话的生命周期隔离
- FIXGateway/boot:BOOT.md 启动检查在独立 session 运行,避免覆盖主 session 映射
- FIXConfig/secrets:写入前预检 SecretRef,写后刷新失败时回滚文件/env 状态
- FIXCLI/models:models status 重新生成 models.json 时保留 SecretRef 标记,不将密钥明文写入磁盘
- FIXAgents/subagents:中止的子 Agent 正确上报错误,不再静默成功
- FIXAgents/providers:修复严格模式本地/兼容服务器因上下文窗口计算错误拒绝请求的问题
- FIXAgents/compaction:跳过 provider 自有 CLI runtime session 的 agent-harness 预检,Claude CLI 会话超阈值时可正常走压缩
- FIXWebChat:run-complete 指示器延迟到 assistant 回复渲染完毕再显示,不再提前出现
- FIXMiniMax:OAuth token 过期时间改存绝对毫秒值,不再每次请求都被判为过期
- FIXWhatsApp/auto-reply:延迟媒体回复通过前台 fence 送出,避免重叠 no-reply turn 隐藏已有响应
- FIXGateway/update:git 更新时不拉取无关 tag,避免 tag 移动阻塞分支更新
会议记录和任务实时干预这两个功能加在一起,让我感觉 OpenClaw 开始认真做「后台运转」这件事了,不只是你盯着才能工作。感兴趣的可以去试一下,GitHub 链接在评论区。
⭐点赞、转发、关注和推荐一键三连⭐
夜雨聆风