如果只用一句话总结这次 OpenClaw 新版本,我会这么说:
OpenClaw 正在从一个“可连接聊天软件的 AI 网关”,进化成一个“可多渠道接入、可多 Agent 协作、可自动化运行、可持续维护”的个人 AI 操作系统。
很多人第一次接触 OpenClaw,会把它理解成:
• 一个能接 Telegram / Discord / 微信的机器人 • 一个能调用模型回复消息的自托管 AI 助手 • 一个“从手机上也能使唤”的本地 Agent 网关
但到了这次版本,你会明显感觉到,OpenClaw 的重点已经不只是“接上一个聊天入口”,而是开始把 渠道、工具、会话、线程、自动化、语音、审批、安全边界 这些系统级能力,拼成一整套能长期运行的框架。
这篇文章,我想不照着 changelog 念,而是直接讲:
OpenClaw 这一版,究竟变强在哪。
一、OpenClaw 的核心定位,已经越来越清晰了
从文档首页可以很清楚看到,这一代 OpenClaw 的定位是:
Any OS gateway for AI agents across WhatsApp, Telegram, Discord, iMessage, and more.
翻译成人话就是:
它不是某个单点 AI 聊天工具,而是一个“多渠道 AI 代理网关”。
你只需要运行一个 Gateway,就可以把 AI 接到:
• WhatsApp • Telegram • Discord • iMessage • 以及更多插件化渠道
而且它不是“只能收发文本”的壳子,文档里明确强调了几件事:
• 多渠道统一接入 • 多 Agent 路由 • 工具调用和会话隔离 • 媒体能力 • Web 控制台 • 移动端节点(iOS / Android)
这意味着 OpenClaw 已经不是传统意义上的“机器人”,而是一个具备 通信层 + 调度层 + 运行时层 的 Agent 基础设施。
如果你之前把它理解成“ChatGPT 套壳”,那现在这个认知该升级了。
二、新版本最大的变化,不是多了几个功能,而是“系统感”更强了
这次文档里最明显的感受,是 OpenClaw 开始越来越像一个完整系统,而不是一堆工具的拼装。
为什么这么说?
因为它现在强化的,不是单点 feature,而是下面这些关键层:
1. 渠道层:Discord、Telegram 等能力持续完善 2. 交互层:流式预览、回复 threading、组件 UI、语音消息 3. 运行层:线程绑定、子 Agent / ACP 会话、持久路由 4. 自动化层:cron、命令、审批、配置写入 5. 安全层:allowlist、DM / group policy、审批流程、凭证管理 6. 多模态层:TTS、语音频道、音频发送 7. 运维层:dashboard、docs、troubleshooting、状态检查
这类能力一旦齐了,OpenClaw 的使用方式就会发生本质变化:
你不再只是“问一句,回一句”,而是可以开始把它当成一个长期在线、持续工作、跨平台响应、具备记忆与自动化能力的数字分身系统。
三、Discord 能力明显进化:它不再只是“把消息转进去”
如果说过去很多 AI 工具接 Discord,只是做到了“机器人能说话”,那 OpenClaw 现在的 Discord 文档已经明显跨过了这个阶段。
1)Discord 线程和会话绑定更成熟了
新版本里一个非常关键的能力,是 thread-bound sessions。
简单理解:
你可以把一个 Discord thread 绑定到某个 session、某个 subagent,甚至某个 ACP 会话。
后续在这个 thread 里的消息,会持续路由到同一个上下文。
这件事很重要,因为它解决了过去很多 AI 协作工具的老毛病:
• 线程一多,上下文就乱 • 不同任务容易串台 • 子任务很难长期挂在线程里继续推进
而现在 OpenClaw 的设计是:
• thread 可以成为一个稳定工作面 • 可以 /focus到某个 agent / session• 可以 /unfocus• 可以控制 idle time / max age • 可以和 subagent / ACP 工作流配合
这让 Discord 从“聊天入口”,升级成了多任务工作台。
2)ACP 持久绑定越来越像“AI 开发工作区”
文档里还专门写了 Persistent ACP channel bindings。
这个能力的意义是:
你可以把某个 Discord 频道,长期绑定给一个 ACP agent,比如 Codex。
以后这个频道本身,就像那个 agent 的工作空间。
这背后的味道已经很明确了:
• Discord 不只是消息面板 • 它可以成为某个 AI 编码 agent 的“常驻房间” • 同一个频道里,AI 持续围绕同一套工程上下文工作
说直白点:
OpenClaw 正在把聊天软件,变成 AI 工作流的原生前端。
3)Discord 组件 UI 更成熟
文档里还明确支持了 Discord components v2,包括:
• buttons • select menus • modal forms • media/file blocks
这意味着 Discord 上不再只是“纯文本对话”,而是能做更像应用的交互面板。
比如:
• 审批按钮 • 模型选择器 • 提交表单 • 工作流确认 • 文件与媒体交互
这一步很关键,因为它让 OpenClaw 有机会从“聊天 Agent”继续走向“可交互操作台”。
4)Discord 语音能力非常值得关注
新版本文档里,Discord voice 相关内容已经相当深入,支持:
• 加入语音频道 • 实时持续对话 • voice TTS • 接收端自动恢复 • decryption failure tolerance • 语音消息 OGG/Opus 适配
这代表一个很明确的方向:
OpenClaw 不只是文字助手,它开始具备“实时语音代理”的基础设施能力。
这不是一个小 feature,这是未来 AI 常驻在线形态的重要基础。
四、Telegram 继续稳,而且更像“生产环境渠道”了
如果说 Discord 那边更偏“工作流和复杂交互”,那 Telegram 这边则体现出 OpenClaw 在 稳定性、实用性和自动化 上的打磨。
1)Telegram 的流式预览体验已经非常成熟
文档里明确写了:
• 默认支持 preview message + editMessageText • DM / 群组 / topic 都能走流式预览 • partial / block / progress多模式支持• 复杂消息会自动 fallback 到普通投递
这说明 OpenClaw 在 Telegram 上已经不只是“能回消息”,而是很认真地在做接近原生体验的流式回复。
2)Topic / Forum 级别的 Agent 路由很强
Telegram 的 topic 路由能力,在文档里已经写得非常完整:
• topic session key 独立 • 不同 topic 可绑定不同 agent • forum topic 可做持久 ACP 绑定 • /acp spawn --thread here|auto支持当前 topic 直接绑定 ACP 会话
这意味着一个 Telegram 群组,可以天然演化成多条并行工作流:
• Topic A:主脑 • Topic B:编码 agent • Topic C:调研 agent • Topic D:长期项目跟踪
这类能力一旦用起来,就会发现它比很多“单窗口 AI 工具”高效得多。
3)Telegram 自动化能力越来越工程化
文档里对 Telegram 的消息动作支持也很完整:
• send • react • delete • edit • createForumTopic • poll • sticker / sticker-search
这意味着 Telegram 在 OpenClaw 里已经不只是一个输入输出口,而是可被 agent 主动操作 的工作界面。
配合 cron、topic、reply threading,实际上已经很像一个自动化助手平台。
五、TTS 能力的提升,让“语音化 AI”真正开始可用
这一版里还有一个非常值得单独拿出来讲的点:
TTS 文档非常完整,而且支持了主/备 provider 设计。
当前支持:
• ElevenLabs • Microsoft • OpenAI
而且重点不是“支持三家”这么简单,而是它已经有了比较成熟的生产策略:
• primary + fallback provider • summaryModel • per-user preferences • channel-specific output behavior • auto / inbound / tagged 等触发模式 • 模型驱动的 TTS override
这意味着什么?
意味着 OpenClaw 的语音能力,已经不是那种“演示一下会说话”的半成品,而是开始朝着 真正可用的多渠道音频输出系统 演进。
尤其是文档里区分了不同渠道下的行为:
• Feishu / Matrix / Telegram / WhatsApp → voice message • 其他渠道 → MP3 • Microsoft 失败时自动回退 MP3 • 长回复可自动 summary 再 TTS
这已经是很成熟的产品思路了。
一句话总结就是:
TTS 现在不是 OpenClaw 的花活,而是一个开始能进工作流的正式能力。
六、OpenClaw 正在把“聊天工具”升级成“自动化操作系统”
这部分其实是我觉得最有价值的变化。
如果只看表面,你会觉得 OpenClaw 是:
• 能回消息 • 能接模型 • 能调工具
但从这版文档结构看,它真正的野心已经很清楚了:
它想做的是一个 长期运行的个人 Agent Operating System。
为什么这么说?
因为你会看到这些能力开始成体系地出现:
1)Gateway 成为统一控制平面
文档首页明确写了:
• Gateway 是 sessions、routing、channel connections 的 single source of truth • 有 browser dashboard • 有 CLI • 有 web control UI • 有 node / mobile node
这就不是“一个 bot 程序”了,而是有点像 AI 基础设施中的 control plane。
2)会话、线程、路由、策略都可配置
你不是只能“跟 AI 聊”,而是可以配置:
• 哪些人能触发 • 哪些群能触发 • 是否必须 mention • 哪些 channel 绑定哪个 agent • 哪些 topic 绑定 ACP • 哪些动作需要审批 • 哪些能力只在某些渠道开放
这说明 OpenClaw 的设计目标,已经是持续在线、可控、可管理、可审计。
3)审批流和安全边界更像真正系统了
Discord / Telegram 文档里都强调了 exec approvals:
• approvers • dm / channel / both • button approvals • only configured approvers can approve • command text visible in approval prompt • target channel safety considerations
这件事的本质是:
OpenClaw 已经不是“模型想干啥就干啥”的玩具,而是在往 可治理的 agent runtime 走。
这是走向生产可用的关键一步。
七、这次版本给人的真实感受:不是更炫了,而是更稳、更完整了
很多 AI 产品的“新版本”,喜欢堆几个爆点词:
• 多模态 • Agent • 工作流 • 自动化 • 操作系统
但实际用起来,常常是 PPT 很猛,细节一碰就碎。
OpenClaw 这版给我的感受恰恰相反:
它不是最爱喊口号的那一类,但文档里的细节说明了一件事:
它在认真补那些真正影响长期使用的硬骨头。
比如:
• 群组 mention gating • 会话隔离 • topic / thread routing • proxy 与网络异常处理 • preview streaming fallback • token / secret resolution • exec approval routing • voice receive recovery • DM / allowlist / pairing 的安全边界
这些东西都不性感,但它们决定了一个系统能不能长期跑。
而 OpenClaw 这次最大的进步,恰恰就是:
从“能跑”升级到了“能长期跑”。
八、谁最适合升级到这版 OpenClaw?
如果你只是想要一个网页里聊聊天的 AI 助手,那这版 OpenClaw 的价值你未必能第一时间感受到。
但如果你是下面这几类人,这次升级就非常值得:
1)想把 AI 接到多个聊天渠道的人
尤其是:
• Telegram • Discord • WhatsApp • iMessage
如果你希望 一个 AI 多端在线,OpenClaw 的价值非常直接。
2)想把 AI 变成长期工作助手的人
比如你希望它能:
• 做日报 / 周报 • 跑 cron • 管理长期项目 • 多线程处理任务 • 在不同 topic / channel 里保持上下文稳定
那这一版已经明显比“普通聊天机器人”强很多。
3)想做私有化、可控、可扩展 Agent 系统的人
如果你重视:
• 自托管 • 数据控制权 • 工具能力 • 权限边界 • 可组合工作流
那 OpenClaw 已经不只是“值得试试”,而是非常值得认真搭。
九、这一版最值得记住的,不是某个单点 feature,而是方向
如果让我给这次 OpenClaw 新版本提炼一个最重要的判断,我会这么写:
OpenClaw 正在从“多渠道接入 AI”走向“多渠道运行 Agent 系统”。
差别看似只有几个字,实际上是两种完全不同的产品阶段。
前者是:
• 能回消息 • 能连模型 • 能用工具
后者是:
• 有渠道层 • 有运行时 • 有路由层 • 有审批流 • 有自动化 • 有线程绑定 • 有多 Agent • 有语音 • 有节点 • 有控制面
而这,才是一个真正有长期生命力的 AI 系统应该长成的样子。
十、结尾:OpenClaw 正在变成“个人 AI 基础设施”
如果说过去大家讨论 AI 助手,更多还是在聊:
• 哪个模型更强 • 哪个工具更聪明 • 哪个 Agent 更能写代码
那 OpenClaw 这次带来的启发是:
AI 真正走向日常,不只靠模型能力,而要靠基础设施。
你需要它:
• 接得进来 • 跑得起来 • 管得住 • 分得清 • 扩得出去 • 长期在线 • 可持续维护
而 OpenClaw 现在做的,正是这件事。
它不只是给你一个更聪明的聊天对象,
而是在给你搭一个 个人 AI 基础设施底座。
这,才是这次更新最有价值的地方。
夜雨聆风