乐于分享
好东西不私藏

今天,OpenClaw可以开口说话了,但也带来了很多Bug,10个版本没修完

今天,OpenClaw可以开口说话了,但也带来了很多Bug,10个版本没修完

昨天一整天,OpenClaw 的 GitHub 发布页几乎每隔一两个小时就刷新一次。

beta.1、beta.2、beta.3……一路打到 beta.10。

10个版本,一天之内。

我第一反应是:出事了,在救火。结果点进去一看,不是救火——是新功能上线了。但多看两眼,救火和上新功能,好像也不是非此即彼的事。


这次最大的变化是语音。

OpenClaw 原来是纯文字助手,这批版本之后,它可以说话了。在聊天里发 /tts latest,它朗读最新回复;开 /tts chat on,它自动把每条消息转成语音条发给你。支持的供应商一下扩了一大批:Azure Speech、ElevenLabs v3、Volcengine、小米、Inworld,还有本地离线合成。

然后我往下看支持的平台:WhatsApp、Discord、Google Meet。

国内用户能用的,就剩飞书和 QQBot。

飞书是企业用户,QQBot 需要自己申请部署。换句话说,这次让 AI “开口说话”的主角功能,对绝大多数国内个人用户来说,跟没发一样。

这不是 OpenClaw 第一次这样。它的核心能力矩阵——平台集成、语音通话、浏览器自动化——背后的接入对象几乎全是海外服务。产品本身没有问题,但它的用户画像写的就是海外开发者和企业用户,国内个人用户装上去能跑通的功能,其实比看起来少得多。


一天之内,10个测试版,beta.5-10均无发布说明

一天10个版本,是勤奋还是乱?

说实话,两个都有。

beta.1 到 beta.4 的更新日志写得很详细,这批是真正的功能上线:语音系统、插件注册表重构、OpenTelemetry 可观测性覆盖、浏览器自动化改进……每一条都有对应的 issue 编号和贡献者署名,不是随便发的。

但 beta.5 到 beta.10,六个版本,没有发布说明。

六个没有说明的版本,一天之内,接在新功能上线之后——这基本就是”上线之后发现问题、修、再修、再修”的节奏。不丢人,正常,但也说明这个版本并没有准备好。

项目现在 GitHub 上 3700 多个 issue 开着,3500 多个 PR 在排队。体量大到这个程度,任何新功能上线都会触发一波新的 bug 报告,主干分支随时处于某种程度的混乱里。我自己装过一段时间,更新路径上各种小问题:LaunchAgent token 失效、插件注册表不同步、首次启动卡住——都是真实遇到过的,不是极端情况。

这次更新日志里有一行让我印象深:

mark OPENCLAW_DISABLE_PERSISTED_PLUGIN_REGISTRY as a deprecated break-glass switch

“break-glass switch”是紧急逃生开关的意思。他们在把一个紧急逃生开关标记为废弃,因为正式的修复路径已经到位了。

这种细节说明项目在往好的方向走,但也说明之前确实出过需要紧急逃生的情况。


这就是用 365k star 的热门开源项目的真实处境:

它在高速奔跑,功能在增加,架构在改善,贡献者来自全球,更新日志写得比很多商业产品认真。

但它同时也在每天欠债——新功能带来新 bug,新 bug 带来新补丁,新补丁带来新版本号。一天 10 个 tag 不是荣誉徽章,是债务可视化。

对于想用它的国内用户,我的建议是:先想清楚你要接哪个平台,再装。如果你的用例只是本地跑一个 AI 助手,它其实不是最省心的选择——你需要接受随时可能需要手动修配置文件这件事。

如果你的用例是企业多平台部署、需要可观测性、需要插件系统,那它几乎是唯一认真在做这件事的开源项目。

能不能用,取决于你是哪种用户。


你现在用 OpenClaw主要是干什么?是替代搜索、写代码、还是别的?