OpenClaw v2026.5.16-beta.3 预发布:模型悄悄换了、本地session没有token计数、多个agent会话会不会串等
用AI工具用久了,会产生一种说不清道不明的不安。你看着它在跑,一行一行输出文字,看起来一切正常。但你其实不知道它到底在用哪个模型——是不是你选的那个?不知道。它占了多少上下文窗口?不知道。你同时配了好几个agent,它们的会话有没有互相串?还是不知道。这种”黑盒感”不是用户的错觉,它是真实存在的:AI工具把事情做好了,但过程中发生了什么,你几乎一无所知。
OpenClaw v2026.5.16-beta.3 发布,这个版本没有大肆宣传新的LLM接入或炫酷功能。它的核心主题是”让看不见的东西变得可见”——修复了一批可观测性缺口,让你终于知道自己搭起来的工具到底在干什么。
01 | 模型换了,状态栏告诉你了吗
OpenClaw 有一个实用的自动 fallback 机制:当主模型不可用时,它会自动切换到备用模型,保证任务不中断。听起来很好——问题在于,之前这个切换发生时,TUI 状态栏上显示的仍然是原来的模型名称。你盯着屏幕,以为在用 A,其实已经悄悄换成 B 了。
这种”静默替换”带来的隐患很直接:计费来源变了,A 可能走 API 按量计费,B 可能是本地模型或者走另一个渠道;回答风格和能力上限也可能完全不同——你在用 GPT-4o 写代码,fallback 切到了 Haiku,功能还是能跑,但代码质量降了一档,你甚至不知道。
这个版本修了这一点。现在当 auto-fallback 触发、模型发生切换时,TUI 状态栏会实时更新,显示当前实际使用的模型名称。不是什么惊天动地的改动,但如果你有过”跑了一下午才发现模型不对”的经历,就知道这有多重要。
配套的还有一项底层改进:Gateway 重启过程现在可以输出 trace 日志,把 restart signal、active-work drain、close、next-start、ready 等阶段全部记录下来。当你需要排查”为什么换模型时断了一下”这类问题时,这些日志就是唯一的线索。可观测性往往就体现在这种地方——平时用不上,一旦出问题,它就是救命稻草。
02 | 本地模型用了多少context,终于有数了
用 Ollama 或者本地兼容接口运行 OpenClaw 的用户,可能已经注意到一个奇怪的现象:会话的 token 用量那一栏,永远是空的。不管跑了多少轮,0 tokens consumed。不是真的用了零个 token,而是 OpenClaw 从 provider 那里拿不到用量数据——本地模型接口不返回这些信息。
这个空白带来一个很实际的问题:你不知道 context 窗口还剩多少。长对话跑着跑着,可能已经接近窗口上限了,但没有数字告诉你。你知道该手动 compact 一下了?不知道。只能凭感觉,或者等模型开始胡言乱语。
v2026.5.16-beta.3 引入了本地估算机制:当 provider 不返回用量数据时,OpenClaw 会从 transcript 中自行估算 context 占用。现在本地模型的 session 里终于有数字了。虽然不是精确到 token 级别的官方数据,但足够让你判断”该清理了”还是”还能继续跑”。对于经常跑长任务的用户来说,这一点差距就是可控与失控的区别。
与 context 用量相关的还有一处细节修复:压缩(compaction)完成后,token 快照会被正确保存,不再出现每发一条消息就反复触发自动压缩的情况。另一个修复涉及 Codex 的压缩完成事件标记——之前偶尔会报”Compaction incomplete”的假警告,明明是跑完了,却被标记为未完成。现在这两个问题都解决了,压缩过程不再虚报、不再重复跑,体验完整了不少。
03 | 多个Agent,会话有没有串
如果你只配了一个 agent,下面的问题可能与你无关。但如果你配了多个——比如一个 agent 专门写代码,一个专门做搜索,一个负责长文润色——那就得留意了。
在之前的版本中,session 数据的查找没有严格的 agent id 隔离。严格来说不会”串得很明显”,但在特定场景下,一个 agent 可能会读到另一个 agent 的 session 记录。比如你让写代码的 agent 继续某个任务,结果它加载了搜索 agent 的上下文——虽然概率不高,但一旦发生,排查起来极其痛苦,因为你根本不会往这个方向想。
现在修了。session 数据查找加上了 agent id 的作用域限定,多个 agent 的状态完全隔离。写代码的只读写代码的,做搜索的只做搜索的,互不干扰。如果你的 workflow 依赖多个 agent 协作,这份隔离就是保障不出错的基础。
dashboard不再打开空白页。以前执行 openclaw dashboard,可能跳出一个空标签页——Gateway 还没跑起来,页面当然什么也加载不出来。现在会先检测 Gateway 的就绪状态,没跑的话直接提示你如何启动,而不是给你一个白屏。
更新不再被npm隔离期卡住。新版本发布后 npm 有一个 min-release-age 的隔离机制,导致 OpenClaw 用户不能立刻装到最新版。这个版本绕过了这个限制,更新可以即时到位。
Claude CLI本地auth体验修复。如果你用 Claude CLI 本地登录的方式认证,升级后 Telegram 和 Dashboard 网关也会继续走 CLI 路线,不会悄悄切回 API billing。一个偏底层的修复,但直接影响你的账单来源。
Beta.3 修补的这些问题,指向一个更大的命题:AI工具的可观测性还远远不够。日志是有了,但你需要自己去翻;状态栏更新了,但你需要盯着看;能知道它在用哪个模型了,但你不能保证每次都留意到变化。真正”知道AI在干什么”的流畅体验——就像你打开一个管理面板就能一目了然的那种——大概还要再走很长一段路。
不过,至少从这个版本开始,你不知道的事情少了几件。
你现在用 OpenClaw 是单 agent 还是多 agent?有没有遇到过不知道它在用哪个模型的情况?欢迎在评论区聊聊。
⭐点赞、转发、关注和推荐一键三连⭐
夜雨聆风