乐于分享
好东西不私藏

OpenClaw 这次不是更新,是给 Agent 上锁

OpenClaw 这次不是更新,是给 Agent 上锁

这两天我看 OpenClaw 2026.6.1-beta.2的 release,第一反应不是“又多了几个功能”。

而是:

OpenClaw 开始认真处理一个很少有人敢碰的问题:Agent 能不能改自己的大脑。

这句话听起来有点玄。

但落到工程里非常具体。

一个 coding agent 的能力,越来越不只是模型本身,而是一堆外部知识和行为规则:AGENTS.md、skills、plugins、MCP servers、hooks、workflow、memory、工具权限。

这些东西决定它会怎么想、怎么做、能调用什么、什么时候越权。

过去我们总说“给 Agent 加一个 skill”。

听起来像装一个插件。

但真正放到生产环境里,这事没那么轻。

Skill 不是文档。Skill 是 Agent 的行为补丁。

你让 Agent 自己写 skill,再让它自己把 skill 生效,本质上就是让一个能执行任务的系统,自己给自己打补丁。

这在 demo 里很爽。

在生产里很吓人。

OpenClaw 这次的 Skill Workshop,就是在把这件事从“随手写文件”改成“先提案、再审批、可扫描、可回滚”。

这不是花活。

这是 Agent 平台从玩具走向基础设施必须补的一道闸。

先说事实:这版是 beta,但信号很重

OpenClaw 2026.6.1-beta.2是 6 月 1 日发布、6 月 2 日创建记录的一版 prerelease。

官方 release 里最醒目的几条,不是“模型更强了”,而是这些:

✓ Skill Workshop 有了更完整的 Control UI 流程,包括 proposal 列表、today actions、revision handoff、可搜索文件预览、review states、locale coverage、reusable session routing。

✓ skill_workshopagent tool 可以通过 guarded review flow 对显式 proposal 做 apply、reject、quarantine。

✓ proposal 可以携带 approved support files,并带 scanner、hash、rollback safeguards。

✓ Workboard 加了 multi-agent planning 和 run tracking 的 orchestration primitives。

✓ Tokenjuice 和 GitHub Copilot runtime 被外置成官方插件 @openclaw/tokenjuice@openclaw/copilot

✓ session metadata、gateway runtime state、plugin metadata、memory watchers、store writes 等热路径减少重复工作。

✓ provider / plugin 请求补了更多 timer、retry、OAuth/device-code lifetime、media download、local probe、polling 上限,避免一个路径挂住整轮运行。

看起来很散。

但背后其实是一条线:

OpenClaw 在把“Agent 能力扩展”变成“Agent 能力治理”。

这和 4 月底我写 OpenClaw 4.26 时讲的“控制面变厚”是一条连续线。

但这次更具体。

4.26 还像是在补平台骨架。

6.1-beta.2 这次,是开始管 Agent 的“自我改造能力”。

这比普通功能更新危险,也更值钱。

我本地还不是新版本,这点反而能说明问题

我先跑了一下本地环境。

$ openclaw –version OpenClaw 2026.4.5 (3e72c03)

再看 skills 命令:

$ openclaw skills –help 🦞 OpenClaw 2026.4.5 (3e72c03) — Pairing codes exist because even bots believe in consent—and good security hygiene.  Usage: openclaw skills [options] [command]  List and inspect available skills  Commands:   check       Check which skills are ready vs missing requirements   info        Show detailed information about a skill   install     Install a skill from ClawHub into the active workspace   list        List all available skills   search      Search ClawHub skills   update      Update ClawHub-installed skills in the active workspace

注意,这里没有 workshop子命令。

这不是命令写错。

是本机版本还停在 2026.4.5,而 Skill Workshop 是 2026.6.1-beta.2release / docs 里的新体系。

我把这个写出来,是为了避免一个常见误区:

看到文章里的新能力,立刻复制命令,发现本机没有,就以为文档错了。

不是。

OpenClaw 现在变化太快,版本差两个月,控制面已经不是同一代东西。

如果你还在旧版,能用 skills install / list / update,并不代表你已经有 proposal 审批、rollback metadata、support file scanning、Gateway methods 这些治理能力。

这也是这篇文章真正想说的:

AI Agent 平台的差距,已经不只是模型和 UI。

差距开始出现在这些看起来很 boring 的运行时能力里。

Skill Workshop 到底改了什么

官方 docs 里对 Skill Workshop 的定义很直接:

Skill Workshop is OpenClaw’s governed path for creating and updating workspace skills.

关键词是 governed path

不是“skill generator”。

不是“更方便创建 skill”。

而是“受治理的路径”。

它的核心规则很硬:

Agents and operators do not write active SKILL.mdfiles directly through this path. They create a proposal first.

翻成人话:

Agent 和操作者不要直接改活跃的 SKILL.md

先创建 proposal。

proposal 还不是 live skill。

它只是 pending draft。

里面包含 proposed skill content、target binding、scanner state、hashes、support-file metadata、rollback metadata。

只有 apply 之后,它才会变成真正生效的 skill。

这套流程看起来像多此一举。

但我非常喜欢。

因为它承认了一个现实:

Agent 写出来的能力,不能默认立刻变成 Agent 的能力。

这里面必须隔一层。

这层就是 proposal。

proposal 的价值不是“存一个草稿”。

它的价值是把一件危险的事情拆开:

✓ 生成能力

✓ 审查能力

✓ 修改能力

✓ 激活能力

✓ 回滚能力

以前这几件事可能挤在一个 write file里。

现在它们被拆成生命周期。

这就是基础设施的味道。

真正关键的是:active skill 不再是随手写

官方流程是这样的:

create/update -> pending revise        -> pending apply         -> applied reject        -> rejected quarantine    -> quarantined target change -> stale

这张状态机不复杂。

但对 Agent 安全很重要。

因为它让 Skill 的变更有了“中间态”。

中间态意味着什么?

意味着你可以检查。

可以拒绝。

可以隔离。

可以修改。

可以发现目标文件已经变了,然后把 proposal 标成 stale。

target change -> stale这点尤其关键。

如果一个 proposal 是基于旧版 skill 生成的,而 live skill 在 apply 前被其他人改了,直接覆盖就会出事故。

传统软件工程里,这叫并发修改冲突。

Git 里你会 merge conflict。

数据库里你会乐观锁失败。

OpenClaw 在 Skill Workshop 里做的是类似思想:proposal bind 到当前 target hash,目标变了就 stale。

这句话看起来像废话。

但放到 Agent 场景里很要命。

因为 Agent 经常会在长任务里拿着旧上下文做决定。

它不知道另一个会话、另一个人、另一个 automation 已经改了同一个 skill。

如果没有 hash bound / stale 检测,最后就会出现一种很恶心的问题:

你以为 Agent 只是“帮我增强一下 morning routine”。

它实际把别人刚刚加的安全限制覆盖掉了。

这种 bug 不像 RCE 那么刺激。

但生产里非常真实。

支持文件也被纳入审计,这个细节很重要

很多人写 Skill,只看 SKILL.md

但真正复杂的 skill 往往不止一个 markdown。

它可能带:

✓ examples

✓ references

✓ templates

✓ scripts

✓ assets

以前最容易出问题的就是这些旁路文件。

你审了主说明。

脚本里藏了东西。

你看了 markdown。

template 里有危险命令。

你批准了 skill。

support file 里搞了路径穿越。

Skill Workshop 这次把 support files 明确纳入 proposal:扫描、hash、存储,只有 apply 时才写到 live skill 旁边。

而且支持文件必须放在标准目录下:

assets/ examples/ references/ scripts/ templates/

拒绝的东西包括:absolute paths、hidden path segments、path traversal、overlapping paths、proposal 目录里的 executable files、non-UTF-8 text、null bytes、标准目录外文件。

这就是我说它不像普通功能更新的原因。

普通功能更新会说:现在 Skill 支持附带文件啦。

成熟一点的平台会继续问:

这些文件能不能乱放?

能不能覆盖别的路径?

能不能塞二进制?

能不能通过隐藏目录绕过审查?

能不能带可执行文件?

能不能回滚?

OpenClaw 这次答案是:要管。

这不是安全洁癖。

这是因为 Agent 时代的能力扩展,本身就是供应链。

为什么这比“再加一个 Agent”更重要

现在 AI 编程工具很喜欢宣传多 Agent。

几百个 subagents。

后台跑。

自动规划。

自动验证。

这当然重要。

Claude Code 的 dynamic workflows 就是这个方向,官方甚至说可以跑 tens to hundreds of parallel subagents。

但多 Agent 有一个隐藏前提:

你得先知道这些 Agent 的能力边界是谁定义的。

如果能力边界是某个临时写出来的 skill。

如果 skill 可以被 Agent 自己直接写进 live 目录。

如果插件可以半失败半加载。

如果 memory watcher 和 runtime state 乱扫一通。

如果 Gateway / CLI / chat 走的是三套不同逻辑。

那你不是在做多 Agent 编排。

你是在放一群临时工进机房,然后让他们自己改门禁规则。

这才是最恶心的地方。

很多 AI 工具现在都在追“能不能让 agent 干更多活”。

OpenClaw 这版更像是在问另一个问题:

当 Agent 开始干更多活,谁来规定它怎么获得新能力?

这个问题比“多开几个子任务”更基础。

因为能力扩展一旦失控,后面的计划、执行、验收都会被污染。

Workboard 是另一半:能力要被治理,任务也要被看见

Skill Workshop 管的是能力变更。

Workboard 管的是任务编排和可见性。

2026.6.1-beta.2里,Workboard 加了 orchestration primitives 和 agent coordination tools,用于 multi-agent planning 和 run tracking。

还把 task-backed board runs、task comments 接进 edit modal。

这也不是单纯 UI。

Agent 平台里最容易失控的不是单次回答。

而是长任务。

一个长任务可能经历:

✓ plan

✓ spawn subagent

✓ run tool

✓ wait for provider

✓ stream output

✓ compact context

✓ recover after interruption

✓ write artifact

✓ notify channel

✓ wait approval

✓ resume later

如果这些东西只能散落在聊天记录里,人类根本管不住。

Workboard 的价值是把 agent work 从“对话流”抽出来,变成可追踪的工作单元。

这和 Skill Workshop 是配套的。

一个管“能力怎么变”。

一个管“任务怎么跑”。

再加上 release 里那些看起来很碎的修复:session metadata、gateway runtime state、plugin metadata、SQLite-backed state、inbound queues、iMessage monitor state、first-output latency、stream deltas、local drafts。

它们共同解决的是一类问题:

Agent 不应该只在一次聊天里聪明,它应该在长时间运行里可恢复、可观察、可交接。

这才是生产系统。

插件外置也是一个信号:核心开始瘦身,生态开始分层

这版还有两个细节:

✓ Tokenjuice 被外置成官方 @openclaw/tokenjuice插件。

✓ GitHub Copilot agent runtime 被外置成官方 @openclaw/copilot插件。

这件事别只看成“拆包”。

拆包背后的信号是:OpenClaw 开始把核心 runtime 和能力插件分层。

早期平台最容易犯的错,是把所有能力都塞进核心。

一开始很爽。

用户装一个东西,什么都有。

但很快会变成灾难。

因为每个 provider、每个 runtime、每个 channel、每个 token 统计工具、每个媒体生成能力,都有自己的依赖、认证、更新节奏、失败模式。

全塞进 core,最后 core 变成垃圾场。

外置官方插件的好处是:

能力可以独立发布。

故障可以隔离。

依赖可以独立扫描。

加载失败可以给明确 repair path。

不同用户可以按需装。

这也是为什么 release 里同时出现了 SecretRef plugin manifests、plugin install index 持久化到 SQLite、plugin loader failure guidance、package-boundary prep timeout cleanup 等等。

这些词都不性感。

但它们决定插件生态能不能活。

一个 Agent 平台最怕的不是没有插件。

最怕的是插件越来越多,但每个插件都能把核心拖死。

这版还有一堆“防挂死”的修复

如果你只想看大功能,可能会跳过 release 里的 timer、retry、polling、probe、timeout。

但我建议别跳。

OpenClaw 这版反复出现一个动作:bound。

给 provider 请求加上限。

给 plugin 请求加上限。

给 OAuth/device-code lifetime 加上限。

给 media download 加上限。

给 generated-content polling 加上限。

给 local service probe 加上限。

给 readiness probe、status polling、response body、child workflow waits 加上限。

这不是细枝末节。

这是长任务 Agent 的命门。

传统 CLI 命令挂住,最多你 Ctrl-C。

Agent 平台挂住,可能拖住的是一个 session、一条 channel reply、一个 mobile delivery、一段 media generation、一个 cron job、一个 gateway queue。

如果没有 timeout boundary,Agent 会把“等待”误当成“工作”。

然后系统进入最烦人的状态:

不失败。

不成功。

不报错。

不退出。

卡着。

生产里最怕这种。

因为失败至少有信号。

卡住没有。

所以我判断 OpenClaw 这版的底层取向很明确:

少一点魔法,多一点边界。

这和 Skill Workshop 是同一种工程哲学。

能力要有边界。

任务要有边界。

插件要有边界。

网络请求要有边界。

状态存储要有边界。

没有边界的 Agent,能力越强,事故越大。

团队现在应该怎么理解这次更新

如果你只是个人玩 OpenClaw,这版可能不会让你立刻兴奋。

它不像一个按钮,点了就“哇”。

但如果你开始把 OpenClaw 放进稳定工作流,比如:

✓ 多个 agent 分工

✓ 多个 channel 收发

✓ skills 长期沉淀

✓ 插件接公司工具

✓ Cron / automation 定期跑

✓ Codex / Copilot / Tokenjuice 这类 runtime 混用

✓ 有人从手机、Telegram、Slack、Control UI 里触发任务

那这版就很关键。

因为它补的是“多入口、多能力、多状态”之后必然出现的问题。

我的建议很简单。

第一,别把 Skill 当普通文档。

Skill 会改变 Agent 行为。

能改变行为的东西,就要走 review。

第二,别允许 Agent 直接写 live skill。

能走 Skill Workshop,就走 proposal。

生成和生效中间必须有一层。

第三,support files 一定要审。

尤其是 scripts/templates/references/

别只看 SKILL.md

第四,插件不要无脑全装。

官方外置插件也应该按需启用,出问题要能禁用、能回滚、能定位。

第五,长任务要看 Workboard,不要只看聊天流。

聊天是交互界面,不是运维面板。

第六,升级前确认版本。

本机如果还是 2026.4.5,你看不到很多 6.1 的治理能力。

别拿旧版体验判断新版架构。

我的判断

OpenClaw 2026.6.1-beta.2不是那种适合拿来吹的版本。

它没有一个“震撼全网”的模型能力。

但它有一个更重要的信号:

OpenClaw 开始把 Agent 的能力变更,纳入正式治理链路。

这件事比很多炫技功能更关键。

因为 Agent 未来一定会越来越会写工具、写技能、写自动化、写自己的工作流。

如果平台不先规定这些能力怎么被提出、审查、生效、隔离、回滚,后面一定会乱。

真正成熟的 Agent 系统,不是让 Agent 想干什么就干什么。

而是让 Agent 每一次扩展自己,都留下可以审的痕迹。

这就是 Skill Workshop 的意义。

它不是让 OpenClaw 更“聪明”。

它是让 OpenClaw 更不容易失控。

我的判断是:

AI 编程工具的下一阶段,不是谁的 Agent 更猛,而是谁能管住 Agent 变猛的过程。

这句话可能没有“百 Agent 并发”听起来刺激。

但如果你真的要把 Agent 放进生产环境,这才是保命的东西。