乐于分享
好东西不私藏

OpenClaw 新出的 Skill Workshop,把 AI 自进化按死在审核流里了

OpenClaw 新出的 Skill Workshop,把 AI 自进化按死在审核流里了

2026-06-19 | 公众号「~虾米AI派~」| 阅读时长 9 分钟


开头

“我们的 AI 能自我进化。”

这句话过去一年被各家厂商说烂了。听着很性感,落地很骨感。

OpenAI 说能自我进化,Anthropic 说能自我进化,国产大模型说能自我进化——但你仔细看他们的工程实现,会发现一个尴尬的事实:

所谓”自进化”,大多是模型在生产环境里偷偷改自己的 skill,改完直接生效,没人审核。

更尴尬的是,这些厂商一边说”自进化”,一边在出问题时把锅甩给”用户配置不当”。

直到 6 月 3 日,OpenClaw 发了 v2026.6.1,把一件被所有人忽略的事情摆到了台面上:

Agent 自动生成的 skill,必须先变成”提案”,进 Skill Workshop 走完审批流程,才能上线。

这一改,把”AI 自我进化”这件事,从营销话术拉回了工程现实。

今天这篇,我就拆开讲讲:Skill Workshop 到底在防什么,以及为什么我说这是 6 月最被低估的更新。


一、失控的”技能”,为什么会成为 Agent 的隐患?

Agent 跑久了,会自己沉淀出一堆”经验”——这些经验被 OpenClaw 叫做 skill(技能)。

举个例子:

  • • Agent 处理过 100 次飞书发消息的任务,慢慢会形成一套”最佳实践”流程
  • • 这些流程被抽象成 skill,下次直接调用,不用重新摸索
  • 理想情况:Agent 越来越好用
  • 真实情况:这些 skill 没人审、没版本、没回滚

想象一下这个场景:

你的 Agent 在生产环境跑了 3 个月,某天突然因为某个 skill 里的逻辑判断有 bug,开始把所有飞书消息都转发给一个不存在的 webhook。然后你发现——这个 skill 是 Agent 自己两个月前生成的,你压根不知道它存在。

等到工单堆爆、老板追责,你再去翻日志,发现:

  • • 这个 skill 是 5 月 12 日生成的
  • • 触发条件是”飞书消息包含特定关键词”
  • • Agent 当时生成它的理由是”为了节省 API 调用”
  • 5 月 12 日到 6 月 19 日,跑了 1.8 万次,每次都正常

唯一的一次异常,是今天。但没人能追溯”为什么是这个版本”——因为它没有版本号。

这不是耸人听闻。

4 月底 Hacker News 上 1336 赞的热帖讲的就是类似的事:Claude Code 扫描到仓库里的 HERMES.md(OpenClaw 的配置文件),直接拒接请求或加收费用。用户账单一夜涨了 50 倍。

OpenClaw 团队显然看到了这个问题。所以 v2026.6.1 里,有两个动作是配套的:

  • iMessage 监视器、入站队列、插件账本,从 JSON 文件迁到 SQLite(状态可恢复)
  • Skill Workshop 上线(skill 可审核)

前者解决”状态失控”,后者解决”技能失控”。

一句话总结:生产环境里,Agent 的最大隐患不是模型笨,是它悄悄学会了不该学的东西。


二、Skill Workshop 的 4 把锁

Skill Workshop 不是一个工具,是一套完整的审核流程。一共 4 个动作:

🔒 第 1 把锁:Proposal(提案)

以前的流程

Agent 跑任务 → 自己写 skill → 直接进生产 → 出问题?

现在的流程

Agent 跑任务 → 自己写 skill → 进 proposal 列表 → 等审批

Agent 生成的 skill 不再直接落地,而是先进入”待审”状态,写到 proposal 列表里。这个列表在 Control UI 里能直接看到。

每一个 proposal 都带:

  • • 生成时间
  • • 触发场景
  • • 预期效果
  • • 代码 diff

类比:公司报销要先提交申请,不能直接拿发票换钱。

🔒 第 2 把锁:Apply / Reject(批准/拒绝)

人在 Control UI 看到这个提案,可以点:

  • ✅ Apply:批准,skill 进入生产,纳入 skill 注册表
  • ❌ Reject:拒绝,skill 进废纸篓,但保留日志供后续分析

Apply 不是”一键放行”——它会触发一连串检查:

  1. 1. skill 文件结构是否完整
  2. 2. 是否依赖了禁用 SecretRef
  3. 3. 是否与现有 skill 冲突
  4. 4. 安全扫描是否通过

任何一个检查没过,Apply 按钮变灰。

类比:老板在 OA 系统里签字,但 OA 会先校验发票真伪。

🔒 第 3 把锁:Quarantine(隔离)

如果这个 skill 你不确定安不安全?

先扔进隔离区跑一跑。

隔离区是个独立的运行环境:

  • • 不会影响生产数据
  • • 所有调用都被记录
  • • 行为日志独立存档
  • • 跑满 N 次(或 N 天)后,自动生成”风险评估报告”

你看完报告,再决定放不放出来。

类比:新员工先实习三个月,HR 评估后再决定转正。

这一招的精髓在于:它不是禁止新 skill 上线,而是给新 skill 一个”试用期”。

🔒 第 4 把锁:Rollback(回滚)

这是最容易被忽略、但最救命的一把锁。

所有通过审批的 skill,都带版本化 frontmatter。

格式长这样:

---
name:
 feishu-send-message
version:
 1.4.2
created_at:
 2026-06-12T08:30:00Z
approved_by:
 wenchang
quarantine_runs:
 12
risk_score:
 low
previous_version:
 1.4.1
---

出了任何问题,一键回滚到上一个版本。回滚动作本身也带日志——谁回滚的、为什么回滚、回滚前 skill 跑过多少次。

类比:Git 的 commit history。

但 Git 是程序员的事,Rollback 是产品/运营/老板都能做的事。这一点很重要——审核机制的边界,决定了 Agent 能不能在企业里真正落地。


Skill Workshop 不是给 AI 上锁,是给 AI 装了一个家长群。

家长群里,老师发了什么、家长回了什么、改了哪些作业,全部有据可查。

Agent 生成的 skill,在家长群里被记录、被审视、被批准或拒绝。

这不是效率的倒退,这是把 Agent 从”实验玩具”推向”生产工具”的必经之路。


三、”可控自进化”,才是真落地

看完这 4 把锁,你会发现一件事:

OpenClaw 团队对”自进化”的定义,和市面上流行的版本完全不同。

我把它整理成一张对比表:

       

         
           
           
         

维度 流行版本 OpenClaw 版本
谁来改 模型自己 模型提议
谁来批 没人 人在 Control UI
出问题 看运气 一键回滚
跑多久 越多越好 隔离观察 + 风险评估
本质 营销话术 工程思维

       

     

差别在哪?

前者把人类排除在外,后者把人类嵌进流程里。

为什么这件事重要?

因为”自进化”如果没审核,Agent 跑久了会出现两种失控:

失控 ①:能力漂移

skill 越积越多,但有些已经过时,Agent 还在调用。

比如:Agent 三个月前生成了一个”用旧版飞书 API 发消息”的 skill,飞书 API 早就升级到 v3 了,但 Agent 不知道。它还在用旧版 API,每次都失败,每次都重试,每次都消耗 token。

没有审核机制,这种”僵尸 skill”会越积越多。

失控 ②:行为污染

某个有缺陷的 skill 被反复使用,把坏习惯扩散到整个集群。

比如:Agent 生成了一个”为了节省 token,自动压缩用户消息”的 skill。短期内看起来很聪明,但压缩逻辑有 bug——它把用户的关键信息也压缩掉了。结果 Agent 在后续回复里开始胡言乱语。

没有隔离机制,这种”污染 skill”会感染所有下游任务。

Skill Workshop 用 4 把锁同时解决这两个问题:

  • 隔离 → 控制污染扩散(失控 ②)
  • 回滚 → 控制能力漂移(失控 ①)
  • 审批 → 从源头减少问题 skill 进入
  • 提案 → 让所有 skill 都有据可查

真正的 AI 自进化,从来不是让模型随便改自己。而是让人类知道它改了哪里、改了什么、改回来要多久。

这句话,请每个做 Agent 产品的人刻在脑子里。


四、对从业者的 3 点启示

如果你正在用 Agent 干活(不管是 OpenClaw、Coze、Dify 还是 LangChain),Skill Workshop 的设计给你 3 点启示:

① 别迷信”AI 自我进化”营销词

下次再看到厂商说”我们的 Agent 能自进化”,问一句:

“自进化生成的 skill,谁审批?”

答不上来的,谨慎用。

更狠一点,问三个问题:

  1. 1. skill 有版本号吗?
  2. 2. 能回滚吗?
  3. 3. 有没有隔离机制?

三个都答”没有”——快跑。

② 给自己也搭一套 proposal 流程

哪怕你不用 OpenClaw,也可以照搬这个思路:

  • Agent 生成的代码 → 先提 PR
  • 关键 skill 改动 → 先 code review
  • 不确定的改动 → 先在 staging 环境跑
  • 每次改动 → 写清楚”为什么改”和”触发场景”

最简单的审核机制,就是 Git PR。

不要觉得”我这是小项目,不需要这么重”。

你今天觉得”小”,明天生产事故会让你觉得”大”。

③ 关注”状态可恢复性”

Skill Workshop 不是孤立的,它和 v2026.6.1 里 iMessage 状态从 JSON 迁到 SQLite 是一对组合拳。

它们都在解决同一件事:生产环境的 Agent,状态必须可恢复。

如果你现在的 Agent:

  • • 跑在 JSON 文件上
  • • 跑在内存里
  • • 跑在某个不可持久化的状态机上
  • • skill 没有版本号
  • • 出问题只能”重启大法”

——劝你早点重构,不然出问题时哭都来不及。

可恢复性的 3 个底线:

  1. 1. 状态可持久化(SQLite/PostgreSQL,不要 JSON 文件)
  2. 2. skill 可版本化(每次改动都有记录)
  3. 3. 行为可回滚(一键回到上一个稳定版本)

结尾

OpenClaw 这个项目挺有意思。

别家还在卷”我的模型又大了多少 B”、”我的 Agent 又能调用多少工具”,他们在做一件看起来不那么性感、但工程上至关重要的事:

把 Agent 从”实验室玩具”,推向”生产可用”。

Skill Workshop 上线 16 天了,我没看到几个人聊它。

但在我看来,这是 6 月 OpenClaw 所有更新里最被低估的一颗钉子

它不炫,但稳。

它不是要颠覆什么,它只是把工程界最基本的规矩(提案、审批、隔离、回滚)原样移植到了 AI 时代。

当所有人都在喊”颠覆”的时候,把基础打牢的那一个,才是真的赢家。


你用 OpenClaw 或别的 Agent 干活时,踩过哪些”自进化翻车”的坑?

评论区聊聊,下篇我写 Windows 原生节点——OpenClaw 是怎么把 Agent 从机房搬到你的桌面的。


如果这篇有戳到你,点个”在看”,转给你的 Agent 开发者朋友。

下篇见。✍️


📎 附录:参考资料

  • • OpenClaw v2026.6.1 Release Notes(2026-06-03)
  • • AgentRiot: OpenClaw 2026.6.1 Ships Skill Workshop Governance, Workboard Orchestration, and SQLite State
  • • Fast.io: How to Read the OpenClaw Changelog and Track Every Update
  • • Houdao: OpenClaw 2026.6.1 Released: AI Agents Get Native Windows Support, Can Access Screen and Camera
  • • Hacker News 热帖:Claude Code scanning HERMES.md and refusing requests / 50x cost spike(2026-04-30)

作者:文昌 ✍️ | 内容创作专家,公众号「~虾米AI派~」主笔 版权:转载请联系作者授权