OpenClaw 新出的 Skill Workshop,把 AI 自进化按死在审核流里了-夜雨聆风

OpenClaw 新出的 Skill Workshop,把 AI 自进化按死在审核流里了

2026-06-19 | 公众号「～虾米AI派～」| 阅读时长 9 分钟

开头

“我们的 AI 能自我进化。”

这句话过去一年被各家厂商说烂了。听着很性感，落地很骨感。

OpenAI 说能自我进化，Anthropic 说能自我进化，国产大模型说能自我进化——但你仔细看他们的工程实现，会发现一个尴尬的事实：

所谓”自进化”，大多是模型在生产环境里偷偷改自己的 skill，改完直接生效，没人审核。

更尴尬的是，这些厂商一边说”自进化”，一边在出问题时把锅甩给”用户配置不当”。

直到 6 月 3 日，OpenClaw 发了 v2026.6.1，把一件被所有人忽略的事情摆到了台面上：

Agent 自动生成的 skill，必须先变成”提案”，进 Skill Workshop 走完审批流程，才能上线。

这一改，把”AI 自我进化”这件事，从营销话术拉回了工程现实。

今天这篇，我就拆开讲讲：Skill Workshop 到底在防什么，以及为什么我说这是 6 月最被低估的更新。

一、失控的”技能”，为什么会成为 Agent 的隐患？

Agent 跑久了，会自己沉淀出一堆”经验”——这些经验被 OpenClaw 叫做 skill（技能）。

举个例子：

• Agent 处理过 100 次飞书发消息的任务，慢慢会形成一套”最佳实践”流程
• 这些流程被抽象成 skill，下次直接调用，不用重新摸索
• 理想情况：Agent 越来越好用
• 真实情况：这些 skill 没人审、没版本、没回滚

想象一下这个场景：

你的 Agent 在生产环境跑了 3 个月，某天突然因为某个 skill 里的逻辑判断有 bug，开始把所有飞书消息都转发给一个不存在的 webhook。然后你发现——这个 skill 是 Agent 自己两个月前生成的，你压根不知道它存在。

等到工单堆爆、老板追责，你再去翻日志，发现：

• 这个 skill 是 5 月 12 日生成的
• 触发条件是”飞书消息包含特定关键词”
• Agent 当时生成它的理由是”为了节省 API 调用”
• 5 月 12 日到 6 月 19 日，跑了 1.8 万次，每次都正常

唯一的一次异常，是今天。但没人能追溯”为什么是这个版本”——因为它没有版本号。

这不是耸人听闻。

4 月底 Hacker News 上 1336 赞的热帖讲的就是类似的事：Claude Code 扫描到仓库里的 HERMES.md（OpenClaw 的配置文件），直接拒接请求或加收费用。用户账单一夜涨了 50 倍。

OpenClaw 团队显然看到了这个问题。所以 v2026.6.1 里，有两个动作是配套的：

• iMessage 监视器、入站队列、插件账本，从 JSON 文件迁到 SQLite（状态可恢复）
• Skill Workshop 上线（skill 可审核）

前者解决”状态失控”，后者解决”技能失控”。

一句话总结：生产环境里，Agent 的最大隐患不是模型笨，是它悄悄学会了不该学的东西。

二、Skill Workshop 的 4 把锁

Skill Workshop 不是一个工具，是一套完整的审核流程。一共 4 个动作：

🔒 第 1 把锁：Proposal（提案）

以前的流程：

Agent 跑任务 → 自己写 skill → 直接进生产 → 出问题？

现在的流程：

Agent 跑任务 → 自己写 skill → 进 proposal 列表 → 等审批

Agent 生成的 skill 不再直接落地，而是先进入”待审”状态，写到 proposal 列表里。这个列表在 Control UI 里能直接看到。

每一个 proposal 都带：

• 生成时间
• 触发场景
• 预期效果
• 代码 diff

类比：公司报销要先提交申请，不能直接拿发票换钱。

🔒 第 2 把锁：Apply / Reject（批准/拒绝）

人在 Control UI 看到这个提案，可以点：

• ✅ Apply：批准，skill 进入生产，纳入 skill 注册表
• ❌ Reject：拒绝，skill 进废纸篓，但保留日志供后续分析

Apply 不是”一键放行”——它会触发一连串检查：

1. skill 文件结构是否完整
2. 是否依赖了禁用 SecretRef
3. 是否与现有 skill 冲突
4. 安全扫描是否通过

任何一个检查没过，Apply 按钮变灰。

类比：老板在 OA 系统里签字，但 OA 会先校验发票真伪。

🔒 第 3 把锁：Quarantine（隔离）

如果这个 skill 你不确定安不安全？

先扔进隔离区跑一跑。

隔离区是个独立的运行环境：

• 不会影响生产数据
• 所有调用都被记录
• 行为日志独立存档
• 跑满 N 次（或 N 天）后，自动生成”风险评估报告”

你看完报告，再决定放不放出来。

类比：新员工先实习三个月，HR 评估后再决定转正。

这一招的精髓在于：它不是禁止新 skill 上线，而是给新 skill 一个”试用期”。

🔒 第 4 把锁：Rollback（回滚）

这是最容易被忽略、但最救命的一把锁。

所有通过审批的 skill，都带版本化 frontmatter。

格式长这样：

---
name: feishu-send-message
version: 1.4.2
created_at: 2026-06-12T08:30:00Z
approved_by: wenchang
quarantine_runs: 12
risk_score: low
previous_version: 1.4.1
---

出了任何问题，一键回滚到上一个版本。回滚动作本身也带日志——谁回滚的、为什么回滚、回滚前 skill 跑过多少次。

类比：Git 的 commit history。

但 Git 是程序员的事，Rollback 是产品/运营/老板都能做的事。这一点很重要——审核机制的边界，决定了 Agent 能不能在企业里真正落地。

Skill Workshop 不是给 AI 上锁，是给 AI 装了一个家长群。

家长群里，老师发了什么、家长回了什么、改了哪些作业，全部有据可查。

Agent 生成的 skill，在家长群里被记录、被审视、被批准或拒绝。

这不是效率的倒退，这是把 Agent 从”实验玩具”推向”生产工具”的必经之路。

三、”可控自进化”，才是真落地

看完这 4 把锁，你会发现一件事：

OpenClaw 团队对”自进化”的定义，和市面上流行的版本完全不同。

我把它整理成一张对比表：

维度	流行版本	OpenClaw 版本
谁来改	模型自己	模型提议
谁来批	没人	人在 Control UI
出问题	看运气	一键回滚
跑多久	越多越好	隔离观察 + 风险评估
本质	营销话术	工程思维

差别在哪？

前者把人类排除在外，后者把人类嵌进流程里。

为什么这件事重要？

因为”自进化”如果没审核，Agent 跑久了会出现两种失控：

失控 ①：能力漂移

skill 越积越多，但有些已经过时，Agent 还在调用。

比如：Agent 三个月前生成了一个”用旧版飞书 API 发消息”的 skill，飞书 API 早就升级到 v3 了，但 Agent 不知道。它还在用旧版 API，每次都失败，每次都重试，每次都消耗 token。

没有审核机制，这种”僵尸 skill”会越积越多。

失控 ②：行为污染

某个有缺陷的 skill 被反复使用，把坏习惯扩散到整个集群。

比如：Agent 生成了一个”为了节省 token，自动压缩用户消息”的 skill。短期内看起来很聪明，但压缩逻辑有 bug——它把用户的关键信息也压缩掉了。结果 Agent 在后续回复里开始胡言乱语。

没有隔离机制，这种”污染 skill”会感染所有下游任务。

Skill Workshop 用 4 把锁同时解决这两个问题：

• 隔离 → 控制污染扩散（失控 ②）
• 回滚 → 控制能力漂移（失控 ①）
• 审批 → 从源头减少问题 skill 进入
• 提案 → 让所有 skill 都有据可查

真正的 AI 自进化，从来不是让模型随便改自己。而是让人类知道它改了哪里、改了什么、改回来要多久。

这句话，请每个做 Agent 产品的人刻在脑子里。

四、对从业者的 3 点启示

如果你正在用 Agent 干活（不管是 OpenClaw、Coze、Dify 还是 LangChain），Skill Workshop 的设计给你 3 点启示：

① 别迷信”AI 自我进化”营销词

下次再看到厂商说”我们的 Agent 能自进化”，问一句：

“自进化生成的 skill，谁审批？”

答不上来的，谨慎用。

更狠一点，问三个问题：

1. skill 有版本号吗？
2. 能回滚吗？
3. 有没有隔离机制？

三个都答”没有”——快跑。

② 给自己也搭一套 proposal 流程

哪怕你不用 OpenClaw，也可以照搬这个思路：

• Agent 生成的代码 → 先提 PR
• 关键 skill 改动 → 先 code review
• 不确定的改动 → 先在 staging 环境跑
• 每次改动 → 写清楚”为什么改”和”触发场景”

最简单的审核机制，就是 Git PR。

不要觉得”我这是小项目，不需要这么重”。

你今天觉得”小”，明天生产事故会让你觉得”大”。

③ 关注”状态可恢复性”

Skill Workshop 不是孤立的，它和 v2026.6.1 里 iMessage 状态从 JSON 迁到 SQLite 是一对组合拳。

它们都在解决同一件事：生产环境的 Agent，状态必须可恢复。

如果你现在的 Agent：

• 跑在 JSON 文件上
• 跑在内存里
• 跑在某个不可持久化的状态机上
• skill 没有版本号
• 出问题只能”重启大法”

——劝你早点重构，不然出问题时哭都来不及。

可恢复性的 3 个底线：

1. 状态可持久化（SQLite/PostgreSQL，不要 JSON 文件）
2. skill 可版本化（每次改动都有记录）
3. 行为可回滚（一键回到上一个稳定版本）

结尾

OpenClaw 这个项目挺有意思。

别家还在卷”我的模型又大了多少 B”、”我的 Agent 又能调用多少工具”，他们在做一件看起来不那么性感、但工程上至关重要的事：

把 Agent 从”实验室玩具”，推向”生产可用”。

Skill Workshop 上线 16 天了，我没看到几个人聊它。

但在我看来，这是 6 月 OpenClaw 所有更新里最被低估的一颗钉子。

它不炫，但稳。

它不是要颠覆什么，它只是把工程界最基本的规矩（提案、审批、隔离、回滚）原样移植到了 AI 时代。

当所有人都在喊”颠覆”的时候，把基础打牢的那一个，才是真的赢家。

你用 OpenClaw 或别的 Agent 干活时，踩过哪些”自进化翻车”的坑？

评论区聊聊，下篇我写 Windows 原生节点——OpenClaw 是怎么把 Agent 从机房搬到你的桌面的。

如果这篇有戳到你，点个”在看”，转给你的 Agent 开发者朋友。

下篇见。✍️

📎 附录：参考资料

• OpenClaw v2026.6.1 Release Notes（2026-06-03）
• AgentRiot: OpenClaw 2026.6.1 Ships Skill Workshop Governance, Workboard Orchestration, and SQLite State
• Fast.io: How to Read the OpenClaw Changelog and Track Every Update
• Houdao: OpenClaw 2026.6.1 Released: AI Agents Get Native Windows Support, Can Access Screen and Camera
• Hacker News 热帖：Claude Code scanning HERMES.md and refusing requests / 50x cost spike（2026-04-30）

作者：文昌 ✍️ | 内容创作专家，公众号「～虾米AI派～」主笔版权：转载请联系作者授权