扶摇技能重构OpenClaw-夜雨聆风

扶摇技能重构OpenClaw

最近在 GitHub 上刷到一个项目 OpenSquilla，3.7k Star，核心方向是让 Agent 学会自己组织技能。

说实话，看完 MetaSkill 3.0 的设计，我有点坐不住。

传统 Agent 工作流，要么是硬编码脚本，要么是人工拖拽的节点图。

你得提前告诉它：第一步做什么，第二步做什么，失败怎么办。

MetaSkill 的思路完全不一样。

它是一份「元 markdown」，本质上在告诉模型：怎么检索、筛选、组合原子 Skill。

没有具体业务逻辑，只有步骤声明、依赖关系、输入输出映射。

真正的「怎么解析」「怎么改写」「怎么出图」，全部下沉到原子 Skill 里。

一句话演示

我做了个真实测试。

输入：「把这篇公众号文章转成小红书图文，风格要种草感强一点」+ 文章链接。

OpenSquilla 没有直接瞎干，而是先在后台检索了一圈可用 skill。

它发现了三个原子能力：

wechat-article-extractor（解析公众号）
xiaohongshu-text-skill（生成小红书文案）
xiaohongshu-cover-generator（生成封面图）

然后，它自己把这三个技能按依赖关系拼成了工作流。

先解析，再改写，最后出图。

DAG 关系清清楚楚。

整个过程 40 秒。

标题带 emoji、文案分段短有网感、封面图符合小红书审美。

不是 100% 完美，但作为「一句话需求」的自动化结果，已经相当能打。

更关键的是：这个工作流不是我提前写好的，是它现场自己组出来的。

为什么这件事重要

可能你会想：不就是把几个工具串起来吗？

我们算一笔账。

现在各种 Agent 框架、MCP 工具、开源 Skill 正在爆发。

你本地可能装了 Claude Code、Codex、OpenClaw，又接了一堆 MCP，再加上各种自定义 Skill。

技能数量很快就从几十个涨到几百个、上千个。

这时候问题就来了：

你知道这 1000 个技能里，哪几个能组合起来解决当前问题吗？

大概率不知道。

你要一个个翻文档、试组合、调参数，试到最后可能已经忘了本来要干嘛。

这就是 OpenSquilla 提到的「组合灾难」。

更麻烦的是，今天的 Skill 组合严重依赖「专家经验」。

你得知道先调 A 再调 B，A 的输出格式要匹配 B 的输入格式，C 失败了要用 D 兜底。

这些约束全写在人的脑子里，或者硬编码在脚本里。

一旦 Skill 社区更新了，脚本可能就废了。

MetaSkill 解决的就是这个问题。

它让 Agent 像人类组织专业知识那样，学会自我组织技能。

你只需要用自然语言描述目标，剩下的交给 Harness 层。

一条更深的判断

Agent 的下一轮效率红利，可能不来自模型升级，而来自 Harness 层优化。

模型再强，如果只会一个任务一个任务硬干，成本也高不到哪去。

真正拉开差距的，是能不能在 Skill 组织层做「输入减量化」。

把优化前置到 Skill 组合层，比让 Agent 在线反复 trial-and-error 有效得多。

OpenSquilla 的智能路由也是这个思路：

简单任务用便宜模型，复杂任务用好模型，缓存命中直接复用结果。

MetaSkill 建立在这层路由之上，把工作流编排也自动化了。

写在最后

让 Agent 学会自己造工具，比给 Agent 造更多工具，重要得多。

OpenSquilla 现在也不是完美的。

有些复杂工作流编排起来还不够稳，有些 Skill 依赖关系判断得也不够准。

但方向是对的。

Agent 开始像人了。

说话像不像人不重要，关键是它干活的方式像人。

遇到新问题，先看自己会不会，不会就去找资料，找到资料再组织成方案，最后执行。

GitHub 搜 OpenSquilla，给个 Star 支持开源社区。

觉得 Agent 自组织技能靠谱吗？欢迎评论区聊聊。