乐于分享
好东西不私藏

扶摇技能重构OpenClaw

扶摇技能重构OpenClaw

最近在 GitHub 上刷到一个项目 OpenSquilla,3.7k Star,核心方向是让 Agent 学会自己组织技能。

说实话,看完 MetaSkill 3.0 的设计,我有点坐不住。

传统 Agent 工作流,要么是硬编码脚本,要么是人工拖拽的节点图。

你得提前告诉它:第一步做什么,第二步做什么,失败怎么办。

MetaSkill 的思路完全不一样。

它是一份「元 markdown」,本质上在告诉模型:怎么检索、筛选、组合原子 Skill。

没有具体业务逻辑,只有步骤声明、依赖关系、输入输出映射。

真正的「怎么解析」「怎么改写」「怎么出图」,全部下沉到原子 Skill 里。

一句话演示

我做了个真实测试。

输入:「把这篇公众号文章转成小红书图文,风格要种草感强一点」+ 文章链接。

OpenSquilla 没有直接瞎干,而是先在后台检索了一圈可用 skill。

它发现了三个原子能力:

  • wechat-article-extractor(解析公众号)
  • xiaohongshu-text-skill(生成小红书文案)
  • xiaohongshu-cover-generator(生成封面图)

然后,它自己把这三个技能按依赖关系拼成了工作流。

先解析,再改写,最后出图。

DAG 关系清清楚楚。

整个过程 40 秒。

标题带 emoji、文案分段短有网感、封面图符合小红书审美。

不是 100% 完美,但作为「一句话需求」的自动化结果,已经相当能打。

更关键的是:这个工作流不是我提前写好的,是它现场自己组出来的。

为什么这件事重要

可能你会想:不就是把几个工具串起来吗?

我们算一笔账。

现在各种 Agent 框架、MCP 工具、开源 Skill 正在爆发。

你本地可能装了 Claude Code、Codex、OpenClaw,又接了一堆 MCP,再加上各种自定义 Skill。

技能数量很快就从几十个涨到几百个、上千个。

这时候问题就来了:

你知道这 1000 个技能里,哪几个能组合起来解决当前问题吗?

大概率不知道。

你要一个个翻文档、试组合、调参数,试到最后可能已经忘了本来要干嘛。

这就是 OpenSquilla 提到的「组合灾难」。

更麻烦的是,今天的 Skill 组合严重依赖「专家经验」。

你得知道先调 A 再调 B,A 的输出格式要匹配 B 的输入格式,C 失败了要用 D 兜底。

这些约束全写在人的脑子里,或者硬编码在脚本里。

一旦 Skill 社区更新了,脚本可能就废了。

MetaSkill 解决的就是这个问题。

它让 Agent 像人类组织专业知识那样,学会自我组织技能。

你只需要用自然语言描述目标,剩下的交给 Harness 层。

一条更深的判断

Agent 的下一轮效率红利,可能不来自模型升级,而来自 Harness 层优化。

模型再强,如果只会一个任务一个任务硬干,成本也高不到哪去。

真正拉开差距的,是能不能在 Skill 组织层做「输入减量化」。

把优化前置到 Skill 组合层,比让 Agent 在线反复 trial-and-error 有效得多。

OpenSquilla 的智能路由也是这个思路:

简单任务用便宜模型,复杂任务用好模型,缓存命中直接复用结果。

MetaSkill 建立在这层路由之上,把工作流编排也自动化了。

写在最后

让 Agent 学会自己造工具,比给 Agent 造更多工具,重要得多。

OpenSquilla 现在也不是完美的。

有些复杂工作流编排起来还不够稳,有些 Skill 依赖关系判断得也不够准。

但方向是对的。

Agent 开始像人了。

说话像不像人不重要,关键是它干活的方式像人。

遇到新问题,先看自己会不会,不会就去找资料,找到资料再组织成方案,最后执行。

GitHub 搜 OpenSquilla,给个 Star 支持开源社区。

觉得 Agent 自组织技能靠谱吗?欢迎评论区聊聊。