扶摇技能重构OpenClaw
最近在 GitHub 上刷到一个项目 OpenSquilla,3.7k Star,核心方向是让 Agent 学会自己组织技能。
说实话,看完 MetaSkill 3.0 的设计,我有点坐不住。
传统 Agent 工作流,要么是硬编码脚本,要么是人工拖拽的节点图。
你得提前告诉它:第一步做什么,第二步做什么,失败怎么办。
MetaSkill 的思路完全不一样。
它是一份「元 markdown」,本质上在告诉模型:怎么检索、筛选、组合原子 Skill。
没有具体业务逻辑,只有步骤声明、依赖关系、输入输出映射。
真正的「怎么解析」「怎么改写」「怎么出图」,全部下沉到原子 Skill 里。
一句话演示
我做了个真实测试。
输入:「把这篇公众号文章转成小红书图文,风格要种草感强一点」+ 文章链接。
OpenSquilla 没有直接瞎干,而是先在后台检索了一圈可用 skill。
它发现了三个原子能力:
- wechat-article-extractor(解析公众号)
- xiaohongshu-text-skill(生成小红书文案)
- xiaohongshu-cover-generator(生成封面图)
然后,它自己把这三个技能按依赖关系拼成了工作流。
先解析,再改写,最后出图。
DAG 关系清清楚楚。
整个过程 40 秒。
标题带 emoji、文案分段短有网感、封面图符合小红书审美。
不是 100% 完美,但作为「一句话需求」的自动化结果,已经相当能打。
更关键的是:这个工作流不是我提前写好的,是它现场自己组出来的。
为什么这件事重要
可能你会想:不就是把几个工具串起来吗?
我们算一笔账。
现在各种 Agent 框架、MCP 工具、开源 Skill 正在爆发。
你本地可能装了 Claude Code、Codex、OpenClaw,又接了一堆 MCP,再加上各种自定义 Skill。
技能数量很快就从几十个涨到几百个、上千个。
这时候问题就来了:
你知道这 1000 个技能里,哪几个能组合起来解决当前问题吗?
大概率不知道。
你要一个个翻文档、试组合、调参数,试到最后可能已经忘了本来要干嘛。
这就是 OpenSquilla 提到的「组合灾难」。
更麻烦的是,今天的 Skill 组合严重依赖「专家经验」。
你得知道先调 A 再调 B,A 的输出格式要匹配 B 的输入格式,C 失败了要用 D 兜底。
这些约束全写在人的脑子里,或者硬编码在脚本里。
一旦 Skill 社区更新了,脚本可能就废了。
MetaSkill 解决的就是这个问题。
它让 Agent 像人类组织专业知识那样,学会自我组织技能。
你只需要用自然语言描述目标,剩下的交给 Harness 层。
一条更深的判断
Agent 的下一轮效率红利,可能不来自模型升级,而来自 Harness 层优化。
模型再强,如果只会一个任务一个任务硬干,成本也高不到哪去。
真正拉开差距的,是能不能在 Skill 组织层做「输入减量化」。
把优化前置到 Skill 组合层,比让 Agent 在线反复 trial-and-error 有效得多。
OpenSquilla 的智能路由也是这个思路:
简单任务用便宜模型,复杂任务用好模型,缓存命中直接复用结果。
MetaSkill 建立在这层路由之上,把工作流编排也自动化了。
写在最后
让 Agent 学会自己造工具,比给 Agent 造更多工具,重要得多。
OpenSquilla 现在也不是完美的。
有些复杂工作流编排起来还不够稳,有些 Skill 依赖关系判断得也不够准。
但方向是对的。
Agent 开始像人了。
说话像不像人不重要,关键是它干活的方式像人。
遇到新问题,先看自己会不会,不会就去找资料,找到资料再组织成方案,最后执行。
GitHub 搜 OpenSquilla,给个 Star 支持开源社区。
觉得 Agent 自组织技能靠谱吗?欢迎评论区聊聊。
夜雨聆风