当你的AI Agent学会自我管理技能 :从MetaSkill概念到我的Skill管理实践

✦ ✦ ✦

当你的AI Agent学会自我管理技能

— — — — —

从MetaSkill概念到我的Skill管理实践

2026-06-06

摘要：这篇文章记录了我与 Hermes Agent 协作中积累的 Skill 管理实战经验。从最初的被动安装到后来的体系化管理，经历了安装花叔的 Nuwa 和 Darwin 技能、让 Agent 自动提炼优化技能、建立外挂 Skill 合集知识库、以及最终让一个叫 skill-curator 的技能管理其它技能、同时维护技能库自身的过程。这里没有理论，都是真实踩出来的路。

⟡ ⟡ ⟡

一、三块拼图

昨天我读到花叔的一篇文章（《做完女娲和达尔文skill，我发现自己缺的最后一块Skill拼图：MetaSkill》），里面有个比喻特别贴切。

花叔说 AI Agent 的 Skill 能力应该有三块拼图：

造 — 把人的思维方式和知识蒸馏成能用的 Skill（女娲）

优化 — 让写好的 Skill 自己迭代进化（达尔文）

组织 — 当技能多到一定程度，谁来把它们串起来？

前两块已经有人做了。第三块，我也是最近才真正体会到的——当技能从几个变成十几个再到几十个，瓶颈早就不在模型聪不聪明，而在于这一堆技能谁能管理起来。

那段时间 GitHub 上冒出了一个叫 OpenSquilla 的项目，2.4k+ star，它在 3.0 版本里引入了 MetaSkill 这个概念。简单说，MetaSkill 是一种特殊的 skill——它的职责不是执行具体任务，而是把多个普通 skill 串联成一条工作流。比如你可以定义一个「公众号文章创作」的 MetaSkill，让 Agent 自己按顺序调用选题生成、配图、排版、质检等子 skill，而不是手动一个个触发。

这个概念给了我很大启发——传统上是人把流程写死，Agent 照着走；MetaSkill 反过来：人不写流程，只给目标和可用的技能，让 Agent 自己现场编一条流程出来。OpenSquilla 的这套思路，补上了我一直缺的那块拼图方向。

受它启发，我在用着的 Hermes Agent 上做了自己的实现。方向和 OpenSquilla 一致——让 Agent 自己组织技能——但做法是针对自己的实际场景定制的，下面会细说。

这篇文章就是我的真实日志。

二、起点：女娲和达尔文

我刚开始接触 Hermes Agent 的 Skill 系统，就是从 花叔的 Nuwa（女娲） 和 Darwin（达尔文） 这两个技能入手的。

花叔在文章里说得很清楚——女娲可以把任何人的思维方式蒸馏成一个能跑的 Skill。我拿它做了些什么？

先是把 王小波 的写作风格蒸馏成一个 perspective skill。然后是 水冰月（Sailor Moon） 的角色扮演 skill。效果出奇的好——Agent 加载了这些 skill 之后，写出来的东西确实带着原作者的味道，不再是一股 AI 味。

Darwin 则专注于另一件事。用花叔的原话说，它做的事情很单纯：「给别的skill打分、提改进方案、改完再打分，分数没涨就回滚。整个流程像生物进化，一代代变异、被选择、淘汰，留下来的都是更强的版本。」

后来花叔受微软同一天发布的两篇论文启发——一篇研究 skill 评分（SkillLens），一篇提出让 skill 像神经网络权重一样可训练（SkillOpt）——将达尔文升级到了 2.0 版本，评分标准从 8 维升级到 9 维，加上多评委独立审查和 human in the loop 设计。这套方法论后来也被我用在了自己的 skill 管理体系中。

三、Agent 自己长出来的技能

有意思的是，有些技能不是我刻意安装的，而是 Hermes 在协作中自己提炼出来的。

比如有一次，我需要频繁生成公众号风格的 HTML 文章。每次我都要重复说同样的格式要求。Agent 察觉到了这个模式——「等等，我是不是每次都让你重复说这段话？不如我把它做成一个 skill，以后直接加载就好了。」

类似的场景出现了好几次：

wechat-article-formatting — 公众号 HTML 格式、配色体系、字号规范、踩坑记录，全被 Agent 整理成一个 skill

HKR 选题质检 — 写了几次文章后，Agent 总结出"好选题三要素"：H（有趣/有悬念）、K（有信息量）、R（有共鸣），直接内化到写作流程中

AI腔 6 类检测 — 去 AI 味的检测标准，从维基百科的「Signs of AI writing」页面提炼成可执行的检测清单

这让我意识到一件事：Skill 不一定是装进去的，也可以是长出来的。 Agent 在跟你协作的过程中，自然会发现重复模式，然后主动把它抽象成可复用的技能。那些重复了三遍以上的指令，都值得变成一个 skill。

四、从别人那里偷师

光靠我自己长技能是不够的。好在开源社区已经积累了大量高质量的 Skill 合集。

最初我在桌面上放了一个叫 skill合集 的文件夹，里面放了多个主流 Skill 合集。这些合集的作者都是社区里的狠人：

花叔（huashu-skills） — 21 个实战内容创作技能，覆盖从选题到发布的完整工作流

宝玉（baoyu-skills） — 创意设计技能（配图、封面、信息图、SVG 图表、幻灯片、条漫等），Type×Style 二维设计系统很值得学习

苍何（canghe-skills） — 覆盖面最广的大量技能，含 Obsidian 知识、视频生成、文档解析等

李继刚（ljg-skills） — 深度认知工具（追本之箭、降维归因、写作引擎等），每个 skill 是一个定义清晰的认知仪器而非内容生成器

卡兹克（khazix-skills） — 个人实用技能集，含公众号写作、HKR 质检等

我把所有这些合集搬到了本地知识库，建立了一个 MOC（Map of Content）索引文件，分门别类。这样 Agent 在需要参考时可以直接翻知识库查资料。

📎 相关资源 — 可以直接去 GitHub 翻这些项目：•花叔/达尔文→ alchaincyf/huashu-skills · alchaincyf/darwin-skill•宝玉→ JimLiu/baoyu-skills•苍何→ freestylefly/canghe-skills•李继刚→ lijigang/ljg-skills•卡兹克→ KKKKhazix/khazix-skills•OpenSquilla（MetaSkill 来源）→ opensquilla/opensquilla📋 Awesome 列表• ComposioHQ/awesome-claude-skills — Claude Code 技能精选• vercel-labs/agent-skills — Skills CLI 生态• momozi1996/awesome-ai-persona-skills — AI 人格创作合集

就这样，很快我遇到了花叔说的那个问题——技能越来越多了。

✦ ✦ ✦“当技能多到一定程度，瓶颈早就不在模型聪不聪明，而在于这一堆技能能不能被组织起来。”✦ ✦ ✦

五、让一个技能来管理其它技能

当安装的技能超过 100 个，管理本身变成了一个问题。

你可以想象这个场景：Agent 每次启动要加载的 SKILL.md 文件越来越厚，各种技能之间可能有冲突或重复，有的技能版本过时了但没人知道，有的技能被更好的方案替代了但旧文件还在。

于是我做了一个叫 skill-curator 的技能。它的核心功能很简单：

让一个技能来管理其它技能。

这个思路很大程度上是受了 MetaSkill 概念的启发——既然 MetaSkill 可以组织多个 skill 的调用顺序，那为什么不干脆让一个 skill 来评估、优化、维护其它所有 skill 的健康状态？当然，具体做法跟 OpenSquilla 的 MetaSkill 不太一样，它是工作流编排，我是质量管理和持续维护，算是自己摸索出来的工程实践，抛砖引玉吧。

具体来说，skill-curator 做这几件事：

1. 已安装技能扫描评估 — 遍历所有已安装的 SKILL.md，用 Darwin 的 9 维度评分体系打分，筛选出低分或过时的技能

2. 对照集匹配优化 — 从知识库里的 Skill 合集中匹配最佳实践。比如发现某个技能缺反模式清单，就参照社区标杆 skill 的写法补上；发现某个技能是给 Claude Code 写的、在 Hermes 上跑不通，就加上 Hermes 适配层

3. 技能库自身维护 — 定期扫描技能库中的合集，发现新加入或更新过的技能，做一轮快速评分。高分且有用的自动安装，质量一般的记入观察列表，不达标的跳过。同时更新技能库的 MOC 索引，确保导航准确

4. 自动记录 — 每次评估和优化的结果写回评估日志，技能库的维护日志也一并写入，可追溯

5. 定时维护 — 设置 cron 定期跑一轮，保持技能库的「新鲜度」

⚡ 举个例子，我刚装了一批新 skill：• baoyu-cover-image 是给 Claude Code 写的，在 Hermes 上需要适配层（把 AskUserQuestion 映射到 Hermes 的 clarify 工具，把代码级图片生成映射到 agnes-ai-integration）• humanizer-zh 有 24 项检测模式但缺系统化的分类——于是补上了 6 大类 AI 腔检测体系 + 快速检测清单 + 修复优先级策略• khazix-writer 缺质量门控和反模式清单——补上了 HKR 质检流程和 5 项反模式

所有这些优化都来自对照集里的最佳实践，不是我瞎编的。

六、技能库即知识库：让它成为活的参考

最让我觉得有意思的是「技能库即知识库」这个思路。

这个想法没什么高深的理论背景，纯粹是从实际操作中冒出来的。以前知识库存的是笔记、想法、文章草稿。但 Skill 合集的 SKILL.md 本身就是高质量的可执行文档——每一份都写清楚了使用场景、触发条件、工作步骤、已知坑位。把它们放进知识库，好处是显而易见的：

1. 参考对照 — 写新 skill 时，翻知识库看看社区高手是怎么写的。他们的架构怎么搭的、坑位怎么列的、工作流怎么分步骤。有了现成的对照集，质量底线天然就提高了

2. 按需安装 — 遇到某个场景时，在知识库里搜一下有没有现成的 skill 能直接解决。有的话直接装，不用从零开始造轮子

3. 版本可追溯 — 每个合集有完整的历史，可以看到原始作者的完整设计思路，方便在升级版本时对照差异

还有一个细节值得提一下：这些 skill 不是 Agent 内置加载的，是躺在知识库里的参考材料。 这意味着它们不会挤占 Agent 的上下文窗口——Agent 只在需要的时候才去翻对应的 SKILL.md。当你想用某个 skill 时，装到技能目录里就好，本质就是复制一个文件夹的事。这种「用的时候才取」的模式，比一股脑全装进技能列表干净很多。

七、写在最后

回看这几天，我从一个人肉装 skill 的用户，变成有自动化管理体系的实践者。

花叔说的三块拼图——造、优化、组织。前两块有成熟的开源方案，第三块（组织）目前大家还在摸索。我的做法是用一个 skill-curator 来搞定：扫描已安装的技能、评估分数、匹配对照集优化、同时替技能库做新陈代谢。

是摸索的小经验，肯定不完善。但方向是明确的——让 Agent 自己管好自己的工具集，人在关键节点说「好，这个方向可以」，就足够了。

📌 本文使用技能

这篇文章本身也是靠这套 Skill 体系产出的。以下是实际用到的主要技能和它们发挥的作用：

▸ wechat-article-formatting

提供公众号 HTML 排版规范、字号体系、配色规则、踩坑速查

▸ khazix-writer

参考其 HKR 质检流程（文章选题是否同时有趣、有信息量、有共鸣）

▸ humanizer-zh

成文后用 6 大类 AI 腔检测体系自检，确保文字自然

▸ skill-curator

贯穿全文主题——让一个技能管理其它技能的理念本身是本篇的核心论述

▸ baoyu-image-gen / agnes-ai-integration

调用 Agnes AI 生成文章配图（三块拼图概念图）

▸ Obsidian 知识库

技能库索引（MOC）提供多个合集的快速检索入口

感兴趣的朋友，我整理了一个外挂技能库合集，包含上述提到的多个主流 Skill 合集（包含skill-curator），免费分享，免得去github上一个个的下载了。

如果你需要的话，skill-curator也可以单独在github上下载（Bardbo/skill-curator）。

百度网盘：点我跳转小程序，提取码：1111

夸克网盘会放到评论区~

使用方法：下载后解压放到你的知识库或 Agent 可读目录下，让 Agent 扫描即可。

— — — — —

✦ ✦ ✦装在硬盘里的 skill 是收藏，跑在流程里的才是自己的。别人的写法终究是别人的，去踩自己的坑、摸索自己的体系，才算真正接过来了。✦ ✦ ✦

— 完 —