✦ ✦ ✦
当你的AI Agent学会自我管理技能
— — — — —
从MetaSkill概念到我的Skill管理实践
2026-06-06
摘要:这篇文章记录了我与 Hermes Agent 协作中积累的 Skill 管理实战经验。从最初的被动安装到后来的体系化管理,经历了安装花叔的 Nuwa 和 Darwin 技能、让 Agent 自动提炼优化技能、建立外挂 Skill 合集知识库、以及最终让一个叫 skill-curator 的技能管理其它技能、同时维护技能库自身的过程。这里没有理论,都是真实踩出来的路。
⟡ ⟡ ⟡
一、三块拼图
昨天我读到花叔的一篇文章(《做完女娲和达尔文skill,我发现自己缺的最后一块Skill拼图:MetaSkill》),里面有个比喻特别贴切。
花叔说 AI Agent 的 Skill 能力应该有三块拼图:
造 — 把人的思维方式和知识蒸馏成能用的 Skill(女娲)
优化 — 让写好的 Skill 自己迭代进化(达尔文)
组织 — 当技能多到一定程度,谁来把它们串起来?

前两块已经有人做了。第三块,我也是最近才真正体会到的——当技能从几个变成十几个再到几十个,瓶颈早就不在模型聪不聪明,而在于这一堆技能谁能管理起来。
那段时间 GitHub 上冒出了一个叫 OpenSquilla 的项目,2.4k+ star,它在 3.0 版本里引入了 MetaSkill 这个概念。简单说,MetaSkill 是一种特殊的 skill——它的职责不是执行具体任务,而是把多个普通 skill 串联成一条工作流。比如你可以定义一个「公众号文章创作」的 MetaSkill,让 Agent 自己按顺序调用选题生成、配图、排版、质检等子 skill,而不是手动一个个触发。
这个概念给了我很大启发——传统上是人把流程写死,Agent 照着走;MetaSkill 反过来:人不写流程,只给目标和可用的技能,让 Agent 自己现场编一条流程出来。OpenSquilla 的这套思路,补上了我一直缺的那块拼图方向。
受它启发,我在用着的 Hermes Agent 上做了自己的实现。方向和 OpenSquilla 一致——让 Agent 自己组织技能——但做法是针对自己的实际场景定制的,下面会细说。
这篇文章就是我的真实日志。
二、起点:女娲和达尔文
我刚开始接触 Hermes Agent 的 Skill 系统,就是从 花叔的 Nuwa(女娲) 和 Darwin(达尔文) 这两个技能入手的。
花叔在文章里说得很清楚——女娲可以把任何人的思维方式蒸馏成一个能跑的 Skill。我拿它做了些什么?
先是把 王小波 的写作风格蒸馏成一个 perspective skill。然后是 水冰月(Sailor Moon) 的角色扮演 skill。效果出奇的好——Agent 加载了这些 skill 之后,写出来的东西确实带着原作者的味道,不再是一股 AI 味。
Darwin 则专注于另一件事。用花叔的原话说,它做的事情很单纯:「给别的skill打分、提改进方案、改完再打分,分数没涨就回滚。整个流程像生物进化,一代代变异、被选择、淘汰,留下来的都是更强的版本。」
后来花叔受微软同一天发布的两篇论文启发——一篇研究 skill 评分(SkillLens),一篇提出让 skill 像神经网络权重一样可训练(SkillOpt)——将达尔文升级到了 2.0 版本,评分标准从 8 维升级到 9 维,加上多评委独立审查和 human in the loop 设计。这套方法论后来也被我用在了自己的 skill 管理体系中。
三、Agent 自己长出来的技能
有意思的是,有些技能不是我刻意安装的,而是 Hermes 在协作中自己提炼出来的。
比如有一次,我需要频繁生成公众号风格的 HTML 文章。每次我都要重复说同样的格式要求。Agent 察觉到了这个模式——「等等,我是不是每次都让你重复说这段话?不如我把它做成一个 skill,以后直接加载就好了。」
类似的场景出现了好几次:
wechat-article-formatting — 公众号 HTML 格式、配色体系、字号规范、踩坑记录,全被 Agent 整理成一个 skill
HKR 选题质检 — 写了几次文章后,Agent 总结出"好选题三要素":H(有趣/有悬念)、K(有信息量)、R(有共鸣),直接内化到写作流程中
AI腔 6 类检测 — 去 AI 味的检测标准,从维基百科的「Signs of AI writing」页面提炼成可执行的检测清单
这让我意识到一件事:Skill 不一定是装进去的,也可以是长出来的。 Agent 在跟你协作的过程中,自然会发现重复模式,然后主动把它抽象成可复用的技能。那些重复了三遍以上的指令,都值得变成一个 skill。
四、从别人那里偷师
光靠我自己长技能是不够的。好在开源社区已经积累了大量高质量的 Skill 合集。
最初我在桌面上放了一个叫 skill合集 的文件夹,里面放了多个主流 Skill 合集。这些合集的作者都是社区里的狠人:
花叔(huashu-skills) — 21 个实战内容创作技能,覆盖从选题到发布的完整工作流
宝玉(baoyu-skills) — 创意设计技能(配图、封面、信息图、SVG 图表、幻灯片、条漫等),Type×Style 二维设计系统很值得学习
苍何(canghe-skills) — 覆盖面最广的大量技能,含 Obsidian 知识、视频生成、文档解析等
李继刚(ljg-skills) — 深度认知工具(追本之箭、降维归因、写作引擎等),每个 skill 是一个定义清晰的认知仪器而非内容生成器
卡兹克(khazix-skills) — 个人实用技能集,含公众号写作、HKR 质检等
我把所有这些合集搬到了本地知识库,建立了一个 MOC(Map of Content)索引文件,分门别类。这样 Agent 在需要参考时可以直接翻知识库查资料。
📎 相关资源 — 可以直接去 GitHub 翻这些项目:•花叔/达尔文→ alchaincyf/huashu-skills · alchaincyf/darwin-skill•宝玉→ JimLiu/baoyu-skills•苍何→ freestylefly/canghe-skills•李继刚→ lijigang/ljg-skills•卡兹克→ KKKKhazix/khazix-skills•OpenSquilla(MetaSkill 来源)→ opensquilla/opensquilla📋 Awesome 列表• ComposioHQ/awesome-claude-skills — Claude Code 技能精选• vercel-labs/agent-skills — Skills CLI 生态• momozi1996/awesome-ai-persona-skills — AI 人格创作合集
就这样,很快我遇到了花叔说的那个问题——技能越来越多了。
✦ ✦ ✦“当技能多到一定程度,瓶颈早就不在模型聪不聪明,而在于这一堆技能能不能被组织起来。”✦ ✦ ✦
五、让一个技能来管理其它技能
当安装的技能超过 100 个,管理本身变成了一个问题。
你可以想象这个场景:Agent 每次启动要加载的 SKILL.md 文件越来越厚,各种技能之间可能有冲突或重复,有的技能版本过时了但没人知道,有的技能被更好的方案替代了但旧文件还在。
于是我做了一个叫 skill-curator 的技能。它的核心功能很简单:
让一个技能来管理其它技能。
这个思路很大程度上是受了 MetaSkill 概念的启发——既然 MetaSkill 可以组织多个 skill 的调用顺序,那为什么不干脆让一个 skill 来评估、优化、维护其它所有 skill 的健康状态?当然,具体做法跟 OpenSquilla 的 MetaSkill 不太一样,它是工作流编排,我是质量管理和持续维护,算是自己摸索出来的工程实践,抛砖引玉吧。
具体来说,skill-curator 做这几件事:
1. 已安装技能扫描评估 — 遍历所有已安装的 SKILL.md,用 Darwin 的 9 维度评分体系打分,筛选出低分或过时的技能
2. 对照集匹配优化 — 从知识库里的 Skill 合集中匹配最佳实践。比如发现某个技能缺反模式清单,就参照社区标杆 skill 的写法补上;发现某个技能是给 Claude Code 写的、在 Hermes 上跑不通,就加上 Hermes 适配层
3. 技能库自身维护 — 定期扫描技能库中的合集,发现新加入或更新过的技能,做一轮快速评分。高分且有用的自动安装,质量一般的记入观察列表,不达标的跳过。同时更新技能库的 MOC 索引,确保导航准确
4. 自动记录 — 每次评估和优化的结果写回评估日志,技能库的维护日志也一并写入,可追溯
5. 定时维护 — 设置 cron 定期跑一轮,保持技能库的「新鲜度」
⚡ 举个例子,我刚装了一批新 skill:• baoyu-cover-image 是给 Claude Code 写的,在 Hermes 上需要适配层(把 AskUserQuestion 映射到 Hermes 的 clarify 工具,把代码级图片生成映射到 agnes-ai-integration)• humanizer-zh 有 24 项检测模式但缺系统化的分类——于是补上了 6 大类 AI 腔检测体系 + 快速检测清单 + 修复优先级策略• khazix-writer 缺质量门控和反模式清单——补上了 HKR 质检流程和 5 项反模式
所有这些优化都来自对照集里的最佳实践,不是我瞎编的。
六、技能库即知识库:让它成为活的参考
最让我觉得有意思的是「技能库即知识库」这个思路。
这个想法没什么高深的理论背景,纯粹是从实际操作中冒出来的。以前知识库存的是笔记、想法、文章草稿。但 Skill 合集的 SKILL.md 本身就是高质量的可执行文档——每一份都写清楚了使用场景、触发条件、工作步骤、已知坑位。把它们放进知识库,好处是显而易见的:
1. 参考对照 — 写新 skill 时,翻知识库看看社区高手是怎么写的。他们的架构怎么搭的、坑位怎么列的、工作流怎么分步骤。有了现成的对照集,质量底线天然就提高了
2. 按需安装 — 遇到某个场景时,在知识库里搜一下有没有现成的 skill 能直接解决。有的话直接装,不用从零开始造轮子
3. 版本可追溯 — 每个合集有完整的历史,可以看到原始作者的完整设计思路,方便在升级版本时对照差异
还有一个细节值得提一下:这些 skill 不是 Agent 内置加载的,是躺在知识库里的参考材料。 这意味着它们不会挤占 Agent 的上下文窗口——Agent 只在需要的时候才去翻对应的 SKILL.md。当你想用某个 skill 时,装到技能目录里就好,本质就是复制一个文件夹的事。这种「用的时候才取」的模式,比一股脑全装进技能列表干净很多。
七、写在最后
回看这几天,我从一个人肉装 skill 的用户,变成有自动化管理体系的实践者。
花叔说的三块拼图——造、优化、组织。前两块有成熟的开源方案,第三块(组织)目前大家还在摸索。我的做法是用一个 skill-curator 来搞定:扫描已安装的技能、评估分数、匹配对照集优化、同时替技能库做新陈代谢。
是摸索的小经验,肯定不完善。但方向是明确的——让 Agent 自己管好自己的工具集,人在关键节点说「好,这个方向可以」,就足够了。
📌 本文使用技能
这篇文章本身也是靠这套 Skill 体系产出的。以下是实际用到的主要技能和它们发挥的作用:
▸ wechat-article-formatting
提供公众号 HTML 排版规范、字号体系、配色规则、踩坑速查
▸ khazix-writer
参考其 HKR 质检流程(文章选题是否同时有趣、有信息量、有共鸣)
▸ humanizer-zh
成文后用 6 大类 AI 腔检测体系自检,确保文字自然
▸ skill-curator
贯穿全文主题——让一个技能管理其它技能的理念本身是本篇的核心论述
▸ baoyu-image-gen / agnes-ai-integration
调用 Agnes AI 生成文章配图(三块拼图概念图)
▸ Obsidian 知识库
技能库索引(MOC)提供多个合集的快速检索入口
感兴趣的朋友,我整理了一个外挂技能库合集,包含上述提到的多个主流 Skill 合集(包含skill-curator),免费分享,免得去github上一个个的下载了。
如果你需要的话,skill-curator也可以单独在github上下载 (Bardbo/skill-curator)。
百度网盘:点我跳转小程序,提取码:1111
夸克网盘会放到评论区~
使用方法:下载后解压放到你的知识库或 Agent 可读目录下,让 Agent 扫描即可。
— — — — —
✦ ✦ ✦装在硬盘里的 skill 是收藏,跑在流程里的才是自己的。别人的写法终究是别人的,去踩自己的坑、摸索自己的体系,才算真正接过来了。✦ ✦ ✦
— 完 —
夜雨聆风