我最近在想一个问题。
我们这种小团队,十来个人,每个人身上都背着一套只有自己才懂的工作方法。编导知道什么样的脚本跑得动,运营知道投流什么时候该加仓什么时候该收,主播知道哪些话术一出口就有人下单。
这些判断不是写在什么SOP里的。散在聊天记录里、旧文档里、脑子里。人一走,方法就没了。
所以我看到 Hiten Shah 这篇关于 skill library 的文章时,觉得他点到了一个很实际的事:公司上AI,成本最低、可控性最强、收益最大的起点,不是买什么工具,而是先把内部资深同事的工作方法整理成 agent 能加载的 skill library。
什么叫 skill library?说白了,就是把那些"老员工会看的信号、会避开的坑、会坚持的质量线"收拢成可复用的资产。让AI每次遇到同类任务,都能加载同一套方法、边界和质量标准。
不是一个临时写的prompt,是一套反复执行的工作方法。
怎么干?拆成6步说。
一、先找那些"反复发生、又依赖判断"的工作
不是所有活都适合给AI干。能标准化的早就自动化了,剩下的是那些每次都在做、但每次都需要人判断的活。
比如:
• 销售准备续约通话——每次客户不一样,但老销售知道该提前看什么
• 客服判断要不要升级处理——新人很容易漏掉危险信号,老客服一眼就知道
• 产品把客户反馈排优先级——不是所有反馈都值得做,但哪些该做,靠判断
• 财务解释数字变化——报表谁都会看,但"这个波动正不正常"需要经验
这种活,就是skill的切入点。重复发生说明值得固化,依赖判断说明里面藏着隐性知识。
放到我们自己团队里想:编导选题靠什么判断?运营投流什么时候该调?这些判断背后就是skill的原料。
二、把资深同事的隐性动作拆出来
这是最难的一步,也是最值钱的一步。
别问"你有什么经验"——这个问题太大,谁也答不好。直接追工作细节:
• 你拿到这个任务,第一眼看什么?
• 你会去拉哪些历史记录来参考?
• 什么样的信号代表风险在变大?
• 哪些信息别人经常漏掉,但你一定会查?
• 你会用哪些旧案例来校准自己的判断?
• 哪些错误一定要提前挡住?
• 最后交付出去的东西,长什么样才算合格?
这些问题拆出来的答案,就是skill的骨架。
我自己的体会是,真正有用的方法都藏在"他第一眼看什么"和"他一定会挡住什么错误"这两个问题里。前者是他的判断起点,后者是他的安全底线。这两样东西,新人和AI都不知道。
三、把方法写成 agent 可加载的包
一个 skill 为什么比 prompt 稳定?因为 prompt 是临时指令,管一次;skill 装的是一套反复执行的工作方法,管每一次。
最小的结构长这样:
• SKILL.md——说清楚适用场景、目标、执行步骤、质量标准
• examples——放好结果和坏结果,让agent知道什么算合格什么算翻车
• checklist——必须检查的字段和风险点,一个都不能漏
• templates——给agent直接套用的输出格式
• references——公司内部标准、旧案例、术语表
• scripts——可选,用来查数据、跑校验、生成报告
格式不是重点。Anthropic 的 skill 就是一个文件夹里面放 SKILL.md 和支撑文件,其他系统可以不一样。关键是让 agent 每次遇到同类任务时,都能加载同一套方法、边界和质量线。
不是让它"理解"你的方法,是让它"加载"你的方法。
四、让 skill 进入真实工作流
这里有个容易混的地方:connector 和 skill 是两层。
connector 负责让 agent 看到资料——比如能读 CRM 里的客户记录、能打开共享盘里的旧文档。
skill 负责教 agent 怎么处理资料——哪些变化值得解释、哪些是噪音、哪些必须写进汇报。
两层别混着看。
举个例子:connector 让 agent 能读销售系统的客户备注,但 forecast review skill 才知道哪些客户变动值得汇报、哪些是正常波动、哪些信号必须进管理层材料。
如果后面还要让 agent 执行动作,才到 plugin 或 workflow 那一层:读数据 → 套skill → 调用系统 → 写回结果 → 等人审。
先让agent看得见,再让agent会判断,最后才让agent动手。 跳步走一定出事。
五、给每个 skill 一个 owner
每个 skill 都要有 owner,最好就是那类工作做得最好的人,或者流程负责人。
他要做三件事:
1. 看 agent 的输出——有没有重复犯同一个错,有的话说明 skill 里的判断条件不够
2. 看新人的输出——用了 skill 之后,质量有没有更稳定。如果新人产出波动还是很大,说明 skill 里的 examples 和 checklist 没覆盖到关键分支
3. 看业务变化——流程变了,skill 里的步骤和判断有没有跟着变
维护 skill 不是一次性的事。业务在变,客户在变,判断标准也在变。skill 不更新,比没有 skill 还危险——因为它会给agent一个"我懂"的假象。
一个好的 skill,可以少纠正一次重复错误。更好的 skill,可以抬高整个团队的输出下限。最好的 skill,能把几年才养出来的判断,变成新人和 agent 都能借用的工作方法。
六、私有 skill 才最值钱
最后说一个很多人忽略的事。
最有用的方法都很具体:你们团队怎么判断一个客户该不该跟、投放数据波动到什么程度必须干预、脚本写到什么标准才敢出街、汇报材料老板想看什么不想看什么。
这些东西竞争对手没法下载。
两家公司用同一个大模型,差距不在模型上,差距在谁把自己的高价值工作方法整理得更细、更常用、更持续更新。
模型是公共基础设施,skill 是私有资产。
很多人上AI的思路是"找个更强的模型",但真正拉开差距的,是你能不能把团队里那些散落在聊天记录、旧文档、老员工脑子里的判断,变成 agent 可以反复执行的方法。
AI 不缺能力,缺的是你教它怎么干你的活,模型是公共基础设施,Skill 是私有资产。
夜雨聆风