公司上AI,最该先干的不是买工具而是把老员工的脑子“拆”下来

我最近在想一个问题。
我们这种小团队，十来个人，每个人身上都背着一套只有自己才懂的工作方法。编导知道什么样的脚本跑得动，运营知道投流什么时候该加仓什么时候该收，主播知道哪些话术一出口就有人下单。

这些判断不是写在什么SOP里的。散在聊天记录里、旧文档里、脑子里。人一走，方法就没了。

所以我看到 Hiten Shah 这篇关于 skill library 的文章时，觉得他点到了一个很实际的事：公司上AI，成本最低、可控性最强、收益最大的起点，不是买什么工具，而是先把内部资深同事的工作方法整理成 agent 能加载的 skill library。

什么叫 skill library？说白了，就是把那些"老员工会看的信号、会避开的坑、会坚持的质量线"收拢成可复用的资产。让AI每次遇到同类任务，都能加载同一套方法、边界和质量标准。
不是一个临时写的prompt，是一套反复执行的工作方法。
怎么干？拆成6步说。

一、先找那些"反复发生、又依赖判断"的工作
不是所有活都适合给AI干。能标准化的早就自动化了，剩下的是那些每次都在做、但每次都需要人判断的活。
比如：
• 销售准备续约通话——每次客户不一样，但老销售知道该提前看什么
• 客服判断要不要升级处理——新人很容易漏掉危险信号，老客服一眼就知道
• 产品把客户反馈排优先级——不是所有反馈都值得做，但哪些该做，靠判断
• 财务解释数字变化——报表谁都会看，但"这个波动正不正常"需要经验
这种活，就是skill的切入点。重复发生说明值得固化，依赖判断说明里面藏着隐性知识。
放到我们自己团队里想：编导选题靠什么判断？运营投流什么时候该调？这些判断背后就是skill的原料。

二、把资深同事的隐性动作拆出来
这是最难的一步，也是最值钱的一步。
别问"你有什么经验"——这个问题太大，谁也答不好。直接追工作细节：
• 你拿到这个任务，第一眼看什么？
• 你会去拉哪些历史记录来参考？
• 什么样的信号代表风险在变大？
• 哪些信息别人经常漏掉，但你一定会查？
• 你会用哪些旧案例来校准自己的判断？
• 哪些错误一定要提前挡住？
• 最后交付出去的东西，长什么样才算合格？
这些问题拆出来的答案，就是skill的骨架。
我自己的体会是，真正有用的方法都藏在"他第一眼看什么"和"他一定会挡住什么错误"这两个问题里。前者是他的判断起点，后者是他的安全底线。这两样东西，新人和AI都不知道。

三、把方法写成 agent 可加载的包
一个 skill 为什么比 prompt 稳定？因为 prompt 是临时指令，管一次；skill 装的是一套反复执行的工作方法，管每一次。
最小的结构长这样：
• SKILL.md——说清楚适用场景、目标、执行步骤、质量标准
• examples——放好结果和坏结果，让agent知道什么算合格什么算翻车
• checklist——必须检查的字段和风险点，一个都不能漏
• templates——给agent直接套用的输出格式
• references——公司内部标准、旧案例、术语表
• scripts——可选，用来查数据、跑校验、生成报告
格式不是重点。Anthropic 的 skill 就是一个文件夹里面放 SKILL.md 和支撑文件，其他系统可以不一样。关键是让 agent 每次遇到同类任务时，都能加载同一套方法、边界和质量线。
不是让它"理解"你的方法，是让它"加载"你的方法。

四、让 skill 进入真实工作流
这里有个容易混的地方：connector 和 skill 是两层。
connector 负责让 agent 看到资料——比如能读 CRM 里的客户记录、能打开共享盘里的旧文档。
skill 负责教 agent 怎么处理资料——哪些变化值得解释、哪些是噪音、哪些必须写进汇报。
两层别混着看。
举个例子：connector 让 agent 能读销售系统的客户备注，但 forecast review skill 才知道哪些客户变动值得汇报、哪些是正常波动、哪些信号必须进管理层材料。
如果后面还要让 agent 执行动作，才到 plugin 或 workflow 那一层：读数据 → 套skill → 调用系统 → 写回结果 → 等人审。
先让agent看得见，再让agent会判断，最后才让agent动手。跳步走一定出事。

五、给每个 skill 一个 owner
每个 skill 都要有 owner，最好就是那类工作做得最好的人，或者流程负责人。
他要做三件事：
1. 看 agent 的输出——有没有重复犯同一个错，有的话说明 skill 里的判断条件不够
2. 看新人的输出——用了 skill 之后，质量有没有更稳定。如果新人产出波动还是很大，说明 skill 里的 examples 和 checklist 没覆盖到关键分支
3. 看业务变化——流程变了，skill 里的步骤和判断有没有跟着变
维护 skill 不是一次性的事。业务在变，客户在变，判断标准也在变。skill 不更新，比没有 skill 还危险——因为它会给agent一个"我懂"的假象。
一个好的 skill，可以少纠正一次重复错误。更好的 skill，可以抬高整个团队的输出下限。最好的 skill，能把几年才养出来的判断，变成新人和 agent 都能借用的工作方法。

六、私有 skill 才最值钱
最后说一个很多人忽略的事。
最有用的方法都很具体：你们团队怎么判断一个客户该不该跟、投放数据波动到什么程度必须干预、脚本写到什么标准才敢出街、汇报材料老板想看什么不想看什么。
这些东西竞争对手没法下载。
两家公司用同一个大模型，差距不在模型上，差距在谁把自己的高价值工作方法整理得更细、更常用、更持续更新。
模型是公共基础设施，skill 是私有资产。
很多人上AI的思路是"找个更强的模型"，但真正拉开差距的，是你能不能把团队里那些散落在聊天记录、旧文档、老员工脑子里的判断，变成 agent 可以反复执行的方法。
AI 不缺能力，缺的是你教它怎么干你的活，模型是公共基础设施，Skill 是私有资产。