模型能力已经够强了,但很多人还是觉得AI表现不佳。问题不在模型,也不在提示词,而是你根本不会把任务拆成AI能执行的小任务。
01|为什么AI明明很聪明,却总让你觉得不靠谱
其实现在的模型能力绝对已经够强了,能胜任绝大多数任务。但还是有很多人觉得模型表现不佳、产出不靠谱。根据我过往的咨询案例,大多数人只是不知道——怎么把一个大任务拆成AI可以执行的小任务。
这件事听起来有点无聊、有点简单,但相信我:如果你是技术人员,好的任务拆解能力可以帮你构建一个更稳定的系统;如果你是非技术人员,你更要知道怎么把自己的日常工作拆小一点,然后委派给AI,而不是一大包丢进去导致AI根本消化不了。
02|三个名词先分清楚:人工流程文档、AI技能包、智能工作流
很多人会把这三个东西搞混,但它们的层级和功能完全不一样。
人工流程文档(Human SOP)
就是写给人看的流程文件。告诉你第一步做什么、第二步做什么、遇到例外怎么处理,旁边还有一堆小提醒和经验谈。
这类文件给人类看完全没问题,因为你的脑中会自动补进一堆上下文,会自己判断哪一步可以偷懒、哪一步一定要做。
比如流程里写到:
申请完之后送主管签核。
看到这句话后,你可能有能力判断:如果是两百块以内的小金额,主管宁愿你不要去烦他;但如果金额超过五千块,你就得照着规矩来。
这些判断可以被写进流程文件里,但需要花时间去把例外状况列出来。更何况很少人真的热爱维护文件,口头提醒一下新同事永远比维护文件更方便。这种状况在中小企业更是经常发生。
但这样的流程文件对AI来说,就是一坨非结构化文字,理解成本高、执行时容易忘东忘西。只要你没有明确写出来,AI不会知道:
为什么200块跟5000块不一样 哪一步可以省略 哪一步必须执行 遇到例外时应该继续做还是停下来问人
AI技能包(Skill)
本质上就是把做事的方法论、判断标准、踩过的坑,打包成一个文件夹交给AI。里面通常有三个东西:
- Skill.md
:人类写给AI的操作规范与经验总结,也是整个技能包的核心。 - References(参考资料)
:存放额外资料,例如范例输出、术语表、常见错误、历史案例、踩坑记录。 - Scripts(脚本)
:可以直接执行的程序,负责那些确定性的操作,例如文件解析、数据转换、格式整理、自动上传。
一个AI技能包对应的是单一任务,不是整条工作流。例如:
weekly-report-draftingpdf-processinginvoice-categorization
看名字就知道:什么时候触发、解决什么问题。
设计技能包时最重要的是范围控制。范围太大:什么都能做,什么都做不好。范围太小:每一步都要读取技能包、效率反而下降。
智能工作流(Agentic Workflow)
这是第三层,也是最重要的一层,因为智能工作流不是一个提示词,而是一条完整的生产线。
里面可能包含:多个AI、多个技能包、多种工具、数据库、API、自动化脚本。
有人负责理解问题,有人负责查资料,有人负责执行动作,有人负责检查结果,有人负责生成报告。整个过程像一间工厂,只不过里面工作的都是AI。
快速总结
人工流程文档 = 给人看的操作流程
AI技能包 = 给AI执行的单项能力
智能工作流 = 把多个技能包和工具串起来的一条生产线
当整条生产线跑完,任务也就完成了。而本文真正要讲的是:如何把原本给人看的流程文件,改造成AI能够长期稳定执行的智能工作流。
03|为什么不要万能AI,而要任务拆解
很多人第一次接触AI自动化,直觉都是:找最强模型、把任务整包丢进去,让它从头做到尾。这就是所谓的:万能AI。
比如你告诉它:「帮我优化整个开发流程。」它一定会做点什么出来。可能:
写一份几十页建议书 改一堆配置文件 重构你根本不想动的模块 顺手新增一堆功能
但问题是:你根本不知道它到底做了什么。哪一步判断正确、哪一步判断错误、哪一步调用工具失败、哪一步纯属自己幻想,全部都看不见。
任务丢进去 → 结果吐出来 → 中间发生什么没人知道
这就是典型黑箱。我看过太多新手卡在这里,他们的第一反应永远是:再换一个更强模型,或者再写一个更长的提示词。
但其实问题既不在模型,也不在提示词。而是:任务太大、太模糊,所以每次执行都像买彩票。
反过来,如果把任务拆成很多小任务,情况会完全不一样。
例如:同样是处理客户请求,你可以拆成四个独立AI:
每个AI都很笨,但每个AI都只做一件事,因此特别稳定,出了问题也很好查。比如发现客户分类错误,你直接回去改分类规则就好。
现在很多企业级AI系统本质上都在做同样的事:把复杂流程拆成多个节点,每个节点只负责一小段工作。
为什么大公司不用万能AI?
因为他们要上线、他们要稳定、他们要能追踪问题、他们要能修复问题。而一个看不到内部过程的黑箱,永远达不到正式上线标准。
所以,几十年前的软件工程理念「分而治之」,到了AI时代反而更重要。因为你不是在训练一个万能超人,而是在设计一条真正能长期运行的生产线。
04|四步法:把人工流程转成智能工作流
知道为什么要拆之后,接下来的重点就是怎么拆。我们用「洗衣服」这件事当作例子,一步步来。
Step 1:标准化格式
把人工流程改成AI能够读懂的版本。重点有三个:
#### ① 参数化
不要在流程里写死:「一定要用普通模式。」因为这样流程只能覆盖一种情况。应该改成:模式、温度、时长这些参数。
例如:
模式:快速模式 / 普通模式 / 精洗模式 温度:冷水 / 温水 / 热水
这样同一份流程就能覆盖各种情况。流程一旦写死,容错率就会很低。我见过太多人把技能包写成只适用于一种特殊场景,结果换个情况就直接失效。
#### ② MUST / SHOULD / MAY
这是互联网协议里非常经典的一套规则写法,拿来写AI工作流特别好用,因为它强迫你把每条规则的重要程度想清楚。
- MUST(必须)
:AI一定要做,绝对不能跳过。例如:必须检查洗衣标签、必须区分深色和浅色衣物、必须等待洗衣结束。 - SHOULD(建议)
:原则上应该做,如果不做必须有明确理由。例如:建议根据衣服材质选择模式、建议根据天气决定是否烘干。 - MAY(可选)
:做不做都可以。例如:可根据湿度决定是否开启烘干机、可根据个人偏好增加柔顺剂。
这种写法最大的好处是让AI知道:哪些事情不能商量,哪些事情可以灵活处理。
#### ③ 结构化格式
把流程拆成固定区块,例如:
参数 步骤 异常处理 输出格式
每个部分单独放。这样:人能看懂、AI也能看懂,未来接入各种工具也方便。
处理到这里,你手上的东西就不再是一篇说明文,而是一份AI真正能够执行的流程规范。
Step 2:任务拆解与连接
接下来开始拆。把整个流程拆成多个步骤,每个步骤都是流水线里的一个节点。
洗衣服这件事,其实可以拆成:
节点1:分类衣物 节点2:检查口袋和异物 节点3:设置洗衣机参数 节点4:决定晾晒还是烘干
每个步骤:有输入、有输出、能独立运行、能独立排错,甚至可以单独替换。
为什么一定要独立? 因为出问题的时候特别好修。例如分类阶段出错,把白色衣服判成深色衣服,你只需要修分类逻辑,后面的洗衣设置、晾晒逻辑、烘干逻辑全部不用动。
如果你用的是万能AI,所有逻辑混在一起,一旦出错,只能整体重写,因为根本不知道是哪一段出了问题。
除此之外,每个节点都可以独立变成一个AI技能包:
技能包A:负责分类。输入:衣物清单;输出:分类结果 技能包B:负责决定洗衣参数。输入:分类结果;输出:洗衣机设置 技能包C:负责判断天气。输入:天气数据;输出:晾晒或烘干建议
三个技能包都很简单,但组合起来,就是完整的洗衣流程。
那这些节点之间靠什么连接?答案是:中间结果。
例如分类完成后,输出一份结构化数据:
```json
{
"white": ["shirt"],
"dark": ["pants"],
"delicate": ["wool"]
}
```
这份结构化数据,直接变成下一个节点的输入。所以节点之间连接靠的不是猜测,也不是心灵感应,而是:
输入 → 处理中 → 输出 → 下一步输入
清清楚楚。
Step 3:双向开发
这是很多人最容易忽略的一步,但实际上,这是最重要的一步。因为你的第一版流程,一定有问题,一定!
这里有个很重要的概念:默会知识。简单说:就是你一直在使用,但很难完整写出来的经验。
很多人以为自己已经把流程写完整了,实际上根本没有,因为脑子里还有大量隐性经验,自己都没意识到。什么时候会发现?AI撞墙的时候。
例如:你写了一份洗衣流程,结果第一次执行的时候AI把所有纯棉衣服都丢进高温烘干机,衣服全部缩水。这时候你才发现:原来流程里漏写了一条规则。
纯棉衣物禁止高温烘干
于是补进去,再执行。第二次发现AI没有使用洗衣袋,再补一条:
精细衣物必须放洗衣袋
然后继续跑、继续补、继续修。这个过程就叫:迭代。
真正有效的流程从来不是关在房间里幻想出来的,而是:
运行 → 出错 → 修复 → 运行 → 再出错 → 再修复 → 不断循环
我曾经见过一个团队花两个月写了一份所谓的完美流程,结果第一次上线就崩,因为他们写的全是想象中的场景,但现实根本不会发生。后来改成:先做最简版本 → 不断测试 → 不断迭代 → 两周就上线,而且效果更好。
所以速度的关键不是写得多完美,而是迭代得有多快。
Step 4:整合与执行环境
最后一步,决定你的AI系统到底是演示项目,还是真正能上线运行。因为再漂亮的流程,如果接不到真实工具,它永远只是一份文档。
洗衣服的例子里,工具是:洗衣机、烘干机、天气服务。AI不仅要知道该怎么做,还要真的能执行。
而对于企业来说,工具通常包括:数据库、API、文件系统、Git仓库、工单系统、CRM系统、ERP系统等等。
但问题来了:每家公司系统都不同,怎么统一?
答案就是:MCP(模型上下文协议)。可以把它理解成:AI世界的USB-C接口。
以前:每个AI工具都有自己的连接方式,换个平台就要重做一遍。现在:只要支持MCP,大家都按同一个标准连接。你今天做好的工具,明天ChatGPT能用、Claude能用、Cursor能用,其他AI平台也能用。
这就是MCP存在的意义:统一标准、统一连接方式。
工具接好以后,还有最后一步:人工确认节点,也叫Human in the Loop。简单理解:某些关键决策,AI必须停下来等人确认。
例如:
财务支出超过5000元 删除数据库 修改管理员权限 大规模代码变更
这种情况AI不应该自己决定,必须让人类拍板。因为无论流程设计得多好,总会有极端情况,总会有例外。
人工确认节点的意义就是:把风险控制在可接受范围内,这样整条工作流才不会变成失控机器。而是:
人类负责方向 → AI负责执行 = 真正实现协作
05|真实案例:公司内部请求分类系统
讲完方法论,我们来看一个真正能落地的例子。
假设你在一家两百人的公司工作,每天都会收到各种请求:邮件、Slack消息、飞书、企业微信、表单提交。内容大概长这样:
我要申请新系统权限。
这张发票能不能报销。
下周有新同事入职,需要开哪些账号。
帮我开一个测试环境。
如果是人工处理,你的流程大概是:打开工单 → 看内容 → 判断属于哪个部门 → 判断优先级 → 找负责人 → 回复申请人。每天都在重复,没有技术难度,但特别耗时间。而这种事情最适合交给AI。
Step 1:先标准化
把这件事写成一份流程规范。例如:
内部请求分类
输入参数:
工单来源 工单内容 员工编号
规则:
- MUST
必须验证员工身份。 - MUST
必须把请求分类:IT / HR / 财务 / 行政 / 其他 - SHOULD
根据内容判断优先级:高 / 中 / 低 - MUST
输出结构化结果:
```json
{
"category": "IT",
"priority": "High",
"need_clarification": false
}
```
如果信息不足,则 MUST 自动生成需要补充的问题,例如:
需要哪个系统权限?
预计使用多久?
是否经过主管批准?
这样,第一份规范就完成了。
Step 2:拆成多个技能包
不要让一个AI全做,拆!
- 技能包1:请求分类
。输入:工单内容;输出: { "category": "Finance", "priority": "Medium" } - 技能包2:回复草稿
。输入:分类结果;输出:「您好,您的申请已转交财务部门,预计将在24小时内处理完成。」
这样:分类错了,修分类逻辑;回复写得不好,修回复逻辑,互不影响。
Step 3:迭代
第一版一定不准,没关系,直接跑。例如你发现:「发票报销」总被判成行政请求。那就补规则,再跑。
又发现:优先级全部变成高。继续补规则,再跑。三轮、五轮、十轮,准确率自然会上去。
Step 4:接入真实系统
最后,把整个流程接入公司工具:
工单系统 → 分类 → 生成回复 → 写回Notion → 通知负责人
如果涉及大额财务、权限变更、管理员操作,则增加人工确认节点。
最终形成:
读取工单 → 自动分类 → 生成回复 → 写回系统 → 必要时人工确认
原本需要人工每天处理几十次的工作,就变成了自动运行的工作流,而且出了问题还能快速定位。
06|MCP不是小众兴趣,而是行业标准
前面提到的MCP,现在已经不是实验项目,而是正在成为行业标准。
MCP全称:Model Context Protocol,中文:模型上下文协议。你可以把它理解成:
AI世界的USB-C接口
以前:每个AI平台都有自己的接口,不同工具之间很难互通。现在:只要支持MCP,大家都能按统一标准连接。
例如:你做了一个数据库查询工具,支持MCP后,ChatGPT能调用、Claude能调用、Cursor能调用、Codex能调用,不需要为每个平台单独开发。
为什么越来越多人在聊MCP?因为它解决的是:
AI怎么连接现实世界
模型再聪明,如果不能查数据库、调接口、读文件、发消息,那也只是聊天机器人。而MCP正在让AI从聊天机器人变成真正能干活的工具。
再往大一点看,很多大型企业已经开始采用AI工作流、多AI协作系统、MCP工具生态,来处理IT支持、人力资源、客户服务、内部审批等业务流程。
所以:学习工作流设计,不是为了追热点,而是在学习未来几年越来越重要的一项能力。
07|你现在就可以开始做的一件事
你不需要今天就把公司所有流程自动化,那样大概率会把自己累死。你只需要做一件事:找出你最讨厌、最重复、最无聊的一项工作。
例如:
每周周报 内容整理 数据汇总 客服回复 新人入职流程 项目检查清单
挑一个,先做。不要追求一步到位,不要追求100%自动化,先做到:节省30%时间就已经很成功了。然后:不断补规则、不断迭代、不断优化,慢慢把它变成稳定的工作流。
很多人以为自己在学习怎么使用AI,其实真正值钱的是:
学习如何把工作拆解成AI能够长期执行的流程
模型会越来越强,工具会越来越多,平台会不断变化。但:流程设计能力、任务拆解能力、工作流思维,这些能力只会越来越值钱。
师妹觉得
智能工作流的核心不是寻找最强模型,也不是写最长的提示词,而是把一个大任务拆成很多清晰的小任务,再通过标准化、拆解、迭代和整合,把原本只能靠人完成的流程,变成AI能够长期稳定执行的生产线。
未来最值钱的能力,不是会用AI,而是会设计AI能够运行的工作流。
夜雨聆风