流程即产品:Workflow让AI真正融入业务
篇 | 标题 | 核心突围 | 解决的问题 |
第一篇 | AI落地悖论 | 认知突围 | 破除”买了工具就有能力”的幻觉 |
第二篇 | 企业知识库 | 记忆突围 | 让AI拥有企业专属知识 |
第三篇 | 工具即能力 | 能力突围 | 让AI从”会说”变”会干” |
第四篇 | 流程即产品 | 流程突围 | 让AI融入真实业务流 |
第五篇 | AI安全与治理 | 安全突围 | 别让第一个用例成为最后一个 |
第六篇 | AI工程化 | 规模突围 | 让AI从试点活到规模化 |
本系列的第四篇今天来了,因为每一篇的内容都很多,每次更新的时候我不得不在内心做复杂的思想斗争,最后还是本着有始有终的态度继续完成剩下的三篇。
本篇重点讲述workflow能力的建设,我个人认为workflow是我们企业建设AI能力的另外一个核心,我们常常讲AI可以帮我们干这干那,到底一个任务来了以后应该先干什么,后干什么,开干之前的前提是什么,如何控制AI干活儿的时候能遵守相关的管理要求或约定?workflow的建设就是帮助我们去解决这些问题的。
下面,让我们今天开启话题的小故事登场。
一、被80%重复问题拖垮的客服团队
某地一家电商公司的客服总监给我看了一组数据:她的团队每天处理约3200个客户咨询,其中超过80%是重复性问题——“我的订单到哪了?”“怎么退货?”“优惠券怎么用?”剩下的20%才是需要人工判断的复杂客诉。
“我们有20个客服坐席,每天像复读机一样回答同样的问题。”这位客服总监说,“我算过账,平均每个简单咨询的成本是4.5元,其中3.8元是人力重复劳动。”
公司确实上过AI。他们接入了某大厂的智能客服API,期望能自动回复这些重复问题。但三个月后的结果是:AI只能回答问题,无法处理”查询订单→确认问题→发起退货→发送回寄地址”这样一连串的业务流程。客户问完”怎么退货”,AI告诉退货政策,然后客户说”我要退”,AI就不知道接下来该做什么了——它不会查订单、不会生成退货单、不会发邮件。
“AI像个只会说话、不会干活的顾问。”客服总监的总结很准确。
这就是今天绝大多数企业AI用例的真实写照:一个孤立的AI模型,能对话但无法行动,能生成但无法执行。它悬浮在业务流程之上,像一层漂亮的泡沫,一触即破。
解决这个问题的关键,不是换一个更强大的模型,也不是堆砌更多的Agent,而是让AI嵌入流程——这就是Workflow(工作流)要扮演的角色。
二、Workflow的本质:让AI主动参与业务流程
很多人对Workflow的理解停留在”自动审批流”或者”RPA机器人”的层面。但在AI时代,Workflow有了不同的内涵。
传统Workflow是”人驱动、系统配合”——你提交报销单,系统按预设规则把单子推给经理、财务、出纳。人在每个节点产生动作,系统负责传递。
AI Workflow是”AI驱动、人在关键节点把关”——AI不仅传递信息,它还理解信息、做出判断、执行任务。人不再是每一步的推动者,而是设定边界和审批结果的监督者。
这两种范式之间存在本质区别:
Deterministic Workflow(确定性工作流),流程的每一步都是预先定义好的。输入A→步骤1→步骤2→输出B。没有意外,没有分支。适合流程明确、规则清晰的场景,比如”接收客户邮件→提取订单号→查询物流→生成回复模板→发送”。这种工作流的可预测性强,出错率低,是企业落地AI的首选。
Agentic Workflow(自主式工作流),AI在其中拥有一定的决策权。它可以根据中间结果决定下一步做什么、走哪条分支、甚至调用什么工具。比如”分析客户需求→决定是推荐产品A还是产品B→生成个性化方案→发送邮件跟进”。这里的”决定”由AI自主完成,而不是人写死的if-else。
Andrew Ng(吴恩达,是人工智能领域的顶尖学者专家)在2024年初的一次演讲中提出,Agentic Workflow可能是AI应用落地的下一个重要范式。但这个范式的关键在于:它不是让你放手不管,而是把人的角色从”操作员”变成”监督员”。
对大多数企业来说,我的建议是先站稳确定性工作流,再逐步引入自主式决策。前者让你快速获得确定性的业务价值,后者让你在成熟的流程上提升智能化水平。跳过前者直奔后者,往往事倍功半。
三、三种核心Workflow模式
工业界已经沉淀出三种标准的Workflow模式,它们几乎可以覆盖所有企业级AI应用场景。理解这三种模式,比追逐某个框架的新特性更重要。
模式一:Sequential(顺序型)
步骤按固定顺序依次执行,每一步的输出作为下一步的输入。
典型场景:研究报告自动生成。第一步RAG检索相关文档和资料→第二步LLM根据检索结果撰写报告草稿→第三步内容审核和格式检查→第四步输出最终报告。
业务价值:把原来需要人工串联的多个步骤自动化,减少等待和交接成本。一个分析师需要4小时完成的报告,Sequential Workflow可以压缩到20分钟。
核心要点:顺序型工作流的关键在于步骤之间的接口设计。第一步输出的格式必须能被第二步正确解析,否则整条链就会断裂。很多企业在这里踩坑——用自然语言传递中间结果,结果格式不统一导致后续步骤频繁出错。
模式二:Routing(路由型)
根据输入的特征或中间结果,将请求路由到不同的处理路径。
典型场景:客户工单分类处理。客户提交工单→AI分析工单内容和情绪→如果是简单查询,走自动回复路径→如果是技术问题,路由给技术支持团队→如果是投诉,升级给客服主管并标记优先级。
业务价值:实现”分层服务”——简单问题自动解决,复杂问题精准分发给对的人。既降低人工成本,又提升客户体验。
核心要点:路由决策的准确性决定了整个系统的成败。如果AI把紧急投诉误判为简单查询并自动回复了一个”FAQ链接”,客户体验会直线下降。所以路由节点通常需要设置置信度阈值——不确定的,宁可升级给人工。
模式三:Parallel(并行型)
多个任务同时执行,最后汇总结果。
典型场景:竞品分析报告。同时启动三个并行任务:A任务分析竞品A的产品特性→B任务分析竞品A的定价策略→C任务分析竞品A的用户评价。三个任务完成后,汇总生成综合分析报告。
业务价值:把串行等待变成并行执行,大幅压缩交付时间。三个串行步骤各需10分钟,总耗时30分钟;并行后只需要10分钟加汇总时间。
核心要点:并行任务之间的依赖关系要理清楚。如果B任务依赖A任务的结果,那就不能并行。另外,并行任务的汇总逻辑需要精心设计——是直接拼接、AI综合、还是结构化合并?不同的汇总方式会产生截然不同的输出质量。
这三种模式不是互斥的。一个复杂的业务Workflow往往是混合型的:先路由分类(Routing),然后并行处理(Parallel),最后顺序汇总输出(Sequential)。理解了基本的积木块构成,才能搭出复杂的建筑。
四、渐进式落地路径:从单点到规模化
Workflow建设最怕”一步到位”的野心。太多团队在第一版就想把全公司的流程都串起来,结果三个月后只交付了一个PPT。
Workflow的扎实交付路径应该是渐进式的:
V1:价值锚点(1-2周)
选一个单一、高频、规则清晰的流程切入。比如”自动回复客户询问退换货政策的邮件”。这个阶段的产出不是一个系统,而是一个可验证的原型——它能跑通一个完整流程,能让你算出”原来需要5分钟,现在需要30秒”。
选择价值锚点的标准很简单:如果把这个流程自动化了,每天能节省多少时间?这个时间价值乘以人力成本,就是ROI。锚点的意义在于用数字证明这条路走得通。
V2:MVP开发(2-4周)
在V1证明可行之后,把一个完整的业务场景端到端自动化。还是以客服为例:从接收客户问题→理解意图→查询知识库/订单系统→生成回复→人工审核→发送。这里的关键是单点自动化但流程完整——每个步骤都串起来了,但只覆盖一个业务场景。
这个阶段需要引入一个Workflow编排框架(后面会详细讲选型),把V1的脚本升级为可维护的工程化代码。
V3:规模化(4-8周)
把多个Workflow串联起来,实现跨系统集成。客服Workflow的完成可能触发CRM系统更新客户标签,营销Workflow根据标签变化自动发送关怀邮件。
这个阶段的技术复杂度会显著上升——你需要处理Workflow之间的依赖、错误恢复、状态监控、日志追踪。但不要被吓退,记住80%的价值通常在前两个阶段就已经产生了。
五、框架选型:工具是手段,不是目的
2024年的Workflow框架市场已经相对成熟,主流选择有三个方向。选型没有绝对的对错,关键看你的团队基因和业务需求。
维度 | LangGraph | CrewAI | Dify |
定位 | 生产级Workflow编排 | 多Agent协作框架 | 低代码AI应用平台 |
学习曲线 | 陡峭(需懂图论概念) | 中等(面向对象设计) | 平缓(可视化配置) |
灵活度 | 极高(代码级控制) | 高(角色+任务定义) | 中等(模板化配置) |
适合团队 | 有Python工程师的技术团队 | 想快速实验Multi-Agent的团队 | 业务团队/非技术人员 |
生产稳定性 | 强(LangChain生态) | 中等(快速迭代中) | 强(企业版SLA) |
部署方式 | 开源自托管 | 开源/云托管 | 云SaaS/企业私有化 |
代表场景 | 复杂条件分支、状态机 | 团队协作、研究任务 | 客服Bot、知识库问答 |
LangGraph的优势在于它用”图”的抽象来表达Workflow——节点是步骤,边是流转规则。这种抽象非常强大,可以表达任意复杂的分支、循环和状态转换。代价是你需要理解图论的基本概念,调试也更复杂。如果你的团队有熟练的Python工程师,且Workflow逻辑复杂(大量条件分支和状态管理),LangGraph是首选。
CrewAI的卖点是协作隐喻——你把任务分配给不同的”Agent角色”(研究员、写手、审核员),它们像团队成员一样协作完成任务。这种设计直观易懂,特别适合需要多个AI能力协同的场景。但要注意,CrewAI目前还在快速迭代期,API变动较频繁,用在生产环境需要一定的适配成本。
Dify走的是低代码路线,可视化配置Workflow,不需要写代码就能搭建一个完整的AI应用。对于业务团队来说,这是最低门槛的选择。它的限制在于灵活度——当Workflow逻辑超出模板能力时,你就需要回到代码层面。
选型建议:团队有Python工程师,选LangGraph;如果想快速验证Multi-Agent场景,选CrewAI;如果主要是业务团队驱动、技术资源有限,选Dify。记住,框架选型不是一锤定音的买卖,很多团队会用Dify做原型验证,然后用LangGraph做生产部署。
六、80%规则:单Agent+好Workflow,够用了
现在我们需要直面一个行业性的认知偏差:Multi-Agent是终极目标,单Agent只是过渡。
这个观点在2024年被过度放大了。Andrew Ng多次在公开演讲中强调一个核心判断:80%的真实业务用例,一个强大的单Agent配合一个精心设计的Workflow就足够了。Multi-Agent系统增加了协调复杂度、通信开销和调试难度,只有当业务场景确实需要多个独立决策单元协同工作时,才值得投入。
什么是”确实需要Multi-Agent”的场景?典型的例子是金融风控:一个Agent负责数据采集,一个Agent负责模型计算,一个Agent负责合规审查,它们各自有独立的判断逻辑,需要相互协调和制衡。这种场景下,Multi-Agent的架构是必要的。
但大多数企业的日常场景——客服回复、文档生成、数据分析、流程审批——都不需要这么复杂的架构。一个Agent,配备好工具(查询数据库、调用API、读写文件),串联在一个清晰的Workflow里,完全够用。
所以建议是:先从单Agent Workflow开始,把它做到极致。当你发现某个步骤的决策复杂度已经让Workflow难以维护时,再考虑把这个步骤拆分成独立的Agent。这是务实的进化路径,而不是一上来就搭一个Multi-Agent的宏大架构。
七、人机协同:AI干活,人做判断
Workflow的最后一个关键议题是人机协同。再完美的Workflow也需要人在关键节点介入,原因有两个:一是AI会犯错,二是有些决策机器不该替人做。
AI处理标准化任务:信息检索、数据填充、格式检查、模板生成——这些任务有明确的对错标准,AI的准确率通常超过95%,完全可以自动化。
人在关键节点审批:涉及资金、涉及客户投诉升级、涉及合规风险的输出——这些节点需要人的判断。Workflow的设计要在这些节点设置”人工审批闸口”,AI生成初稿,人确认后放行。
一个常见的设计模式是”AI草稿+人工确认”:AI生成回复邮件→推送给客服专员预览→专员可以一键发送、编辑后发送、或打回重写。这种模式兼顾了效率和可控性。
另一个重要的人机协同机制是异常升级。当Workflow的某个步骤连续失败、或AI对分类结果置信度低于阈值、或输出内容包含敏感词时,自动升级给人工处理。这不是Workflow的失败,而是Workflow设计的一部分。
八、Workflow是AI落地的”最后一公里”
回到开头的那个客服团队。三个月后,客服总监要求技术团队重新设计了一套Workflow:
客户咨询进入→Routing节点分类→80%的简单查询走自动回复路径(Sequential Workflow:查订单/查政策→生成回复→人工抽检后发送)→20%的复杂问题路由给对应的人工客服→每日自动生成服务质量报告。
结果是:简单咨询的平均处理时间从4.5分钟降到45秒,客服团队从20人缩减到12人(8人处理复杂问题,4人做Workflow监督和质检),客户满意度从82%提升到91%——因为AI回复速度更快,而人工客服有更多时间处理真正需要人的问题。
“我终于觉得AI是真的在帮我们干活,而不是给我们添堵。”这位客户总监最后说。
这就是Workflow的力量。它不追求模型的参数有多大、Agent有多少个,它追求的是让AI嵌入业务的毛细血管,在每一个重复、规则明确、消耗人力的环节静静发挥作用。
下一篇,我们将转向一个越来越紧迫的话题:当你的员工开始把客户数据上传到ChatGPT做分析时,你的企业面临着什么风险?AI安全与治理,不是大企业的专利,而是每一个正在落地AI的团队都绕不过去的命题。
夜雨聆风