乐于分享
好东西不私藏

到底如何搭建一个AI流程审批助手?一文讲明白

到底如何搭建一个AI流程审批助手?一文讲明白

最近这段时间,有好些做流程的朋友来找我,说同一件事:

“詹老师,我们公司想做一个AI审批助手,能不能帮我们搭一个?或者,你能不能教教我?”

问我这个问题的,大多是在企业里做流程管理的专家和负责人。不是什么都不懂的门外汉,是真的在推AI落地的人。

我每次都会先问他们一句:你打算自己做,还是找人做,还是买现成的?

很多人愣了一下,说:啊……不是随便找个AI工具就能搭出来吗?

我说:不是,我们把事情想简单了。

· · ·

先把话说清楚:这是个技术活

我不是要打击任何人的积极性。但有一件事,我觉得有必要说直接点:

一个能真正跑起来的AI流程审批助手,不是拿几个提示词拼出来的。

它涉及Chrome插件开发、前后端通信、工具调用链设计、流式响应协议、ERP系统适配……每一块拿出来,都是要有人扎扎实实写代码的。而这,也仅仅是其中一种产品形态。

我自己花了将近一周时间,才把一个Demo版本在本地跑通。需要说清楚的是:这个Demo是演示级的,不是生产级的。它能跑通完整流程、展示AI辅助审批的交互效果,但数据是模拟的,没有接真实的OA/BPM/ERP和CRM系统。真正的生产环境,要解决的难题远比Demo复杂,后面我会讲到。

而且说实话,现在的能力层还在持续打磨——数据工具的对接、AI判断的准确率,都还有迭代空间。

所以我想先说一个判断:如果你完全没有技术背景,也没有专业做AI的同学在旁边,那自己从头搭,大概率会卡死在半路上。这不是说你不行,是说这件事本身的技术门槛就在那里,需要尊重。

但——

这不代表你做不了这件事。

· · ·

流程审批这个场景,为什么值得做

在我接触过的所有流程AI落地场景里,审批是最典型的一个。

来看一个虚构但极其真实的场景:

某科技公司销售总监陈总,每天要处理十几张报价审批单。每一张,他要做一套固定动作——打开ERP看单子,切到CRM查客户,翻历史报价找折扣基准,发消息问财务要毛利,综合判断,手动写审批意见。

每张单子,至少二十分钟。一天下来,有效决策时间可能不到两小时,其余全在搬运信息。

这个问题,用一个Chrome插件可以基本解决掉。

插件的逻辑很简单:陈总打开ERP审批页的时候,页面右侧自动滑出一个AI面板。面板已经读取了这张单子的全部信息,同时在后台调用了CRM、历史报价库、财务系统的数据。陈总直接问问题,AI基于真实数据给出分析。最后生成一段审批意见,一键填入,提交。

五分钟,搞定。

想看真实效果,这是我做的Demo:https://e4e5726b.ai-approval-demo.pages.dev/(可以直接点开体验)

图1:AI审批助手四层架构——上下文捕获 → 意图路由 → 工具调用 → 流式生成

而且这个场景不止报价审批。

同样的架构,放到合同审核,AI自动比对风险条款;放到采购询价,AI自动拉历史比价;放到招聘面试,AI预处理简历;放到客服工单,AI生成回复建议。

只要场景符合这个模式——打开一个页面,需要从多个系统拉信息,综合判断,输出文字——这套架构就可以复用。

· · ·

为什么是插件,而不是改ERP

很多企业第一反应是:让ERP开发商在审批页面里加一个AI入口。

这条路我劝你想清楚。

找ERP开发商提需求,走需求评审,等排期,开发,测试,上线——快的话三个月,慢的话半年。每改一次ERP,都是一次上线风险。而且改完之后,如果AI能力要迭代,你还得再走一遍这个流程。

插件的逻辑完全不同:外挂,不是改造。

插件是独立部署的,不动ERP的核心业务逻辑,不走ERP的需求排期,不影响ERP稳定性。今天加一个工具,明天调一个提示词,ERP完全不受影响。

当然,”外挂”不等于”完全不需要ERP配合”——插件要分析审批单,首先得读到单子上的数据。这个数据怎么拿,是整个方案里最值得认真对待的一关,后面技术细节部分我会单独讲清楚。

图2:插件独立运行在ERP页面上层,不改造ERP本身

· · ·

真正的难点在哪里

说完场景,我必须认真讲一讲难点。

Demo能跑,不代表这件事很简单。我做这个Demo用了将近一周,用的还是模拟数据。真实的生产环境,难点是Demo的十倍不止。

难点分三层:技术难、数据难、协同难。每一层都是真实的墙。

第一层难:数据怎么拿

AI 要分析审批单,首先得拿到数据。这听起来简单,实际上是整个方案最硬的一关。

而且,真实场景里 AI 需要的数据,远不止”表单上显示的那几个字段”。

它可能需要:这张合同单背后挂的附件(Word合同文本、PDF报价单、Excel明细表);需要跨系统调取的数据(CRM里的客户信用记录、ERP里的历史成交价、财务系统里的毛利核算);甚至需要外部数据(行业报价基准、竞品动态)。

这些数据散落在不同系统里,获取方式各不相同。插件怎么读到它们?有三条路,优先级从高到低:

首选:直接调后端接口。拿到页面 URL 里的审批单 ID,直接调用系统后端 API 查数据。数据最准最全,不受页面布局影响。前提是系统有开放的只读接口——自建 OA 最容易走通,外采 ERP(用友、金蝶、SAP)取决于厂商是否开放 API。

次选:解析页面 DOM 文本。读取页面上已经渲染出来的文字内容。不需要接口,但只能拿到”显示给人看的内容”,不保证完整;ERP 页面改版后规则就失效,维护成本持续存在。

最后手段:大模型视觉识别截图。截图发给视觉大模型识别提取字段。理论上最通用,实际上错误率高、延迟大、成本高——金额数字识别错一位就是生产事故。真的没有其他办法才用这条路。

还有一堵墙:权限。企业内网 API 几乎都有身份认证和权限管控,不是找到接口地址就能调。插件后端要么走内网部署,要么走 SSO 体系获取授权 Token。这个问题往往比技术本身更难推动——需要拉上 IT 部门、信息安全部门一起协调,是管理问题,不是工程问题。

图3:数据获取三条路——后端接口最优,DOM解析次之,视觉识别最后

第二层难:拿到数据之后,怎么解析和理解

很多人以为数据拿到手就完事了。不是。

结构化数据的解析问题。企业系统返回的原始数据往往是”脏”的:字段命名不规范、金额单位混乱、状态值是代码(”ST_003″而不是”待审核”)、日期格式各异……插件后端要做大量清洗和字段映射,把脏数据变成 AI 能看懂的结构。这一层做不好,AI 拿到的是垃圾,输出的也是垃圾。

非结构化数据的理解问题。真实审批场景里,最有价值的往往不是表单字段,而是附件——合同正文(Word/PDF)、报价明细(Excel)、资质文件(图片扫描件)。这些非结构化内容,AI 要能读懂,要能提取关键要素,要能识别风险条款。

这一块能力,建议不要自己从头造轮子。市面上已经有成熟的文档解析和非结构化数据理解工具(比如专门做合同要素提取、PDF解析、表格识别的产品),直接采购集成,比自研要快得多、稳得多。

业务语义的理解问题。即便数据干净了,AI 还需要知道业务含义。”折扣率 0.82″只是个数字,AI 要知道这个行业正常折扣区间是多少、这个客户历史成交折扣是多少、公司底线政策是多少,才能做出有意义的判断。这些业务知识,必须由流程专家来定义和注入——这正是你最不可替代的价值所在。

图4:工具返回结构化数据,大模型基于事实生成分析

第三层难:跨系统数据的协同,是生产关系问题

这一层,很多技术人不重视,但实际上是最难推的。

AI 审批助手要真正有用,就必须能调取多个系统的数据。CRM 归销售部管,ERP 归财务/供应链管,HR 系统归人力部管,这些系统背后是不同的业务部门、不同的 IT 团队、不同的数据权限策略。

你要接入这些数据,本质上是在推动跨部门的数据协同。这不是一个技术问题,是一个组织问题:谁来牵头、谁来负责、谁来审批权限开放、出了问题谁来担责。

没有足够的组织授权,这件事推不动。技术方案再漂亮,卡在”这个数据不能给你”这一句话上,就全完了。

所以我的建议是:第一个落地场景,优先选数据在自己部门可控范围内的。不要上来就试图打通五个系统——先在一个场景里跑通、跑稳、跑出效果,再用结果去说服其他部门开放数据。

其他技术坑,简单说几个

面板样式隔离:插件面板注入到 ERP 页面,ERP 的 CSS 全局样式会污染面板显示。解决方案是所有注入样式加 !important,类名加 aic- 前缀,z-index 设最大值 2147483640,纯原生 DOM 不引入第三方框架。

工具调用链设计:用户的问题不能直接扔给大模型。需要一个 Skill 路由层,识别意图后分发给对应工具函数,工具去真实系统查数据返回结构化 JSON,再喂给大模型分析。大模型拿到的是数字和结论,不是模糊描述,分析才有依据。

流式响应:用 Server-Sent Events 协议,后端持续推送数据块,前端逐字追加。AI 生成审批意见后,一键填入目标输入框——这里有个坑:React/Vue 受控组件直接赋值无效,要通过原生 setter 触发框架更新机制,踩过一次就忘不了。

图5:三天落地路径——验证流程 → 接真实数据 → 迭代补齐(一切ready情况下)

· · ·

你有三条路

回到开头那个问题:作为流程负责人,你怎么把这件事落地?

我觉得有三条路,各有适合的情况。

路径一:内部自建如果你公司的技术团队有 Chrome 插件开发经验,或者愿意专门投入人力,可以按照这套架构自己搭。好处是完全自主可控,数据不出公司内网,长期迭代成本低。代价是需要真正懂这套技术的工程师,前期至少投入两到三周。

路径二:找外援,找会做这个的团队帮你做如果内部没有合适的技术资源,可以找外部团队定制开发。这套架构是标准化的,有经验的团队交付速度会快很多。关键是你作为流程专家,要能清晰表达场景需求——你懂业务,这是你的核心优势,技术部分可以外包。

路径三:先用轻量产品验证,再决定深度投入如果你现在还不确定业务侧的接受度,不妨先用一些现成的轻量工具(比如钉钉、飞书的 AI 助手能力,或者 Coze 等无代码搭建平台)跑一个简单版本,先验证用户会不会用、愿不愿意用。跑通了再考虑更专业的插件方案。

ROI 有时候没那么高大上。不妨可以从”外挂赋能现有系统”的思路走,先让 AI 能力跑起来,再逐步往深里做。

· · ·

企业AI能力的五级进化

最后说一个全局视角的判断。

这个插件方案,本质上是企业 AI 能力建设的一个切口。而企业的 AI 能力,是有成熟度层次的:

图6:企业AI能力密度五级进化——每往上走一级,AI对业务的价值就大一分

Lv.1:智能体 + 提示词。最基础的起点,AI 听话,但只知道你告诉它的那些话。

Lv.2:+ 知识库。把企业的审批规则、产品手册、行业标准喂进去,AI 开始有依据地说话,不再靠”想象”。

Lv.3:+ 记忆。AI 开始认识你。它记得这个客户上次谈判的结果,记得你的决策偏好,每次对话都在积累上下文。

Lv.4:+ Skill(技能封装)。AI 开始会干活。”生成审批意见”这个动作被封装成一个标准化技能,随时调用,输出稳定。

Lv.5:+ MCP(外部系统连接)。MCP 是 2024 年底兴起的标准协议,被称为 AI 时代的”USB 接口”。AI 通过它直接连接 CRM、ERP、财务系统,实时读数据,真正成为一个能干活的数字员工。

这个插件方案,已经触达了 Lv.4 到 Lv.5 的能力边界。但它同样可以从 Lv.1 开始部署,先跑起来,边用边升级。

· · ·

流程人在AI时代最大的优势

我做流程管理+AI产品设计这么多年,有一个越来越强烈的感受:

流程人在这一轮 AI 浪潮里,其实比很多人想象的更有优势。

为什么?因为你懂场景。

技术工程师可以搭出很漂亮的架构,但他不知道审批这个场景里,折扣分析比客户背景更重要;不知道审批人最怕的不是AI答得慢,而是AI答了一堆废话;不知道”写审批意见”这个动作,哪一句话是关键、哪一句话是废话。

这些判断,需要你来做。

技术可以外包,但场景判断不能外包。你作为流程专家的价值,不是去写代码,而是定义”AI应该在哪里帮、帮什么、怎么帮”。

这件事,我们这些做流程的人,天然比技术团队更在行。

所以别把 AI 看成技术部门的事。它是你的事,是流程管理者本来就该做的事:找到流程里的信息瓶颈,然后把它干掉。