企业管理软件 AI 化重构⑤:AI ERP 不要一上来就自动执行
ERP的AI 化,不是把AI 接到系统上,而是把企业业务拆成可理解、可调用、可治理、可审计的能力网络。
前面几篇,我分别讲了AI ERP 的入口迁移、Skill 契约、厂商入口之争,以及企业AI 的权限治理。这些讨论回答的是:AI ERP 应该长成什么样。这一篇要回答一个更落地的问题:企业应该怎么一步步走到那个样子?
我的判断很简单:AI ERP不要一上来就自动执行。
查询型:帮人看见生成型:帮人起草执行型:在约束下自动做
很多企业AI 项目出问题,不是因为AI 不够强,而是因为一开始就跳到了执行型。它们还没有让AI 学会“看见”,也没有让组织习惯“审核”,就急着让AI 去“自动做”。结果不是智能化,而是放大风险。
01一句话下单,为什么会变成事故?
某中型制造企业,年采购额8 个亿。老板参加了一个AI ERP 供应商演示。销售人员把一个麦克风模样的设备放在桌上,说了一句:
帮我下个采购单,买500 个304 不锈钢法兰,DN80,供应商用上次那家。
屏幕亮起,订单界面自动弹出。品名、规格、数量、单价、供应商、交货日期全部填好,只差一个“提交”按钮。老板按下去,订单直达采购流程,后续还能联动仓库和财务。
三个月后,采购部发现AI 提交的错误订单超过100 单。有的是规格错了,DN80 写成了DN100;有的是单价用了三个月前的价格,没有更新最新调价;有的是重复下单,订单编号不一样,但内容完全一样。
类似的问题,不只会发生在采购里。财务审核、库存调整、客户报价、费用报销、合同审批,只要AI 一上来就进入执行环节,都可能出现同样的问题:看起来只是一个动作错了,背后其实是数据、规则、权限和审核机制都没有准备好。
供应商说,这是使用不当,需要更多训练。企业说,这是产品有缺陷,根本没考虑我们的业务规则。两边都有道理,但真正的问题不在这里。
不是AI 不够聪明,也不是企业不会用,而是认知台阶错位了。
供应商演示的是一个执行型场景,而企业真正应该先上的,是查询型场景。还没有建立数据可信度,还没有跑通权限边界,还没有形成业务人员的审核习惯,就直接让AI 去下单。
企业AI 落地最常见的失败,不是走得太慢,而是太早让AI 做了它还不该做的事。
02 AI ERP落地,不能从“自动做”开始
很多企业听到AI ERP,脑子里最先出现的画面,就是一句话下单、自动审批、智能调度、自动生成凭证。
AI以什么身份执行?能看哪些数据?能操作哪些单据?能不能越过审批节点?出了问题谁负责?上一篇权限篇里我讲过一个判断:个人AI 看能力,企业AI 看权限。没有权限体系,执行型AI 就不是数字化员工,而是一个穿墙而过的幽灵。
金额多大会触发审批?哪些供应商已经被锁定?什么价格区间算合理?哪些物料必须三家比价?哪些异常必须人工复核?执行型AI 最怕的不是不会做,而是在规则不清楚的时候,还自信地继续做。
历史数据够不够准?供应商档案是不是完整?价格有没有及时更新?库存数据和实际库存是否一致?ERP、SRM、OA、财务系统之间有没有数据断点?如果这些底子没有打好,AI自动执行只会把旧问题跑得更快。
所以,企业不是不能上执行型AI,而是不能一开始就上执行型AI。正确路径应该反过来:先从最低风险的查询型开始,让AI 帮人看见;再进入生成型,让AI 帮人起草、分析、建议;最后才进入执行型,让AI 在明确约束下自动做。
对于企业管理者来说,这是落地路径;对于CIO 来说,这是项目推进节奏;对于ERP 产品经理来说,这也是AI 功能路线图:不要一上来就设计“自动执行”,而要先设计“可信查询”,再设计“可审核生成”,最后设计“可中断执行”。
03第一阶段:查询型,先让AI帮人看见
比如,这个订单到哪了?这个供应商过去一年准时交付率是多少?哪些物料库存低于安全水位?哪些费用超过预算?哪些客户回款延迟超过30 天?
查询型AI 不下单、不审批、不改数据、不触发流程。它只是把系统里的信息,用自然语言呈现给用户。
查询型AI 解决的,不是“能不能查到”的问题,而是“人愿不愿意查”的问题。
传统ERP 里,很多信息并不是没有,而是藏得太深。想查一个供应商的历史付款记录,你要知道供应商模块在哪里,查询条件怎么填,报表口径怎么选,数据范围怎么筛。一个熟练员工可能30 秒能查到,但在真实业务现场里,30 秒也可能意味着:算了,不查了。
AI查询型场景的价值,就是把查询成本降到几乎为零。当人从“懒得查”变成“随口问”,企业里很多原本被埋在系统里的问题,才会开始浮出来。
比如采购员随口问:“帮我看一下A 供应商最近三个月到货准时率。”AI 回答:“A 供应商最近三个月准时率从95% 降到82%,其中7 单因物流延迟造成延期。”采购员继续追问:“延迟是不是集中在某一类物料?”AI 回答:“主要集中在包装材料和小规格五金件,延迟订单占比68%。”
这些信息本来就在系统里,只是过去没人愿意查、不会查,或者没有时间查。查询型AI 的价值,不是替人做决定,而是让人更容易看到事实;而更好地看到事实,是更好判断的前提。
AI只能读数据,不能写数据。它可以查,可以解释,可以提示异常,但不能提交、修改、审批、删除。回答错了当然有影响,但它不会直接生成一张错误订单,也不会自动发起一笔付款。
所以,查询型是企业AI 最适合起步的阶段。它让组织低风险地建立第一层信任。
04第二阶段:生成型,AI帮人起草,人做最终判断
当查询型场景跑顺之后,企业可以进入第二阶段:生成型。
生成型AI 不再只是回答问题,而是开始帮人起草内容、形成建议、生成初稿,比如草拟采购申请、生成费用分析报告、给出凭证建议、起草合同条款、生成审批意见、输出风险评估摘要。
注意这些词:草拟、建议、初稿、摘要。它们都不是最终动作。
举个例子。财务经理要做月度费用分析报告,传统做法是从系统里拉数据,按部门整理,筛异常,做图表,写分析,写建议。整个过程可能要花一天甚至两天。
生成型AI 的做法是,你对它说:“帮我整理上月费用数据,按部门汇总,标出超过预算10% 的异常项,并给出可能原因。”几分钟后,AI 给你一份完整初稿:哪些部门超预算、超在哪些科目、和历史同期相比有什么变化、可能原因是什么。
你再花20 分钟审阅、修改、补充判断,然后发出去。
这中间真正的变化,不只是从两天变成20 分钟,更重要的是人的精力从“整理数据”转向了“审视判断”。
生成型AI 比查询型多了一层风险。它不只是给你看事实,它还开始组织事实、解释事实、给出建议。这时候最关键的设计是:人必须是最终审核者和签出者。
AI可以生成,但不能替人签出;AI 可以建议,但不能替人负责;AI 可以起草,但不能把起草变成事实执行。
AI生成的内容越完整,人的审核越容易变成走形式。报告格式很好,逻辑看起来完整,图表也漂亮,审核人很可能不再重新判断,而是直接点通过。这时候,AI 看起来只是辅助,实际上已经完成了关键判断。
所以,生成型阶段的权限设计不能只写一句“最终由人确认”,还要定义:人在哪里确认,确认什么,是否必须看关键依据,是否允许一键通过,修改意见是否要回流,审核日志是否保留。
生成型AI 的正确价值,不是让人放弃判断,而是把人从低价值整理里解放出来,让人更集中地做判断。
这个阶段的权限可以概括为:只读+ 建议。AI 能读数据,能生成内容,能给出建议,但不能直接提交,不能自动审批,不能修改核心业务数据。它开始参与判断,但还不能拥有执行权。
05第三阶段:执行型,AI在明确约束下自动做
它可以自动提交订单、自动审批付款、自动调整价格、自动发货、自动对账、自动开票。这些场景当然有价值,但它们也是风险最高的一层。
因为执行型AI 会直接作用于业务数据,并产生现实后果。
订单下了就是下了,款付了就是付了,货发了就是发了,发票开了就是开了。查询型出错,最多是回答错;生成型出错,人还有机会审核;执行型出错,业务结果已经发生。
所以,执行型AI 最怕的,不是它不会执行,而是它在“不该执行”的时候继续执行。
比如,库存已经低于安全水位,按补货规则应该下单;但同一时间,供应商评分刚刚下降,最新报价比上月高出12%,财务系统又提示本月预算余额不足。
这时候,AI如果只看库存,就会自动补货。从单一规则看,它没有错;但从企业经营看,它已经危险了。
所以,执行型AI 的关键,不是把每条规则跑得更快,而是在多个规则发生冲突时知道停下来。
第一,规则必须清楚。如果AI 自己判断“这个订单虽然有点例外,但好像也能批”,那就不能让它自动执行。执行型AI 只能处理规则明确、边界清楚、例外可识别的场景。
第二,异常必须能中断。金额超限、供应商异常、价格波动、库存冲突、预算不足、数据不一致,任何一个触发,都应该停下来交给人。执行型AI 最重要的能力,不是一路做到底,而是知道什么时候停下来。
第三,操作必须能追溯。AI做了任何一个操作,系统都必须回答清楚:谁发起的任务,AI 以什么身份执行,调用了哪个Skill,使用了哪些数据,触发了哪些规则,人有没有确认,结果有没有被回写。
因为到了执行型,问题已经不是技术能不能实现,而是组织能不能承接责任。当AI Agent 提交了订单,权限是谁的?如果订单错了,是采购员负责,还是部门负责人负责?是IT 负责,还是系统供应商负责?
这些问题没有通用答案。每个企业的人事结构、责权分配、流程习惯都不一样。但有一条铁律:在组织没有想清楚之前,不要急着让AI 自动执行。
06真正成熟的路径,通常一点都不炫酷
一家多工厂制造企业,最开始并没有让AI 自动下单,也没有让AI 自动审批。它们选的第一个场景,非常普通:查订单状态。
业务人员可以直接问:这个采购订单现在到哪了?这批物料还有几天到货?哪些订单已经超过承诺交期?哪些供应商最近延迟最多?
这个场景听起来不炫,但它很安全。AI只能读数据,不能改数据,也不能触发流程。它的作用是把原来散落在ERP、SRM、仓储系统里的信息,用自然语言串起来。
跑了三个月以后,采购部开始主动提需求:既然你能查到订单状态,能不能帮我自动整理一份延迟订单清单?
于是进入生成型。AI每周生成延迟订单分析,列出供应商、物料、延期天数、影响订单和可能原因。采购员审核后,再决定是否催单、换供应商,或者调整采购计划。
又过了一段时间,业务部门发现有一类场景非常稳定:低金额、标准物料、固定供应商、库存低于安全水位、预算充足,且过去12 个月没有异常。
这时,企业才开始做小范围执行型试点:这类标准补货单,可以由AI 自动生成并提交,但金额超过阈值、供应商评分下降、价格波动超过5%、库存数据冲突时,必须中断交给人。
这条路径没有Demo 上那种“一句话自动下单”的震撼感,但它真正建立了三件事:业务人员相信AI 查到的数据是准的,业务人员习惯了AI 先起草、人再判断,企业逐步摸清了哪些场景可以放权、哪些场景必须停下来。
所以,AI ERP的正确落地,往往不是从最炫的场景开始,而是从最不容易出错的场景开始。
真正的成熟,不是第一天就让AI 自动执行,而是让组织一点点愿意把边界清楚的任务交给AI。
07每一级都要问四个问题
企业到底应该怎么推进?我的建议是,每一级都问四个问题。
它用了哪些数据?数据是不是最新的?数据来源是否可靠?口径是否一致?在查询型阶段,这个问题相对简单;到了生成型和执行型,这个问题会变复杂,因为AI 可能综合多个系统、多个规则、多个历史样本来形成判断。
人在哪个环节介入?介入之前AI 能做到什么程度?介入之后AI 是否还能继续参与?如果人只是最后点一下确认,那审核可能已经失效。真正有效的审核,应该让人看到关键依据、异常提示和风险来源,而不只是看到一个漂亮结论。
当AI 碰到不确定情况,是继续猜,还是停下来问人?金额超限要不要停?数据冲突要不要停?规则缺失要不要停?从未见过的业务场景要不要停?执行型AI 最重要的不是执行能力,而是中断能力。
AI做过什么,为什么这么做,用了哪些数据,调用了什么Skill,有没有人确认,这些能不能被完整追溯?如果事后说不清楚,就不要事前放太开。
这四个问题,在查询型阶段比较容易回答,到了生成型开始变得复杂,到了执行型就变成企业AI 治理的核心。
所以,AI ERP成熟度的真正度量标准,不是它回答得多漂亮,也不是它执行得多快,而是它在出错前能不能停下来,出错后能不能说清楚,执行全过程能不能追溯。
从查询型进入生成型,通常有一个信号:业务人员不再只问“结果是什么”,而是开始问“能不能帮我整理成一份报告、清单或建议”。这说明AI 已经从信息查询,进入到内容组织和初步判断。
从生成型进入执行型,也有一个信号:业务人员开始主动提出,这些标准场景能不能不用我每次点确认?但这句话不能直接理解为“可以自动执行了”,还要同时满足三个条件:场景足够标准,规则足够清楚,异常足够容易识别。
执行型试点成熟,还有一个信号:出错时,企业能快速说清楚问题发生在哪个环节,是数据错、规则错、Skill判断错,还是人类确认错。如果连错误归因都说不清楚,执行型就还没有真正成熟。
这四个问题和三个信号,最终指向一个更大的问题:组织的风险管理节奏,能不能跟上技术放权的节奏?如果跟不上,AI跑得越快,组织越紧张。
08 AI ERP推进速度,不能超过组织消化风险的速度
AI ERP执行型场景最难的部分,往往不是技术,而是业务部门愿不愿意让它执行。
采购部会说,AI怎么能代替我判断供应商?财务部会说,AI 生成付款建议可以,但自动付款我不放心。业务部门不是不配合,这些警惕是合理的。
因为当AI 真把采购订单下错了,挨骂的是采购员,不是AI;当AI 把付款审批通过了,承担责任的是财务负责人,不是模型。人承担后果,机器不承担。只要这个事实不改变,让AI 自主执行就一定会遭遇组织性的抵抗。
所以,正确的做法不是简单说服业务部门“相信AI”,而是设计一条让业务部门逐渐愿意放权的路径。
先从查询型开始,让业务部门尝到甜头:AI帮我更快查到库存,帮我一眼看到异常,帮我发现供应商交付变差了。信任来自一次次“这个回答很准”。
当这种信任积累到一定程度,业务部门会自己提出:能不能让AI 帮我起草订单?能不能让AI 自动生成月度分析?能不能让AI 先出一版合同风险摘要?这就是生成型的信号。
再往后,当大量标准化场景被反复验证,业务部门可能会继续提出:这些100 单都是标准流程,能不能让AI 自己跑完?低风险、低金额、规则明确的订单,能不能自动处理?异常情况再交给人?这才是执行型需求自然出现的时刻。
不是自上而下要求业务部门配合,而是业务部门在真实使用中,逐步愿意把一部分权力交给AI。
AI ERP的落地,不是越快越好。它的推进速度,不能超过组织消化风险的速度。
如果企业没有耐心从查询型开始,就很容易在执行型里摔倒;如果企业愿意一步一步走,AI才会从一个漂亮Demo,慢慢变成真正可信的数字化员工。