生成式AI能否拯救RPA维护泥潭?

生成式AI是否可以帮助企业自动生成 RPA 测试场景，从而减少人工测试工时、降低错误率，并提升 RPA 系统的质量与可靠性。

一、为什么现在要讨论“RPA × 生成式AI”的质量保证？

很多企业导入 RPA 之后，原本以为可以大幅提升效率，但实际运行中却经常遇到新的问题：

“机器人又停了。”

“光准备测试数据就要半天。”

“页面稍微改一下，RPA 就跑不动了。”

RPA 并不是“开发完就结束”的工具。系统改版、页面 UI 变化、输入数据格式改变，都可能让机器人停止运行。文章指出，RPA 运维成本中，相当大的比例花在上线后的维护和修正上。机器人数量越多，维护压力就越大，现场人员逐渐从“开发新的自动化”变成了“不断修补旧机器人”。

二、RPA 测试场景制作的痛点：属人化与高工时

RPA 修改之后，最耗时间的往往是测试。

测试内容通常包括：

正常流程是否能正确运行

遇到异常数据时能否正确处理

是否会影响其他系统或业务流程

要设计完整的测试场景，需要深入理解业务，也需要能提前想到各种异常情况。但现实中，测试经常依赖某个负责人的经验。

比如：

“这个人请假了，测试就没人能做。”

“换了负责人之后，测试漏掉了，结果上线后出故障。”

这就是 RPA 运维中非常典型的“属人化”问题。

三、生成式AI能带来什么期待？

文章认为，ChatGPT、Claude 等大语言模型的能力提升，让下面这些做法变得越来越现实：

让 AI 读取业务说明书，自动生成测试用例

让 AI 根据错误日志提出修正建议

让 AI 自动补充异常测试场景

让 AI 生成测试数据

但现场也有担心：

AI 生成的测试场景会不会漏掉重要情况？

AI 能不能理解公司内部特有的业务规则？

如果最后还是人来全部检查，那到底能不能节省工时？

文章因此从三个视角展开讨论：质量、成本、责任。

四、三位专家视角

文章设置了三种角色来分析问题。

1. QA 质量保证视角：谨慎派

这类人关注的是：

“AI 生成的测试结果，能不能在审计时说清楚？”

QA 视角最担心的是 AI 幻觉、责任不清、证据不足。他们不会轻易相信“AI 说没问题”。

2. RPA 现场运维视角：实利派

这类人更关心：

“现场加班会不会真的减少？”

他们不追求理论上的完美，而是看实际工时、维护效率、ROI 是否划算。

3. AI 技术架构视角：革新派

这类人认为：

“很多问题不是模型不行，而是使用方法和系统设计不对。”

他们更关注 RAG、提示词设计、AI Agent、上下文输入质量等技术实现方式。

五、论点一：AI 生成测试场景的精度是否已经实用？

文章认为，目前生成式AI还不能做到“从零生成完全正确、完全可用的测试场景”，但已经可以作为测试设计的辅助工具。

技术视角：AI擅长理解条件分支，但依赖输入质量

如果业务流程图、规格书写得清楚，AI 可以比较准确地理解逻辑。

比如：

“A 情况走 B 流程，否则走 C 流程。”

这种条件分支，AI 有时可以比人更快、更完整地抽取出来。

但问题是，如果规格书模糊，或者业务规则只存在于老员工的经验里，AI 就会开始“猜”。这时就容易产生幻觉。

QA视角：AI在异常系测试上很有价值

正常流程测试，人类往往更了解业务重点。

但在异常测试、边界值测试方面，AI 有很大优势。

比如 AI 可以快速想到：

日期栏输入汉字怎么办？

金额为负数怎么办？

字符数刚好达到上限怎么办？

空值、重复值、格式错误怎么办？

人类容易默认“这种数据不会出现”，但 AI 可以机械地大量生成“刁钻测试场景”。这对提升测试覆盖率很有帮助。

现场视角：关键是“修改成本”是否可接受

如果 AI 生成 100 个测试用例，只有 50 个能用，剩下 50 个都要人工筛选，那现场人员可能会觉得：

“还不如我自己写快。”

所以，AI 的价值不只是“生成很多”，而是要生成足够可用、足够贴近业务的测试场景。

小结

生成式AI目前适合做：

“测试场景的壁打ち对象”

也就是帮助人类补充思路、发现盲点，而不是完全替代测试负责人。

特别是在异常系测试和边界测试方面，AI 已经有明显实用价值。

六、论点二：ROI 的损益分界点在哪里？

文章指出，很多宣传会说“测试工时削减80%”，但现场视角会比较谨慎。

因为这些数字经常没有计算：

准备测试数据的时间

等待测试执行的时间

写 Prompt 的时间

检查 AI 输出结果的时间

修正 AI 结果的时间

所以不能简单相信“80%削减”。

不过，如果企业有大量 RPA，而且这些机器人经常因为系统 UI 变化、业务规则变化而需要修正，那么 AI 辅助测试确实有可能带来明显收益。文章提到，在某些频繁修改的 RPA 场景中，整体工时削减约 30%～40% 是有现实可能的。

AI导入的成本构成

AI 本身的 API 费用，通常比人工成本低。

真正的成本在于：

如何让 AI 理解企业内部业务

是否需要构建 RAG 知识库

是否要整理规格书、业务流程图

是否需要设计标准 Prompt

是否要建设审核流程

如果公司只有不到 10 个 RPA 机器人，专门建设这套机制可能不划算。

但如果机器人数量达到 50 个、100 个以上，就会出现规模效应。

比较适合导入AI测试辅助的企业

文章给出的判断标准大致是：

RPA 机器人数量大约 30 个以上

每月有多次修正或维护需求

机器人涉及关键业务，停机会直接影响业务

当前维护人员不足

测试遗漏曾经导致过生产故障

如果符合这些条件，生成式AI辅助 RPA 测试的 ROI 就比较值得期待。

七、论点三：AI生成的测试，最终由谁负责？

这是文章最重要的一点。

AI 可以生成测试场景，但不能承担责任。

在审计、故障追责、质量说明时，不能说：

“因为 AI 说没问题，所以我们就上线了。”

最终责任必须由人来承担。

QA视角：人类角色会从“测试制作者”变成“测试审查者”

未来的质量保证流程中，人不一定要从零开始写所有测试场景，但必须审查 AI 生成的内容。

也就是说：

AI 负责生成草案。

人类负责判断合理性。

人类负责最终批准。

组织负责留下证据和流程记录。

这对企业非常重要。

技术视角：Self-Healing 自动修复正在发展

文章提到，一些工具开始具备 Self-Healing 能力。

比如页面按钮的位置、名称、选择器发生变化时，AI 可以尝试自动找到新的操作对象，并修复 RPA 流程。

这可以减少人工维护负担。

但风险也很明显：

AI 可能把错误的按钮误判为正确对象，然后继续执行流程。

所以，即使有自动修复能力，也必须保留日志，并由人类事后检查。

现场人员需要的新技能

过去 RPA 人员主要需要掌握 RPA 工具操作。

未来还需要掌握：

业务知识

AI 输出结果的判断能力

基础 Prompt 设计能力

测试设计能力

异常场景思考能力

也就是说，RPA 人员会从“工具操作者”升级为“AI 协同的自动化运维者”。

八、哪些企业最应该导入？

文章认为，以下企业比较适合考虑“RPA × 生成式AI”的质量保证方案：

拥有大量复杂分支的 RPA 机器人

RPA 维护人员不足

当初为了速度快速导入 RPA，但现在被错误处理和维护压垮

机器人数量多，维护频率高

业务重要性高，RPA 停止会影响收入、结算、客户服务等核心流程

九、推荐的导入步骤

文章不建议一开始就把所有 RPA 都交给 AI，而是建议小规模开始。

Step 1：先让AI生成异常测试想法

最安全的做法是，让 AI 帮你列出：

可能出现哪些错误？

哪些异常数据需要测试？

哪些边界条件容易被忽略？

这个阶段几乎没有系统风险，很适合作为第一步。

Step 2：让AI生成测试数据

可以让 AI 生成不包含个人信息的虚拟测试数据。

比如：

客户编号

订单金额

日期

异常输入

边界值数据

这类工作安全性高，效果也比较明显。

Step 3：选择非核心业务进行试点

不要一开始就用在核心业务。

先选影响范围小的机器人，测试 AI 从测试场景生成到执行辅助的完整流程。

然后统计：

节省了多少工时？

测试覆盖率是否提升？

人工修正比例是多少？

有没有减少上线后的故障？

十、2026年以后，RPA × AI 可能如何发展？

文章预测，未来 AI Agent 可能会常驻监控 RPA 日志。

它可以自动完成：

监控 RPA 执行日志

发现错误征兆

自动生成测试场景

夜间执行测试

第二天向负责人提交报告

建议修复方案

人类则专注于：

异常判断

最终批准

复杂业务决策

责任确认

也就是说，RPA 运维会从“人工救火”转向“AI 预警 + 人类判断”。