软考深度分享——AI大模型在软件测试中的应用

2025年上半年系统架构设计师论文真题就考了"论软件测试方法及应用"，要求论述AI工具在测试用例生成中的具体应用。这说明AI+测试已经从行业热点变成了考纲范围内的硬考点。本文面向架构设计师方向，从企业案例和论文写作两个角度展开。

一、大模型在测试中的定位与核心场景

大模型在测试领域的角色是辅助生成和质量增强，负责广度覆盖和效率提升，最终的质量判断仍由人把关。实际落地中主要集中在四个场景：测试用例生成（已大规模落地）、自动化脚本编写（需人工适配）、缺陷预测（探索阶段）、测试报告生成（已落地）。

二、企业实战：邮储银行的智能测试架构

邮储银行的AIGC智能测试项目是目前公开资料中最完整的金融行业案例，已应用于80多个项目，累计生成超2万条用例。

2.1整体架构

邮储银行采用"工程化平台+智能体"的解耦架构，核心思路是将数据处理与智能决策分离。前端层与现有测试管理工具深度集成；中台统一管理流量控制、模型调度和知识库调用；智能体层聚焦需求解析和用例生成等核心任务；基础层构建RAG知识库存储项目/业务/测试三类知识资产。

2.2关键技术决策

放弃Fine-tuning，选择Prompt+RAG。早期尝试过增量训练，但随模型参数扩大成本急剧上升。最终转向轻量化方案，通过RAG检索增强注入领域知识，幻觉率降低超30%。RAG知识库包含三类资产：项目知识库（需求文档、历史用例、原型图）、业务知识库（术语、操作指南）、测试知识库（规范、模板、验证要点）。

2.3处理流程

原始需求文档 → 需求分析（拆解功能模块）→ 功能点提取（结合RAG知识库）→ 测试点生成（等价类+边界值+异常场景）→ 用例编写（标准化输出）→人工评审与反馈采纳 → 智能体调优迭代。

2.4实际效果

应用规模80+项目，2万+条用例；采纳率从初期10%提升至28%，标杆项目超60%；测试覆盖度平均提升12%；用例设计效率提升10%，生成耗时缩短70%。

三、OpenClaw：面向测试人员的自然语言测试工具

如果说邮储银行的方案是"企业级平台"，那OpenClaw代表的就是"轻量级工具"方向。OpenClaw是一款支持本地部署的开源AI Agent平台，核心能力是通过自然语言指令驱动浏览器操作，并原生集成飞书、钉钉等IM工具。

功能测试示例：传统方式需要编写Selenium脚本定位元素、编写断言，约30分钟。OpenClaw方式只需在飞书中发送一条自然语言指令即可完成，测试流程从"编码-运行-调试"变成"描述-执行-确认"。

OpenClaw的定位是降低自动化测试的准入门槛，对于没有测试开发团队的中小项目，测试人员可以用自然语言完成基本的UI自动化测试。

四、案例角度怎么考

架构师案例分析题通常会给出业务场景要求设计方案。答题要点包括五个环节：

需求分析：识别测试范围（功能、接口、性能）
架构设计：采用"平台+智能体"解耦架构，说明各层职责
知识库建设：RAG知识库的分类设计和数据来源
流程设计：从需求输入到用例输出的完整处理链路
质量保障：评估指标（精确率、召回率、F1值）和人工评审机制

五、论文角度怎么考

2025年上半年真题要求论述三个要点：AI工具生成测试用例的具体应用、基本处理流程、实际项目经验。

论文写作框架（3000字）：摘要（约300字，项目背景+技术+成效）→项目概述（400字，系统规模、测试痛点）→方案设计（800字，架构设计、技术选型理由、关键流程）→实施过程（700字，数据准备、调优过程、遇到的问题）→效果评估（500字，量化指标、不足与改进）→经验总结（300字）。

加分项：引用RAG技术降低幻觉率、业务规则库过滤无效用例、失败用例反馈迭代等具体技术细节，体现真实项目经验。

参考文献

[1]系统架构设计师| 2025年上半年论文真题回忆版

http://www.lryc.cn/article/2391711.html

[2]金科创新社|邮储银行AIGC智能测试自主进化实践

https://www.fintechinchina.com/solutions/8563

[3] CSDN |邮储银行AI大模型智能测试案例拆解

https://blog.csdn.net/u014715882/article/details/146374896

[4]博客园| OpenClaw+飞书AI驱动的UI自动化测试实践

https://www.cnblogs.com/zgq123456/articles/19666434

注：本文由笔者提供idea创意、大纲、修订与总体把关，由模型辅助生成，经豆包二次审稿。如有问题欢迎联系讨论。如有软考辅导、论文批改需求欢迎来call