AI 可以逐步接手工业软件的自动化测试了-夜雨聆风

AI 可以逐步接手工业软件的自动化测试了

工业软件的测试，一直是研发团队心里一根扎得很深的刺。

CAD，CAE，EDA，CFD，这几个方向的软件自动化测试有多难做，做过的人都懂。

两个独立的痛：数值比对，和 GUI 点击

工业软件的自动化测试，卡在两个地方。一个是算得对不对，一个是点得动不动。

先说算的问题。

改了一个求解器的迭代逻辑，跑同一个结构仿真算例，某个节点位移从 3.14159mm 变成了 3.14162mm。测试脚本怎么写断言？写死一个数肯定不行。写成”允许偏差 0.1%”，这个 0.1% 是谁定的？凭什么？

没人说得清，凭经验拍。

布线算法更新了，同一块设计的走线总长变了，DRC 警告数量变了。这算退化吗？时序好了还是坏了？脚本不知道，工程师也要想半天。

流场仿真换了一台服务器，浮点结果小数点后第六位就不一样。不是 bug，是 CPU 指令集的问题。但你的自动化测试一直报 fail，一直是假阳性。

再说点击的问题。

工业软件的 GUI 极其复杂。三维视口、浮动工具栏、参数联动面板、右键嵌套菜单……CAD 软件里随便一个”创建圆角”的操作，背后可能涉及选择实体、切换边选择模式、输入参数、确认预览、提交，五六个步骤，每步都依赖上一步的界面状态。

以前怎么测？人工点。

版本一发，测试工程师对着新版本，把主要功能流程一遍遍走。这件事你没法完全省掉，因为工业软件的 GUI 行为太复杂，哪个对话框该弹、哪个按钮该灰掉、哪个参数联动了——都得有人眼验证。

后来有了录制回放工具。录下鼠标轨迹和点击事件，下次自动回放。听起来不错，但有个致命问题——UI 一改就全崩。

换了一个图标位置，录制脚本找不到坐标。重新设计了一个面板，所有相关的回放脚本都废了。EDA 软件每个大版本的界面调整是常态，录制回放脚本的维护量，有时候比写功能代码还大。最后很多团队直接放弃，GUI 测试退回到人工点。

数值比对这边：

以前容差阈值靠拍脑袋，现在可以用 AI 分析大量历史版本的计算结果，自动学哪些物理量天生会漂移、漂移幅度在什么范围内正常。动态生成每条用例的合理容差，而不是一个对所有量一刀切的全局百分比。

回归测试跑完一堆 fail，以前要工程师一条条看 log。现在 AI 自动聚类失败原因，判断是代码改动导致的还是环境噪声，输出”3 个根因，建议先查第一个”。debug 时间能省掉一大半。

EDA 里验证新规则有没有正确实现，以前要工程师手工构造测试设计，故意违反每条规则看软件能不能抓住。现在喂给 AI 一份规则文档，自动生成覆盖每条规则的测试版图，包括刚好违反的、刚好不违反的、边界情况。原来两周的活，现在两天。

GUI 点击这边：

这是最有意思的变化。

新一代的 AI 测试工具不再靠坐标录制，而是用视觉模型理解界面——它看到的是”一个标注了’创建圆角’的按钮”，而不是”坐标 (452, 318) 处有个可点击元素”。UI 改版了，按钮挪了位置，它认得出来，继续点，不崩。

更进一步，有些工具开始支持自然语言描述操作流程：”打开一个零件文件，选中顶面所有边，创建 2mm 圆角，保存。”AI 理解这段话，自己在 GUI 里找到对应操作，执行，截图，验证结果是否符合预期。

不需要有人一步步录制，也不需要懂 XPath 或者坐标定位。测试用例的编写门槛，从”懂软件又懂测试框架的工程师”，降到了”懂软件的任何人”。

这一刀，比数值比对那边割得更深。

靠”手工测试外包”活着的团队。 承接工业软件厂商的版本回归测试，派一批熟悉产品的工程师对着新版本点点点，出报告。这件事 AI 正在接管，速度更快，不知疲倦，还能截图留证。

卖录制回放工具的公司。 这类工具的核心卖点是”不用写代码就能做自动化测试”。但录制回放的致命伤——UI 一改就崩——从来没有被真正解决过。AI 视觉理解直接绕开了这个问题，录制回放的存在意义就很尴尬了。

专门维护老测试脚本的服务商。 帮客户维护积累了十几年的测试脚本，版本升级后接口变了、路径变了，找他们修。AI 现在能自动识别并修复大部分因接口变更导致的脚本问题，这个生意的单子在变少。

工业软件的认证测试——航空、核电、医疗器械行业用的仿真软件，监管机构要求有人签字背书，证明计算结果可信。这块 AI 做不了，因为没人敢让 AI 承担法律责任。

还有新物理模型的首次验证。一个全新的算法第一次上线，怎么知道它对？需要和实验数据、解析解做对比，需要专家判断。这件事还是人在做。

AI 替代的，是执行。留下来的，是判断。

但能做判断的人，会越来越少需要。