AI 可以逐步接手工业软件的自动化测试了
工业软件的测试,一直是研发团队心里一根扎得很深的刺。
CAD,CAE,EDA,CFD,这几个方向的软件自动化测试有多难做,做过的人都懂。
两个独立的痛:数值比对,和 GUI 点击
工业软件的自动化测试,卡在两个地方。一个是算得对不对,一个是点得动不动。
先说算的问题。
改了一个求解器的迭代逻辑,跑同一个结构仿真算例,某个节点位移从 3.14159mm 变成了 3.14162mm。测试脚本怎么写断言?写死一个数肯定不行。写成”允许偏差 0.1%”,这个 0.1% 是谁定的?凭什么?
没人说得清,凭经验拍。
布线算法更新了,同一块设计的走线总长变了,DRC 警告数量变了。这算退化吗?时序好了还是坏了?脚本不知道,工程师也要想半天。
流场仿真换了一台服务器,浮点结果小数点后第六位就不一样。不是 bug,是 CPU 指令集的问题。但你的自动化测试一直报 fail,一直是假阳性。
再说点击的问题。
工业软件的 GUI 极其复杂。三维视口、浮动工具栏、参数联动面板、右键嵌套菜单……CAD 软件里随便一个”创建圆角”的操作,背后可能涉及选择实体、切换边选择模式、输入参数、确认预览、提交,五六个步骤,每步都依赖上一步的界面状态。
以前怎么测?人工点。
版本一发,测试工程师对着新版本,把主要功能流程一遍遍走。这件事你没法完全省掉,因为工业软件的 GUI 行为太复杂,哪个对话框该弹、哪个按钮该灰掉、哪个参数联动了——都得有人眼验证。
后来有了录制回放工具。录下鼠标轨迹和点击事件,下次自动回放。听起来不错,但有个致命问题——UI 一改就全崩。
换了一个图标位置,录制脚本找不到坐标。重新设计了一个面板,所有相关的回放脚本都废了。EDA 软件每个大版本的界面调整是常态,录制回放脚本的维护量,有时候比写功能代码还大。最后很多团队直接放弃,GUI 测试退回到人工点。
AI 进来,这两个问题开始松动
数值比对这边:
以前容差阈值靠拍脑袋,现在可以用 AI 分析大量历史版本的计算结果,自动学哪些物理量天生会漂移、漂移幅度在什么范围内正常。动态生成每条用例的合理容差,而不是一个对所有量一刀切的全局百分比。
回归测试跑完一堆 fail,以前要工程师一条条看 log。现在 AI 自动聚类失败原因,判断是代码改动导致的还是环境噪声,输出”3 个根因,建议先查第一个”。debug 时间能省掉一大半。
EDA 里验证新规则有没有正确实现,以前要工程师手工构造测试设计,故意违反每条规则看软件能不能抓住。现在喂给 AI 一份规则文档,自动生成覆盖每条规则的测试版图,包括刚好违反的、刚好不违反的、边界情况。原来两周的活,现在两天。
GUI 点击这边:
这是最有意思的变化。
新一代的 AI 测试工具不再靠坐标录制,而是用视觉模型理解界面——它看到的是”一个标注了’创建圆角’的按钮”,而不是”坐标 (452, 318) 处有个可点击元素”。UI 改版了,按钮挪了位置,它认得出来,继续点,不崩。
更进一步,有些工具开始支持自然语言描述操作流程:”打开一个零件文件,选中顶面所有边,创建 2mm 圆角,保存。”AI 理解这段话,自己在 GUI 里找到对应操作,执行,截图,验证结果是否符合预期。
不需要有人一步步录制,也不需要懂 XPath 或者坐标定位。测试用例的编写门槛,从”懂软件又懂测试框架的工程师”,降到了”懂软件的任何人”。
这一刀,比数值比对那边割得更深。
谁最危险
靠”手工测试外包”活着的团队。 承接工业软件厂商的版本回归测试,派一批熟悉产品的工程师对着新版本点点点,出报告。这件事 AI 正在接管,速度更快,不知疲倦,还能截图留证。
卖录制回放工具的公司。 这类工具的核心卖点是”不用写代码就能做自动化测试”。但录制回放的致命伤——UI 一改就崩——从来没有被真正解决过。AI 视觉理解直接绕开了这个问题,录制回放的存在意义就很尴尬了。
专门维护老测试脚本的服务商。 帮客户维护积累了十几年的测试脚本,版本升级后接口变了、路径变了,找他们修。AI 现在能自动识别并修复大部分因接口变更导致的脚本问题,这个生意的单子在变少。
还没被替代的
工业软件的认证测试——航空、核电、医疗器械行业用的仿真软件,监管机构要求有人签字背书,证明计算结果可信。这块 AI 做不了,因为没人敢让 AI 承担法律责任。
还有新物理模型的首次验证。一个全新的算法第一次上线,怎么知道它对?需要和实验数据、解析解做对比,需要专家判断。这件事还是人在做。
AI 替代的,是执行。留下来的,是判断。
但能做判断的人,会越来越少需要。

夜雨聆风