基于 MAE 自监督预训练的无监督缺陷检测,可能比你想的更适合制造现场
在制造业做了二十多年设备、工艺和现场管理,我对一个问题体会特别深:很多人以为注塑件表面检测只是“装个相机、跑个算法”的事,真正到了现场才知道,这件事远没有那么简单。
因为注塑件表面的问题,从来都不是只有一种。
有的是缩水,有的是流痕,有的是进胶口异色;有的是表面划痕,有的是局部发黑,还有的是肉眼不太好判断的凹凸点、油污残留、局部异常纹理。
更麻烦的是,这些问题还不是静态的。同一款产品,不同批次可能就有色差;同一副模具,不同时间段打出来的件,表面纹理和亮度也会变化。
也就是说,现场真正难的,从来不是“缺陷长什么样”,而是:
在批次色差、工艺波动、光线变化、人员走动、环境干扰都存在的情况下,系统怎么分清楚——到底什么是正常波动,什么才是真正的异常。
这也是为什么我越来越觉得:对于注塑件表面检测这类场景,基于 MAE 自监督预训练的无监督缺陷检测方法,可能比传统监督学习更适合现场。
今天这篇,我就从一个长期在制造业一线做设备和工业AI落地的角度,来拆清楚这件事。
一、注塑件表面检测,为什么在工厂里总是“看起来简单,做起来很难”?
很多人第一次接触这个问题时,都会有一个判断:不就是把缺陷拍下来,然后训练模型去识别吗?
这句话在实验室里没有错,但放到工厂里,经常就不成立了。
因为注塑件表面缺陷和很多标准视觉任务不一样,它的难点主要有三层。
1. 缺陷类型多,而且边界并不总是清楚
像缩水、流痕、进胶口异色、发黑、划痕、凹凸点、油污,这些缺陷在外观上差异很大。有些是颜色问题,有些是纹理问题,有些是形貌问题,还有些是污染问题。
更现实的是,很多缺陷并不是“非黑即白”的。有些轻微流痕,到底算不算异常,要看客户标准;有些批次色差,工程师知道是正常波动,但模型不一定知道;有些油污和反光叠在一起,连人都得多看两眼,更别说算法。
所以这件事不是简单的“分类”,而是一个典型的复杂外观异常识别问题。
2. 你最缺的不是正常图,而是缺陷图
这一点做过产线视觉的人都懂。正常件很多,随便一采就是几百张、几千张;真正高质量、能拿来训练的缺陷图,反而最少。
原因在于缺陷本身比例不高、缺陷出现时,现场第一反应是先处理,不是先留数据、很多缺陷要靠有经验的人判断和标注、同样是“发黑”或“异色”,不同产品的判定逻辑也不完全一样。
结果就是,传统监督学习最依赖的东西——大量带标签缺陷数据——恰恰是现场最难长期稳定拿到的。
3. 工厂不是实验室,现场变化会不断干扰模型
这一点尤其重要。我前面提到的这些现场问题,其实就是工业AI落地最常见的“隐性变量”,不同时间段光线不一样、人员走动会带来阴影和遮挡变化、设备振动可能影响拍摄稳定性、现场油污、粉尘、反光会扰乱成像、环境节奏不稳定,也会影响采图一致性。
很多模型在实验室里为什么看起来很好?因为实验室的数据条件太干净、太稳定了。
可工厂现场不是这样。现场更像是在不断变化的背景下,去判断一个原本就不稳定的表面对象。所以注塑件表面检测真正难的,不是“模型会不会识别”,而是模型能不能在复杂现场下,稳定地学会什么是正常,什么是不正常。
二、为什么传统监督学习在这个场景下,经常越做越重、越做越难维护?
过去很多工厂上视觉项目,默认思路都是监督学习。说白了就是先采图、再标注、再训练,然后把缩水、流痕、划痕、发黑这些类别都喂给模型。
这条路理论上没问题,但在注塑现场有几个明显短板。
第一,缺陷样本永远跟不上现场变化
你今天采到的是这一批次的异常,明天材料换了、模温变了、颜色漂了,新的问题又来了。如果每来一种变化,就重新补数据、重新标注、重新训练,那这套系统会越来越重,维护成本也越来越高。
第二,模型很容易学偏
这是很多现场项目的共性问题。模型本来应该学“缺陷特征”,结果最后学进去的,可能是某一批次的颜色分布、某一类光照条件、某个固定角度的反光特征、某种背景位置关系,也就是说,它学到的不一定是“缺陷本身”,而是“某个特定场景下看起来像缺陷的东西”。
所以很多项目上线初期精度不错,但一过几周,误检率就开始上来。不是模型坏了,而是它原来学得就不够稳。
第三,监督学习最怕“多品种 + 多波动 + 小样本”
注塑现场最典型的特征就是产品多、批次多、波动多、缺陷少、标注贵,而这几件事,几乎都和传统监督学习的最佳条件相反。所以我越来越觉得,在这类场景里,问题不能再简单理解成“怎么多收集一点缺陷样本”,而应该换个角度:
既然缺陷样本天然少,那能不能先不学“缺陷”,而是先学“正常”?
这就是无监督异常检测真正有意义的地方。
三、为什么我会更看好 MAE 自监督预训练这条路线?
如果用一句话来概括,MAE 这类方法的价值就在于:
它不要求你先准备很多缺陷样本,而是先利用大量正常样本,把注塑件表面的“正常规律”学出来。
这对制造现场特别重要。因为工厂里最容易拿到的数据,从来不是缺陷,而是正常运行状态下的大量合格品图像。
1. 它更适合“缺陷少、正常件多”的现实
MAE 的核心逻辑,是把图像切成很多块,遮掉一部分,再让模型去重建。这个过程本质上是在逼模型学习表面的结构、纹理、空间关系和整体分布规律。
放到注塑件表面检测里,就是让模型慢慢学会正常表面亮度怎么分布、纹理怎么延续、边缘区域通常长什么样、进胶口附近正常会有什么特征、不同批次下,哪些波动仍然属于正常,这比直接拿少量缺陷去做分类,更接近工厂真正的需求。
2. 它更容易应对批次色差
你这次提到一个特别关键的问题:每个批次存在色差。
这在注塑件里非常常见,也是视觉系统误判最多的来源之一。很多系统不是识别不了缺陷,而是把“正常色差”也当成了异常。如果模型只见过单一批次、单一色值分布,它一定会对新批次不稳。但如果通过自监督预训练,让模型在多个批次的正常样本中学习共性,它就更有可能学到稳定的表面表征,而不是死记某一批的颜色。
换句话说:
我们真正想让模型学会的,不是某一批次长什么样,而是“跨批次仍然成立的正常规律”。
3. 它更适合做异常检测,而不是缺陷穷举
缩水、流痕、划痕、发黑、油污、凹凸点,这些问题的共同点不是“属于同一类别”,而是它们都偏离了正常表面状态。
这就意味着,现场更需要的并不是一个把所有缺陷都提前穷举清楚的系统,而是一个能识别“哪里不像正常件”的系统。
这也是 MAE + 异常检测思路的优势,不需要把所有缺陷类别提前定义完整,不依赖每类缺陷都有足够标注样本,可以从“偏离正常”的角度统一发现问题,后续还能输出热力图,帮助现场复判。
这一点对于工厂很关键,因为真正能落地的系统,往往不是“分类最细”的系统,而是“最能适应变化”的系统。
四、如果把这套方法放到注塑现场,真正要解决的核心问题是什么?
从研究上看,课题我称他为:
基于 MAE 自监督预训练的注塑件表面无监督缺陷检测与定位
但从现场角度看,它真正要解决的是三件事。
1. 先把“正常”学准
这是整个系统的前提。如果模型连正常表面在不同批次、不同光照、不同工况下的大致变化边界都没有学准,那后面所有异常检测都会不稳定。
所以这类方法的第一步,不是急着找缺陷,而是尽可能多地采正常件,而且要覆盖不同批次、不同班次、不同时间段、不同工艺波动、不同现场光照条件,说白了,就是要让模型理解:正常,本身也不是单一的。
2. 再去找“偏离正常”的区域
当模型有了对正常表面的基本理解之后,后面就可以通过特征距离、局部重建误差或者异常热力图的方式,去发现那些明显偏离正常模式的区域。
这时候,缩水、流痕、划痕、发黑、油污这些问题,虽然外观形式不同,但都可能在特征空间里表现为异常点。
这条思路最大的好处,是统一。不是每个缺陷单独做一个模型,而是用一个异常检测框架去覆盖多类问题。
3. 最后一定要回到“能不能现场用”
工业AI项目最容易走偏的地方,就是前面算法讲得很漂亮,最后现场根本跑不起来。
所以我要特别强调的是:工业视觉的稳定性,不只取决于算法,也取决于图像是怎么被采出来的。
也就是说,模型之外,工程条件必须一起改,比如:补光要固定,不能班次一换亮度就漂,拍摄位置要稳定,不能因为振动导致图像模糊,背景要尽量简化,减少杂散反光,触发节拍要和设备同步,避免人员走动带来随机遮挡,样本要持续更新,不能一次训练后长期不维护,很多时候,不是算法不行,而是工程条件没打牢。
五、我认为他的价值,不只是“做出一个模型”,而是给注塑行业提供一条更现实的路
我觉得制造业里很多研究如果只停留在“模型提升了几个点”,意义其实有限。真正有价值的,是它有没有回应现场的真实约束。
我认为它之所以值得做,不是因为 MAE 这个词有多新,而是因为它更接近注塑车间的缺陷样本少、正常样本多、批次色差大、现场干扰多、工艺波动频繁、企业又希望成本别太高、上线别太慢,如果这套方法能真正跑通,我认为它带来的价值至少有三层。
第一,降低对人工标注的依赖
很多中小工厂不是不想做视觉,而是没有能力长期做高质量缺陷标注。如果系统主要依赖正常样本训练,那前期数据准备成本会明显下降。
第二,提升对复杂外观异常的统一处理能力
缩水、流痕、划痕、发黑、油污这些问题,过去常常要靠多个规则、多种模型去拼。而无监督异常检测更有机会从“偏离正常”的角度统一处理。
第三,更适合做持续迭代
真正能在工厂长期运行的系统,一定不是一次性训练完就结束的。它需要不断吸收新批次、新工况下的正常样本,持续修正“正常边界”。这一点,自监督 + 异常检测的路线,比纯监督分类更有持续优化空间。
六、从制造一线往回看,真正值得关注的不是“模型多先进”,而是“它是不是更懂工厂”
我一直反复讲的事情,工业AI真正难的,不是把论文里的模型搬到工厂,而是让模型理解工厂里的“正常”和“异常”到底是怎么回事。
注塑件表面检测就是一个特别典型的例子。在实验室里,缺陷是图像上的差异;在工厂里,缺陷却往往夹杂着批次色差、工艺漂移、光线波动、人员干扰和环境变化。所以这个问题的本质,从来都不是单纯的图像分类问题,而是一个带有明显制造业特征的异常识别问题。
也正因为这样,基于 MAE 自监督预训练的无监督缺陷检测与定位,我认为是一个很值得深入的方向。它不一定意味着“一上来就比所有监督方法都更准”,但它确实更符合工厂“数据现实”和“落地现实”。对于注塑行业来说,未来更值得持续推进的,可能不是不断去堆更多缺陷标签,而是如何更高质量地沉淀正常样本、如何让模型更稳地适应批次色差、如何把异常检测结果和工艺参数追溯结合起来、如何让系统不仅会报异常,还能逐步帮助现场分析异常来源,这才是工业AI研究真正该走的方向。
结尾
把这件事说得再直白一点就是:注塑件表面检测最难的,不是识别“坏”,而是先理解什么才叫“正常”。而 MAE 自监督预训练的价值,恰恰就在这里。它不是先逼着企业去准备大量缺陷数据,而是先从工厂最容易获得的大量正常样本出发,去建立对注塑件表面本征规律的理解,再在此基础上识别异常、定位异常。
这条路,未必是最热闹的路,但很可能是更适合制造现场的一条路。
夜雨聆风