AI质检-为什么注塑件表面检测这么难?

基于 MAE 自监督预训练的无监督缺陷检测，可能比你想的更适合制造现场

在制造业做了二十多年设备、工艺和现场管理，我对一个问题体会特别深：很多人以为注塑件表面检测只是“装个相机、跑个算法”的事，真正到了现场才知道，这件事远没有那么简单。

因为注塑件表面的问题，从来都不是只有一种。

有的是缩水，有的是流痕，有的是进胶口异色；有的是表面划痕，有的是局部发黑，还有的是肉眼不太好判断的凹凸点、油污残留、局部异常纹理。

更麻烦的是，这些问题还不是静态的。同一款产品，不同批次可能就有色差；同一副模具，不同时间段打出来的件，表面纹理和亮度也会变化。

也就是说，现场真正难的，从来不是“缺陷长什么样”，而是：

在批次色差、工艺波动、光线变化、人员走动、环境干扰都存在的情况下，系统怎么分清楚——到底什么是正常波动，什么才是真正的异常。

这也是为什么我越来越觉得：对于注塑件表面检测这类场景，基于 MAE 自监督预训练的无监督缺陷检测方法，可能比传统监督学习更适合现场。

今天这篇，我就从一个长期在制造业一线做设备和工业AI落地的角度，来拆清楚这件事。

一、注塑件表面检测，为什么在工厂里总是“看起来简单，做起来很难”？

很多人第一次接触这个问题时，都会有一个判断：不就是把缺陷拍下来，然后训练模型去识别吗？

这句话在实验室里没有错，但放到工厂里，经常就不成立了。

因为注塑件表面缺陷和很多标准视觉任务不一样，它的难点主要有三层。

1. 缺陷类型多，而且边界并不总是清楚

像缩水、流痕、进胶口异色、发黑、划痕、凹凸点、油污，这些缺陷在外观上差异很大。有些是颜色问题，有些是纹理问题，有些是形貌问题，还有些是污染问题。

更现实的是，很多缺陷并不是“非黑即白”的。有些轻微流痕，到底算不算异常，要看客户标准；有些批次色差，工程师知道是正常波动，但模型不一定知道；有些油污和反光叠在一起，连人都得多看两眼，更别说算法。

所以这件事不是简单的“分类”，而是一个典型的复杂外观异常识别问题。

2. 你最缺的不是正常图，而是缺陷图

这一点做过产线视觉的人都懂。正常件很多，随便一采就是几百张、几千张；真正高质量、能拿来训练的缺陷图，反而最少。

原因在于缺陷本身比例不高、缺陷出现时，现场第一反应是先处理，不是先留数据、很多缺陷要靠有经验的人判断和标注、同样是“发黑”或“异色”，不同产品的判定逻辑也不完全一样。

结果就是，传统监督学习最依赖的东西——大量带标签缺陷数据——恰恰是现场最难长期稳定拿到的。

3. 工厂不是实验室，现场变化会不断干扰模型

这一点尤其重要。我前面提到的这些现场问题，其实就是工业AI落地最常见的“隐性变量”，不同时间段光线不一样、人员走动会带来阴影和遮挡变化、设备振动可能影响拍摄稳定性、现场油污、粉尘、反光会扰乱成像、环境节奏不稳定，也会影响采图一致性。

很多模型在实验室里为什么看起来很好？因为实验室的数据条件太干净、太稳定了。

可工厂现场不是这样。现场更像是在不断变化的背景下，去判断一个原本就不稳定的表面对象。所以注塑件表面检测真正难的，不是“模型会不会识别”，而是模型能不能在复杂现场下，稳定地学会什么是正常，什么是不正常。

二、为什么传统监督学习在这个场景下，经常越做越重、越做越难维护？

过去很多工厂上视觉项目，默认思路都是监督学习。说白了就是先采图、再标注、再训练，然后把缩水、流痕、划痕、发黑这些类别都喂给模型。

这条路理论上没问题，但在注塑现场有几个明显短板。

第一，缺陷样本永远跟不上现场变化

你今天采到的是这一批次的异常，明天材料换了、模温变了、颜色漂了，新的问题又来了。如果每来一种变化，就重新补数据、重新标注、重新训练，那这套系统会越来越重，维护成本也越来越高。

第二，模型很容易学偏

这是很多现场项目的共性问题。模型本来应该学“缺陷特征”，结果最后学进去的，可能是某一批次的颜色分布、某一类光照条件、某个固定角度的反光特征、某种背景位置关系，也就是说，它学到的不一定是“缺陷本身”，而是“某个特定场景下看起来像缺陷的东西”。

所以很多项目上线初期精度不错，但一过几周，误检率就开始上来。不是模型坏了，而是它原来学得就不够稳。

第三，监督学习最怕“多品种 + 多波动 + 小样本”

注塑现场最典型的特征就是产品多、批次多、波动多、缺陷少、标注贵，而这几件事，几乎都和传统监督学习的最佳条件相反。所以我越来越觉得，在这类场景里，问题不能再简单理解成“怎么多收集一点缺陷样本”，而应该换个角度：

既然缺陷样本天然少，那能不能先不学“缺陷”，而是先学“正常”？

这就是无监督异常检测真正有意义的地方。

三、为什么我会更看好 MAE 自监督预训练这条路线？

如果用一句话来概括，MAE 这类方法的价值就在于：

它不要求你先准备很多缺陷样本，而是先利用大量正常样本，把注塑件表面的“正常规律”学出来。

这对制造现场特别重要。因为工厂里最容易拿到的数据，从来不是缺陷，而是正常运行状态下的大量合格品图像。

1. 它更适合“缺陷少、正常件多”的现实

MAE 的核心逻辑，是把图像切成很多块，遮掉一部分，再让模型去重建。这个过程本质上是在逼模型学习表面的结构、纹理、空间关系和整体分布规律。

放到注塑件表面检测里，就是让模型慢慢学会正常表面亮度怎么分布、纹理怎么延续、边缘区域通常长什么样、进胶口附近正常会有什么特征、不同批次下，哪些波动仍然属于正常，这比直接拿少量缺陷去做分类，更接近工厂真正的需求。

2. 它更容易应对批次色差

你这次提到一个特别关键的问题：每个批次存在色差。

这在注塑件里非常常见，也是视觉系统误判最多的来源之一。很多系统不是识别不了缺陷，而是把“正常色差”也当成了异常。如果模型只见过单一批次、单一色值分布，它一定会对新批次不稳。但如果通过自监督预训练，让模型在多个批次的正常样本中学习共性，它就更有可能学到稳定的表面表征，而不是死记某一批的颜色。

换句话说：

我们真正想让模型学会的，不是某一批次长什么样，而是“跨批次仍然成立的正常规律”。

3. 它更适合做异常检测，而不是缺陷穷举

缩水、流痕、划痕、发黑、油污、凹凸点，这些问题的共同点不是“属于同一类别”，而是它们都偏离了正常表面状态。

这就意味着，现场更需要的并不是一个把所有缺陷都提前穷举清楚的系统，而是一个能识别“哪里不像正常件”的系统。

这也是 MAE + 异常检测思路的优势，不需要把所有缺陷类别提前定义完整，不依赖每类缺陷都有足够标注样本，可以从“偏离正常”的角度统一发现问题，后续还能输出热力图，帮助现场复判。

这一点对于工厂很关键，因为真正能落地的系统，往往不是“分类最细”的系统，而是“最能适应变化”的系统。

四、如果把这套方法放到注塑现场，真正要解决的核心问题是什么？

从研究上看，课题我称他为：

基于 MAE 自监督预训练的注塑件表面无监督缺陷检测与定位

但从现场角度看，它真正要解决的是三件事。

1. 先把“正常”学准

这是整个系统的前提。如果模型连正常表面在不同批次、不同光照、不同工况下的大致变化边界都没有学准，那后面所有异常检测都会不稳定。

所以这类方法的第一步，不是急着找缺陷，而是尽可能多地采正常件，而且要覆盖不同批次、不同班次、不同时间段、不同工艺波动、不同现场光照条件，说白了，就是要让模型理解：正常，本身也不是单一的。

2. 再去找“偏离正常”的区域

当模型有了对正常表面的基本理解之后，后面就可以通过特征距离、局部重建误差或者异常热力图的方式，去发现那些明显偏离正常模式的区域。

这时候，缩水、流痕、划痕、发黑、油污这些问题，虽然外观形式不同，但都可能在特征空间里表现为异常点。

这条思路最大的好处，是统一。不是每个缺陷单独做一个模型，而是用一个异常检测框架去覆盖多类问题。

3. 最后一定要回到“能不能现场用”

工业AI项目最容易走偏的地方，就是前面算法讲得很漂亮，最后现场根本跑不起来。

所以我要特别强调的是：工业视觉的稳定性，不只取决于算法，也取决于图像是怎么被采出来的。

也就是说，模型之外，工程条件必须一起改，比如：补光要固定，不能班次一换亮度就漂，拍摄位置要稳定，不能因为振动导致图像模糊，背景要尽量简化，减少杂散反光，触发节拍要和设备同步，避免人员走动带来随机遮挡，样本要持续更新，不能一次训练后长期不维护，很多时候，不是算法不行，而是工程条件没打牢。

五、我认为他的价值，不只是“做出一个模型”，而是给注塑行业提供一条更现实的路

我觉得制造业里很多研究如果只停留在“模型提升了几个点”，意义其实有限。真正有价值的，是它有没有回应现场的真实约束。

我认为它之所以值得做，不是因为 MAE 这个词有多新，而是因为它更接近注塑车间的缺陷样本少、正常样本多、批次色差大、现场干扰多、工艺波动频繁、企业又希望成本别太高、上线别太慢，如果这套方法能真正跑通，我认为它带来的价值至少有三层。

第一，降低对人工标注的依赖

很多中小工厂不是不想做视觉，而是没有能力长期做高质量缺陷标注。如果系统主要依赖正常样本训练，那前期数据准备成本会明显下降。

第二，提升对复杂外观异常的统一处理能力

缩水、流痕、划痕、发黑、油污这些问题，过去常常要靠多个规则、多种模型去拼。而无监督异常检测更有机会从“偏离正常”的角度统一处理。

第三，更适合做持续迭代

真正能在工厂长期运行的系统，一定不是一次性训练完就结束的。它需要不断吸收新批次、新工况下的正常样本，持续修正“正常边界”。这一点，自监督 + 异常检测的路线，比纯监督分类更有持续优化空间。

六、从制造一线往回看，真正值得关注的不是“模型多先进”，而是“它是不是更懂工厂”

我一直反复讲的事情，工业AI真正难的，不是把论文里的模型搬到工厂，而是让模型理解工厂里的“正常”和“异常”到底是怎么回事。

注塑件表面检测就是一个特别典型的例子。在实验室里，缺陷是图像上的差异；在工厂里，缺陷却往往夹杂着批次色差、工艺漂移、光线波动、人员干扰和环境变化。所以这个问题的本质，从来都不是单纯的图像分类问题，而是一个带有明显制造业特征的异常识别问题。

也正因为这样，基于 MAE 自监督预训练的无监督缺陷检测与定位，我认为是一个很值得深入的方向。它不一定意味着“一上来就比所有监督方法都更准”，但它确实更符合工厂“数据现实”和“落地现实”。对于注塑行业来说，未来更值得持续推进的，可能不是不断去堆更多缺陷标签，而是如何更高质量地沉淀正常样本、如何让模型更稳地适应批次色差、如何把异常检测结果和工艺参数追溯结合起来、如何让系统不仅会报异常，还能逐步帮助现场分析异常来源，这才是工业AI研究真正该走的方向。

结尾

把这件事说得再直白一点就是：注塑件表面检测最难的，不是识别“坏”，而是先理解什么才叫“正常”。而 MAE 自监督预训练的价值，恰恰就在这里。它不是先逼着企业去准备大量缺陷数据，而是先从工厂最容易获得的大量正常样本出发，去建立对注塑件表面本征规律的理解，再在此基础上识别异常、定位异常。

这条路，未必是最热闹的路，但很可能是更适合制造现场的一条路。