最近感觉任何行业都在谈AI,制造业也不例外。AI质检、AI排产、设备AI预测性维护......,也有人开始接入大模型做知识助手、工艺助手、售后助手等等。
但真正落地以后,使用过程中会发现一个现实问题,AI经常出错,但不是 AI不够聪明,而是企业底层的数据问题。
比如你问 AI“这个产品的标准 BOM 是什么?”结果 企业原有的BOM数据都有很多个版本,ERP一套、MES一套、PLM一套,甚至车间Excel还有一套。
你问“这个客户历史投诉最多的问题是什么?”数据分散在售后系统、CRM、微信群、邮件、纸质记录。
最后发现,应用AI需要解决的不是智能的问题,首先得解决的是数据有没有,AI能不能看懂的问题。
所以,制造业真正的AI基础设施,并不只是GPU、算力、大模型,更重要的时是数据体系。更准确地说,是主数据管理能力(MDM,Master Data Management)。
旋转手机横屏查看图片

一、什么是制造业主数据?
很多企业一提数据,第一反应是设备数据、传感器数据、生产数据。但这些其实更多是运行数据。真正决定企业数据体系能不能统一的是主数据。
什么叫主数据?
一句话,企业里那些“跨系统、跨部门、长期稳定、反复使用”的核心基础数据。比如以下这些:
1、物料主数据
这是制造业最核心的数据之一。
包括物料编码、规格型号、单位、材质、分类、替代关系、生命周期、供应商关系。很多企业AI项目失败,第一个原因就是同一个零件,五个系统五种名字。
比如,ERP叫M8螺丝、MES叫螺钉M8、仓储系统叫8MM Screw、采购系统叫标准件001、车间叫小黑螺丝。AI根本不知道它们是同一个东西。
2、BOM主数据
BOM不只是物料清单。它实际上是制造业的数据骨架。
包括设计BOM、制造BOM、工艺BOM、替代料关系、工艺路线、工序关联。未来AI做自动工艺规划、智能排产、质量追溯、成本分析,归根到底依赖的都是底层BOM数据 的完整性。
3、设备主数据
我见过一些企业,设备管理混乱到什么程度?同一台设备,MES一个名字、数据采集与监控系统一个名字、PLC一个名字、点检系统一个名字。结果就是设备明明在不停地产生数据,但这些数据彼此之间根本无法关联。
生产数据连不上报警数据,报警数据连不上维修记录,维修记录又连不上质量问题。最后企业积累了大量数据,却无法真正形成设备画像。这也是为什么很多企业一做 AI 预测性维护,就发现项目推进不下去
因为AI首先要解决的,不是“预测”,而是“知道这些数据到底是不是来自同一台设备”。
所以,设备主数据的核心,本质上是在建立统一设备语义。至少应该包括设备编码、设备型号、资产编号、产线 / 工位位置、PLC地址与IP、通讯协议、点位定义、运行参数、保养周期、维修历史、故障记录、备件信息。
只有这些基础信息被统一之后,企业才能真正把设备、生产、工艺、质量、维修、能耗等数据串联起来。
未来无论是预测性维护、设备健康分析,还是AI自动诊断,其底层依赖的更多的是统一、完整、可关联的设备主数据。
4、工艺主数据
这是很多工厂最容易忽视,但未来最值钱的数据。包括,SOP、参数标准、工艺路线、工艺窗口、良率标准、缺陷定义、工艺经验。未来的大模型工艺助手,本质上吃的就是这些数据。因为真正的制造 know-how,很多不在系统里,而在老师傅脑子里。因此企业也需要推动,将老师傅脑子里的经验数据化,未来好被AI调用。
5、质量主数据
包括缺陷分类、检验标准、SPC规则、测量规范、NG原因库、质量知识库。很多AI质检没法应用,问题可能在企业连“什么叫缺陷”都没有统一标准。
6、供应链与客户主数据
包括供应商、客户、仓库、物流、区域、渠道、价格体系。未来AI做,供应链风险预测、需求预测、智能采购,都离不开这些基础数据。
了解了基本的概念,接下来企业面对的就是这些数据怎么获取?
二、制造业的数据,到底怎么获取?
很多人觉得数据治理,就是买软件。其实制造业的数据问题,本质是数据来源碎片化。主要有三类:设备数据、系统数据、人工数据。
1、系统数据
主要来自ERP、MES、WMS、PLM、CRM、APS、QMS、EAM等,但有可能这些系统不是一起建设的。很多企业甚至10年里换了4套 ERP。结果就是数据标准完全不同。
2、设备数据
来自PLC、CNC、机器人、工业相机、传感器、IoT网关,可能数据都有,但真正的难点是协议不统一。
你会看到Modbus、OPC UA、MQTT、Profinet、EtherCAT等常用协议全都混在一起。所以工业AI前面,往往还有一层工业数据中台。
3、人工数据
这是最容易被忽视的。大量关键数据其实在Excel、Word、微信、邮件、PDF、纸质记录、点检表、维修记录,应用AI这些数据也很重要。同时AI也可以帮助处理这些数据,未来AI很重要的一件事,就是把这些非结构化经验数据结构化。
三、制造业主数据管理,到底在管什么?
很多人以为 主数据管理是IT部门的事情。其实它本质上是企业运营规则的数字化,核心包括六件事。
1、统一编码体系
没有统一编码,就没有统一数据。
包括物料编码、设备编码、工单编码、缺陷编码、客户编码,未来AI的本质是“语义理解”。编码不统一,AI就无法建立关联。
2、统一数据标准
包括、字段定义、命名规范、单位规范、时间格式、数据精度、分类体系
例如长度单位用mm还是cm、温度单位到底是 ℃ 还是 ℉,这些都会影响 AI分析。
3、数据清洗
很多制造企业的数据问题非常典型缺失值、重复值、错误值、异常值、手工录入错误,AI并不会自动修复脏数据。垃圾进,垃圾出。
4、数据关联
真正有价值的数据,是跨系统关联。
例如:订单 → BOM → 工艺 → 设备 → 质量 → 售后,一旦打通,企业就能真正形成制造业数据链路。
5、数据权限与治理
未来AI越深入企业,这件事越重要。
包括谁能看、谁能改、谁负责、哪个版本有效、数据如何追溯,这些可以持续的提升AI给出结论的准确度,可信度。
6、知识沉淀
这是未来最关键的一层。制造业未来最值钱的资产,可能是工业知识库。
包括工艺经验、缺陷案例、维修经验、排产策略、调机经验、客诉案例,未来的大模型,本质上就是企业知识的放大器。
四、为什么说:主数据能力,是制造业AI的地基?
很多企业现在想直接上AI。但底层数据还是孤立在各个系统、不统一。这就像想建摩天大楼,但地基还是泥土。AI越高级,对数据要求越高。过去信息化时代数据“能记录”就行。
未来AI时代数据必须可理解、可关联、可追溯、可训练、可推理所以未来制造业的竞争壁垒,可能是AI可用数据资产。
未来企业数据的趋势可能是“AI + 半结构化 + 语义化”,传统时代企业希望把所有东西都变成表格。但现实是制造业大量知识天然不适合完全结构化,并且成本极高。这也是AI时代和传统ERP时代的区别,数据核心一个是非结构化的知识一个是结构化的数据库。未来制造业真正的数据体系,会变成“两层”,第一层结构化主数据(稳定骨架),第二层非结构化知识层(AI大脑)。
五、未来制造业的数据能力,会演化成什么?
未来制造业的数据体系,大概率会形成五层。
第一层:数据采集层
主要负责设备采集,系统接入,IoT,OPC UA,边缘计算
第二层:数据治理层
主要负责清洗、标准化、去重、主数据管理、数据质量管理
第三层:数据资产层
形成数据仓库、数据湖、工业知识库、向量数据库,这是未来AI的“燃料仓库”。
第四层:AI能力层
包括机器学习、预测分析、大模型、AI Agent、工业视觉、数字孪生。
第五层:业务应用层
最终落地AI质检、AI排产、AI工艺优化、AI预测维护、AI供应链、AI知识助手。
很多制造企业现在最大的误区是以为AI是一次软件升级。但实际上AI更像一次“数据文明升级”。谁的数据更完整,谁的数据更标准,谁的数据更可沉淀。谁就更容易训练出真正懂制造的AI。
制造业AI的第一步,不是模型。而是主数据。
长按识别下方二维码加入星球,即可享受以下权益:
1.需求对接,大量真实企业留言,需要智能解决方案。
2.获取最新制造业AI应用趋势,AI解决方案,建立制造业+AI的基本认知。
3.查看下载全景图系列全部高清原图。



夜雨聆风