工业AI最大的幻觉:把模型当护城河

"AI模型其实是简单的部分。"

说这话的是Monolith AI的汽车业务负责人Sam Emeny-Smith 。Monolith是聚焦 AI 在工业场景中落地的英国公司，九年里拿下Nissan、BMW、Honeywell、Vertical Aerospace等客户，2025年被美国 AI 云基础设施巨头CoreWeave收购。

在一个算法被当作护城河的时代，Monolith为什么敢坚持"简单的模型"，又为何能获得科技巨头的认可，它的护城河究竟在哪里？

数据考古：每个项目都是一次发掘

2019年，Monolith 开始与汽车公司 Nissan 合作。

Nissan 的欧洲技术中心位于英国克兰菲尔德，那里存放着公司90年来积累的测试数据。90年，几乎是一部汽车工业史的厚度。按理说，这应该是一座大型金矿。

但 Monolith 的数据科学家到了现场才发现，想直接从这座金矿上面淘金，几乎不可能。

90年的测试数据交织在一起，非常繁杂。不同年代的测试用了不同的传感器，采集频率不一样，单位也不统一。有些日志里的“异常”被当时的工程师随手标注，有些则完全没有标注。更麻烦的是那些被丢弃的“坏测试”——设备故障或操作失误留下的记录——往往藏着最有价值的信息，却散落在各个部门的硬盘里，格式各异，有些甚至躺在即将被淘汰的磁带机上。

Emeny-Smith后来回忆，他们做的第一件事不是训练模型，而是“locating, cleaning and structuring decades of test records”。

翻译成中文，就是“数据考古”。

完成“数据考古”之后，他们仅用常见的简单模型（随机森林、神经网络等），便从历史数据中学习规律、预测测试结果，从而优化测试流程。

2025 年 11 月，双方公布了部分项目成果：在试点的底盘螺栓接头项目中，AI 让螺栓紧固测试数量减少了 17%，测试周期从 6 个月缩短到 5 个月，仅这一项就节省了 1 个月时间。

这组数字背后，是 Monolith 的数据科学家和 Nissan 的工程师并肩熬过的无数日子。

比考古更难的事：让AI在工程师的电脑里活下来

数据整理完，真正的考验才刚刚开始。

工业界有个残酷的统计：绝大多数 AI 项目，都死在从 POC 到量产的路上。

要让AI活下来，工程师必须愿意每天打开它，把产品质量和性能押在上面。这不是技术问题，是信任问题。

Monolith 从两个方向建立这种信任。

第一，让工程师看得懂、对得上。平台从第一天起就是无代码的。底盘测试工程师不需要懂 Python，只要把记录历史测试数据的 Excel 拖进界面，点点鼠标，就能训练出一个预测模型。

但光能跑还不够，工程师得看懂它为什么这么预测。Monolith 的 Explainable AI 会把每个输入参数对输出的影响权重画成图表。工程师一眼就能明白：哦，对应力影响最大的是这两个参数。这和自己的工程经验或者直觉对上了。对上了，才敢信。

第二，让工程师相信这工具不会砸自己饭碗。

Nissan 的工程总监 Emma Deutsch 说得直白：不能让 AI 把工程师团队废了，因为那是他们最宝贵的资产。

Monolith 的汽车业务负责人 Emeny-Smith 打了个比方：AI 不是谷歌地图，不会一步步告诉你该往哪儿走；它更像一个指南针，指个方向，但路还得工程师自己走。目标是帮工程师把精力放到更高价值的事情上，而不是取代他们。

这两句话其实是一个意思：AI 的定位是副驾驶，不是替代者。只有工程师放下了被取代的戒心，才会真正接纳它。

但信任只是入场券。从"敢用"到"每天用"，中间还隔着一整条鸿沟。Monolith 的做法是派驻数据科学家到客户现场，和工程师一起迭代。Nissan 项目早期，模型表现并不理想，正是工程师的反馈直接指导了调整和优化。没有通用模板，因为每个车间文化、决策流程、IT 基础设施都不一样，只能一家一家地磨。

这就是为什么工业AI的交付模式，天然带着咨询公司的基因。

结构性封闭：工业AI跨不过的那道墙

如果把工业AI和当下最火的大语言模型放在一起比较，你会发现它们活在不同的世界里。

大语言模型吃的是整个互联网的数据——维基百科、Reddit、GitHub、新闻网站、书籍。全人类共用一套语言，共享差不多的知识。你训练一个通用模型，可以服务地球上的每一个人，这是消费级AI的魔法。

工业AI没有这种魔法。

美国汽车研究委员会（USCAR）在一份技术规范里，把制造业数据的障碍列了八条：烟囱式的架构、厂商锁定、专有封闭协议、缺乏应用可移植性、跨OEM的数据所有权模糊……

八条障碍，其实说的是一件事：“封闭”。

封闭到底造成了什么？

A厂和B厂的数据不通用。哪怕都是造车的主机厂，测试流程不一样，数据格式不一样，就连什么叫"正常"、什么叫"故障"，两边的定义都可能不同。设备供应商用专有协议把原始数据捂在手里，公司内部各种各样的系统各说各话，几十年的老系统一层叠一层，数据就像埋在不同深度的地层里，想挖出来打通，难如登天。

所以你不可能像OpenAI做ChatGPT那样，把所有的工业数据一股脑灌进去，炼出一个通用模型。每接一家客户，都是一次从零开始的数据考古；每做一个项目，都要重新教AI读懂这家厂的领域知识。

这不是技术问题，这是结构问题。

尾声：护城河不在模型

“AI 模型其实是最简单的部分”

Sam Emeny-Smith顿了顿，补了后半句：“真正的难点在于准备和整理正确的数据、嵌入领域专家知识、以及将数学模型转化为工程师日常愿意信任并使用的决策工具。”

CoreWeave收购Monolith的时候，没有披露价格。但这笔交易本身，已经说明了工业AI的估值重心在哪里。Monolith 没有发表过原创的模型架构论文，它用的都是教科书上的常规方法。CoreWeave买的也不是某个突破性的算法专利，而是Monolith磨出来的落地能力——让AI穿过企业围墙，在工程师桌面上活下来。

这种能力由三部分组成：数据工程 — 把混乱的遗留数据变成可训练的燃料；建立信任 — 让工程师敢用、愿意用；还有工作流集成 — 无缝接入现有的IT基础设施和业务流程。

三者合一，才是工业AI真正的护城河。

【往期推荐】