"AI模型其实是简单的部分。"
说这话的是Monolith AI的汽车业务负责人Sam Emeny-Smith 。Monolith是聚焦 AI 在工业场景中落地的英国公司,九年里拿下Nissan、BMW、Honeywell、Vertical Aerospace等客户,2025年被美国 AI 云基础设施巨头CoreWeave收购。
在一个算法被当作护城河的时代,Monolith为什么敢坚持"简单的模型",又为何能获得科技巨头的认可,它的护城河究竟在哪里?

数据考古:每个项目都是一次发掘
2019年,Monolith 开始与汽车公司 Nissan 合作。
Nissan 的欧洲技术中心位于英国克兰菲尔德,那里存放着公司90年来积累的测试数据。90年,几乎是一部汽车工业史的厚度。按理说,这应该是一座大型金矿。
但 Monolith 的数据科学家到了现场才发现,想直接从这座金矿上面淘金,几乎不可能。
90年的测试数据交织在一起,非常繁杂。不同年代的测试用了不同的传感器,采集频率不一样,单位也不统一。有些日志里的“异常”被当时的工程师随手标注,有些则完全没有标注。更麻烦的是那些被丢弃的“坏测试”——设备故障或操作失误留下的记录——往往藏着最有价值的信息,却散落在各个部门的硬盘里,格式各异,有些甚至躺在即将被淘汰的磁带机上。
Emeny-Smith后来回忆,他们做的第一件事不是训练模型,而是“locating, cleaning and structuring decades of test records”。
翻译成中文,就是“数据考古”。
完成“数据考古”之后,他们仅用常见的简单模型(随机森林、神经网络等),便从历史数据中学习规律、预测测试结果,从而优化测试流程。
2025 年 11 月,双方公布了部分项目成果:在试点的底盘螺栓接头项目中,AI 让螺栓紧固测试数量减少了 17%,测试周期从 6 个月缩短到 5 个月,仅这一项就节省了 1 个月时间。
这组数字背后,是 Monolith 的数据科学家和 Nissan 的工程师并肩熬过的无数日子。
比考古更难的事:让AI在工程师的电脑里活下来
数据整理完,真正的考验才刚刚开始。
工业界有个残酷的统计:绝大多数 AI 项目,都死在从 POC 到量产的路上。
要让AI活下来,工程师必须愿意每天打开它,把产品质量和性能押在上面。这不是技术问题,是信任问题。
Monolith 从两个方向建立这种信任。
第一,让工程师看得懂、对得上。平台从第一天起就是无代码的。底盘测试工程师不需要懂 Python,只要把记录历史测试数据的 Excel 拖进界面,点点鼠标,就能训练出一个预测模型。
但光能跑还不够,工程师得看懂它为什么这么预测。Monolith 的 Explainable AI 会把每个输入参数对输出的影响权重画成图表。工程师一眼就能明白:哦,对应力影响最大的是这两个参数。这和自己的工程经验或者直觉对上了。对上了,才敢信。
第二,让工程师相信这工具不会砸自己饭碗。
Nissan 的工程总监 Emma Deutsch 说得直白:不能让 AI 把工程师团队废了,因为那是他们最宝贵的资产。
Monolith 的汽车业务负责人 Emeny-Smith 打了个比方:AI 不是谷歌地图,不会一步步告诉你该往哪儿走;它更像一个指南针,指个方向,但路还得工程师自己走。目标是帮工程师把精力放到更高价值的事情上,而不是取代他们。
这两句话其实是一个意思:AI 的定位是副驾驶,不是替代者。 只有工程师放下了被取代的戒心,才会真正接纳它。
但信任只是入场券。从"敢用"到"每天用",中间还隔着一整条鸿沟。Monolith 的做法是派驻数据科学家到客户现场,和工程师一起迭代。Nissan 项目早期,模型表现并不理想,正是工程师的反馈直接指导了调整和优化。没有通用模板,因为每个车间文化、决策流程、IT 基础设施都不一样,只能一家一家地磨。
这就是为什么工业AI的交付模式,天然带着咨询公司的基因。
结构性封闭:工业AI跨不过的那道墙
如果把工业AI和当下最火的大语言模型放在一起比较,你会发现它们活在不同的世界里。
大语言模型吃的是整个互联网的数据——维基百科、Reddit、GitHub、新闻网站、书籍。全人类共用一套语言,共享差不多的知识。你训练一个通用模型,可以服务地球上的每一个人,这是消费级AI的魔法。
工业AI没有这种魔法。
美国汽车研究委员会(USCAR)在一份技术规范里,把制造业数据的障碍列了八条:烟囱式的架构、厂商锁定、专有封闭协议、缺乏应用可移植性、跨OEM的数据所有权模糊……
八条障碍,其实说的是一件事:“封闭”。
封闭到底造成了什么?
A厂和B厂的数据不通用。哪怕都是造车的主机厂,测试流程不一样,数据格式不一样,就连什么叫"正常"、什么叫"故障",两边的定义都可能不同。设备供应商用专有协议把原始数据捂在手里,公司内部各种各样的系统各说各话,几十年的老系统一层叠一层,数据就像埋在不同深度的地层里,想挖出来打通,难如登天。
所以你不可能像OpenAI做ChatGPT那样,把所有的工业数据一股脑灌进去,炼出一个通用模型。每接一家客户,都是一次从零开始的数据考古;每做一个项目,都要重新教AI读懂这家厂的领域知识。
这不是技术问题,这是结构问题。
尾声:护城河不在模型
“AI 模型其实是最简单的部分”
Sam Emeny-Smith顿了顿,补了后半句:“真正的难点在于准备和整理正确的数据、嵌入领域专家知识、以及将数学模型转化为工程师日常愿意信任并使用的决策工具。”
CoreWeave收购Monolith的时候,没有披露价格。但这笔交易本身,已经说明了工业AI的估值重心在哪里。Monolith 没有发表过原创的模型架构论文,它用的都是教科书上的常规方法。CoreWeave买的也不是某个突破性的算法专利,而是Monolith磨出来的落地能力——让AI穿过企业围墙,在工程师桌面上活下来。
这种能力由三部分组成:数据工程 — 把混乱的遗留数据变成可训练的燃料;建立信任 — 让工程师敢用、愿意用;还有工作流集成 — 无缝接入现有的IT基础设施和业务流程。
三者合一,才是工业AI真正的护城河。
夜雨聆风