
这段时间,新工智道陆续发了好几篇AI+产业观察,一篇一篇看下来,一个越来越清晰的判断浮出水面:📌 AI进制造业,技术层面的问题其实没那么难,真正难的是"信任"。
服务商不敢承诺效果,工厂不敢押注投入,双方签完合同之后才发现——验收标准根本没法写。这不是某一家企业的个案,是全行业的通病。
这篇文章,就是把前面几篇观察里散落的判断串起来,做一次系统性的梳理。不追热点,不喊口号,只回答一个问题:当制造业的"信任账"比"技术账"更难算的时候,我们还能做点什么?

Part 1:
信任为什么崩了?
换脑,不是升级
制造业花了二十年搞信息化,把ERP、MES、PLM一套套装进工厂,以为这是在为AI打地基。但真相是:信息化和AI化,是两种不同的认知逻辑。信息化是流程固化,让人适应机器;AI化是概率适应,让机器适应人。这不是升级,是换脑。
长三角一家注塑厂上了视觉检测设备,厂方说这套系统花了八十多万,"说是AI,能代替质检员"。当被问及此前部署的MES系统与这套新系统的区别时,得到的回答是:"那个是信息化,这个是AI,不一样。"回答很笃定,但细究之下却充满不确定。这种不确定,正是全行业的症结所在。
信息化是流程固化,它把老师傅的经验拆解成SOP,写成代码,让所有人按同一个按钮、填同一个表单。它的根上的逻辑是确定性:输入A,必然输出B。人要去适应机器,因为机器不会变通。
AI化是概率适应,它从海量数据里找规律,面对同一个缺陷,今天判合格,明天可能判不合格,因为模型在持续学习。它的根上的逻辑是不确定性:输入A,输出有87.3%的概率是B。📌 机器要来适应人,因为老师傅的"手感"才是那个需要被逼近的"真值"。
一个是让人适应机器,一个是让机器适应人,这是两种不同的认知逻辑。
工具思维与学徒思维
制造业老板对信息化的采购逻辑,早已内化为一种肌肉记忆:买ERP是买一辆车,钥匙给你,培训三天,就能上路。功能清单列清楚,验收标准写明白,交付即结束。
但工业AI不是车,是学徒。你招一个质检学徒进厂,头三个月他天天犯错,你得容忍他,纠正他,给他看足够多的次品,他才能慢慢出师。上工业AI,说到底是在车间里"养"一个数字学徒,得先练三个月,甚至三年。
📌 老板的本能反应是:那这个学徒万一跑了呢?
这不是玩笑,模型是服务商的,数据是工厂的,训练出来的"手艺"到底归谁?服务商撤场后,模型还能不能用?这些问题在合同里往往语焉不详。据行业多方反馈和司法案例观察,交付验收标准缺失已成为工业配套项目纠纷的常见因素——但这里的"缺失",不是"忘了写",而是"根本不知道怎么写"。
概念模糊,是行业AI落地乱象的第一层原因。把换脑当成了升级,把学徒当成了工具,地基的认知错了,上面盖什么都歪。
翻译层的断裂
那么,为什么老师傅的经验进不了AI系统?因为中间缺了一个人。
在信息化与AI化之间,横亘着一个巨大的断层:谁来把老师傅的"手感"翻译成数据,再把算法的输出翻译回产线可执行的指令?
这个断层可称为"翻译层",翻译层不是简单的数据标注,而是一种跨语种的沟通能力。它既要懂老师傅为什么"看一眼就知道这批次品",又要懂算法工程师说的"特征向量降维"是什么意思,还要能把两者对接成一条产线能听懂的语言。
目前,行业内正在出现一些零星的"混编团队":退休的老师傅、工控极客、懂制造业的AI驯化师。他们像早期的翻译官一样,在两种文明之间艰难地传递信息。但这只是雏形,远未成制度,更未成产业。
没有翻译层,AI进车间就是聋子对话哑巴。算法听不懂机器,老师傅看不懂屏幕,项目验收时只能互相瞪眼。
翻译断层是认知断层的延伸,认知错了,就不知道需要翻译;翻译缺了,认知就永远停留在纸面上。两者叠加,构成了AI进车间的第二道门槛。
制度真空的三层归因
如果认知误区和翻译断层是看得见的问题,那接下来这个问题更隐蔽,也更致命。
打开任何一份地方智造规划,几乎都能看到同一套表述:"打造XX个AI应用场景,覆盖视觉检测、预测性维护、智能排产等领域"。数字很漂亮,动辄上百个场景。但问题是:场景堆得出智能工厂吗?
答案是不能,就像器官堆不出生命体。反过来看,有生命力的系统,器官是在生长中自然分化的,不是先造好再组装的。
这就是"制度真空"的代价:📌 没有数据自流、接口互通的底层架构,生长就无从发生。
AI应用场景是单点工具,视觉检测只管拍照判次品,预测性维护只管算设备寿命,智能排产只管排订单顺序。它们是手、脚、眼,各自功能明确,但彼此不连通。一个工厂的视觉检测系统判了某批次品,这条信息能不能自动流入排产系统,让下一单补料?能不能流入维护系统,让相关设备优先检修?在大多数工厂里,不能。因为每个场景都是独立采购、独立实施、独立验收的,数据在各自的烟囱里,接口从未打通。
智能工厂是系统,它的核心不是有多少器官,而是有没有血液循环——也就是数据自流、接口互通的基础架构。没有这个架构,一百个场景只是一百个孤岛,老板得养一百个供应商,应付一百套验收标准,承受一百次扯皮风险。
许多地方规划将宏大的场景数量作为目标,但其根上的逻辑仍是"器官的陈列",而非"血液循环"的设计。这不是批评,是观察。因为设计血液循环,需要的不只是技术,更是一套跨企业、跨部门的接口标准和数据契约——而这恰恰是当前最缺的东西。
这里不用"制度滞后"这个词,滞后意味着已经在路上,只是没赶上。但现状是:现有法律体系根本没为工业AI这个"会自主学习的非人决策主体"设计过接口。这不是滞后,是真空。
这个真空有三层归因。
第一层:认知惯性。
甲方用管ERP的"功能清单"思维去管AI的"效果能力",乙方投其所好,合同里写满"实现XX功能",却不敢写"缺陷检出率提升至XX%",因为后者意味着可量化的对赌。双方心照不宣地回避了最难的问题:AI的效果怎么验收?
第二层:风险无人认领。
在外贸合规压力下,AI漏检可能导致整柜退货、品牌罚单。但服务商的合同条款里往往藏着一句"系统建议,人工复核",把风险全甩给工厂。甲方不是不知道,是没办法——不用AI,人工质检也漏检;用AI,至少能省几个人工。甲乙双方因此形成一种"沉默共谋":谁都不提效果验收,提了就是捅破窗户纸,对谁都没好处。
据行业多方反馈和司法案例观察,此类因验收标准不清导致的纠纷呈上升趋势,在传统系统集成和AI项目中均有发生。这暴露了一个残酷现实:📌 在AI项目中,"验收"不仅是技术环节,更是法律陷阱。甲方以为签字只是走流程,乙方知道签字是风险切割。信息不对称下,甲方往往是吃亏的一方。
第三层:利益的无声博弈。
标准意味着透明,一旦制定AI项目的验收标准,服务商就得打开"黑盒",把算法逻辑、训练数据、边界条件摊在桌上。利润空间随之透明化,议价能力随之削弱。头部服务商缺乏动力推动标准化,中小甲方缺乏话语权要求标准化。这不是"忘了定",是"有人不想定"。
此类纠纷在传统智能制造系统集成(含MES/信息化模块)中同样频发,虽非纯AI算法项目,但交付验收争议的逻辑与AI场景相通。
硬件、模型、场景目标亮眼,但配套规则出现集体缺位。"制度真空"比认知误区更隐蔽,也更难破解。因为它不是无知,是博弈。
Part 2:
信任怎么重建?
赛博工人:翻译层的人肉补丁
在讨论制度之前,得先把"人"的问题说清楚。
本文将这种人称为"赛博工人":既懂老师傅的"手感",又懂算法的"特征向量"的跨语种沟通者。他们是翻译层的人肉补丁,是AI进车间最稀缺的中间物种。
目前,这个群体还处于野生状态。退休的老师傅、工控极客、懂制造业的AI驯化师,偶尔在项目中碰头,组成临时混编团队。但这不是制度,是偶然。要让"赛博工人"从野生走向驯化,需要两条路径:📌 一是企业内部培养,让老技工带新工程师,在真实项目中传帮带;二是行业层面建立认证体系,让这种跨语种能力获得可识别的职业标签。
没有赛博工人,再好的算法也落不了地,因为他们是唯一能回答"这个误判算不算正常"的人。
灰度期:给AI一个合法犯错的机会
说到验收,必须先回答一个前提问题:AI能不能被允许犯错?
在工业场景中,答案是:能,但要有条件。
本文将"灰度期"定义为:合同约定的AI学习期,此间非恶意误判不作为违约,但服务商须每周出具偏差分析报告。这个条款的法律意义在于:把"试错"从违约风险转化为合同义务,让甲方有知情权,让乙方有改进压力。
没有灰度期,AI项目从一开始就是一场零和博弈。乙方怕犯错不敢接,甲方怕赔钱不敢用。灰度期的本质,是给双方一个共同学习的缓冲带。
责任上限:对赌不是无限追责
约定服务商的赔偿责任上限(如合同金额的150%),或引入第三方保险机制。不能无限追责。工业AI的决策边界本就模糊,如果把所有漏检风险都压在服务商头上,要么没人敢接项目,要么服务商把价格抬到甲方买不起。没有一个健康的风险共担机制,对赌就是空谈。
这两个条款的目的不是偏袒任何一方,而是把"效果验收"从模糊的良心账,变成清晰的法律账。
人机共评:把老师傅请回裁判席
光有协议不够,还需要裁判。
本文将"人机共评"定义为:将资深技术工人的判定权纳入AI项目验收标准,作为算法无法替代的最终裁决。具体做法是,在验收样本中随机抽取一定比例,由老师傅盲测,与AI结果比对。差异率超过约定阈值,项目不通过。
当人机判定出现冲突时,应以独立第三方(如行业协会指定的检测机构或具有CMA/CNAS资质的第三方实验室)的复检结果为最终裁定依据。老师傅的判定权保证了宝贵经验的传承,是验收的起点;而第三方复检则确保了裁定的公平性与可复现性,是验收的终点。 该机制的有效性前提,是合同已明确约定第三方复检的启动条件、检测标准和裁定效力。
这不仅是为AI验收找一个裁判,📌 更是为那些即将消失的老师傅找到一个在数字时代不可替代的位置。他们的"手感"是机器要去适应的那个"人",他们的经验是算法训练最珍贵的标注数据。把他们排除在验收体系之外,等于把产业记忆排除在数字化进程之外。
对赌协议框架:四个支点
综合以上,一份工业AI"效果契约"至少应包含四个支点:
量化效果:不写"实现XX功能",写"缺陷检出率提升至XX%";
灰度期:给AI合法犯错的学习期,服务商每周出偏差报告;
责任上限:约定赔偿上限或引入保险,不能无限追责;
人机共评:老师傅盲测纳入验收,差异率超阈值不通过;冲突时以第三方复检为最终裁定。
这四个支点,把"效果验收"从模糊的良心账,变成清晰的法律账。
Part 3:
谁已经在做了?
一份车间里的"效果契约"
据行业调研信息,华南一家精密制造企业在引入AI质检系统时,与服务商签署了一份不同寻常的协议。
该企业负责人的核心顾虑很直接:"我花了钱,怎么知道你这东西真的有用?"他的解决方案也很简单:把效果写进合同。
协议约定了三个关键条款:
📌 第一,效果量化
不签"实现智能质检"这种模糊表述,而是明确"缺陷检出率从当前人工水平的X%提升至Y%"。数字是硬指标,没有商量余地。
📌 第二,灰度期
合同约定了三个月的学习期,此间非恶意误判不视为违约,但服务商必须每周提交偏差分析报告,说明误判类型、原因和改进路径。这给了AI一个合法犯错的机会,也给了双方一个共同学习的缓冲带。
📌 第三,人机共评
验收样本中随机抽取一定比例,由资深质检老师傅盲测,与AI结果比对。差异率超过约定阈值,项目不通过,老师傅的"手感"被重新请回了裁判席。
该企业负责人敢于签这份协议,根子上不是信任,而是不信任——📌 不信任口头承诺,不信任模糊验收,只信任写进合同里的数字。效果可量化、过程可追溯、责任可界定,这三条不是道德要求,是法律底线。服务商也接受了这套框架,因为清晰的规则反而降低了沟通成本和信任损耗。
这个案例的价值不在于技术多先进,而在于证明了一件事:在真实车间里,"效果契约"的模式是跑得通的。它不依赖政府的强制标准,不依赖行业协会的权威背书,只依赖甲乙双方对"效果"的共同定义和对"过程"的共同监督。
聆晰科技:"不增效不收费"
国内已有企业在跑通按效付费模式,据企业公开披露及多家科技媒体报道,聆晰科技推出"不增效不收费"的商业模式,聚焦3C、汽车零部件、新能源行业,把收费节点与可量化的效率提升挂钩。企业无需前期大额投入,仅按实际降本或增益部分计费。
这个模式的核心不是技术多先进,而是"信任前置"。乙方先承担风险,甲方看到效果再付费。这本质上是一种对赌:乙方赌自己的算法真有用,甲方赌自己的产线真能被改造。双方的风险敞口被重新分配,从"甲方全押"变成"乙方先垫"。
但按效付费的前提是"效"可定义、可测量、可争议。这就需要对赌协议的标准化。否则,"增效"怎么算?算人工成本还是算良品率?算单月还是算季度?没有清晰的计量规则,按效付费也会变成新的扯皮战场。
Crescendo:结果导向定价的国际样本
据海外科技媒体公开报道,AI客服创企Crescendo采用结果导向定价,摒弃传统按人数或时长计费模式。其质量评估工具可实时评分每笔交互效率,若评分低则向企业返还信用额度。这种"对效果负责"的定价逻辑,与工业AI的按效付费在根上是同一棵树。
国际样本的价值不在于照搬,而在于证明:📌 按效付费不是乌托邦,是已经跑通的商业模式。问题在于,工业场景比客服场景复杂得多——客服的"解决率"好定义,工厂的"良品率提升"牵涉因素太多。工业AI的按效付费,需要更精细的计量基础设施。
Part 4:
下一步怎么做?
对赌协议作为公共品
面对制度真空,最本能的反应是呼吁政府"赶紧定标准",但对此应持保留意见。
工业AI的标准化,不能由政府单方面"颁布",而应由行业在碰撞中"生长"。因为场景太分散,技术迭代太快,政府文件永远追不上车间里的变化。更何况,标准一旦行政化,容易变成新的门槛,把中小企业挡在外面。
核心建议是:📌 与其把"对赌协议"变成申请补贴的前置条件,不如把它变成一个公共品——不强制、不收费、不评奖,只为中小企业和服务商提供法律风险清晰的合同模板。
在初期,可由具有产业公信力的第三方机构(如国家级行业协会、工信部下属院等)牵头制定基础模板,确保其"公共品"属性。在模板成熟并获得市场认可后,鼓励律所、咨询公司将其迭代为专业的法律服务产品,以市场化机制推动其持续优化与普及。新工智道的定位,是这一倡议的记录者和初期试点的推动者,而非规则的制定者。
这个公共品由谁来做?行业协会、头部甲方、负责任的乙方,三方共同发起。先在小范围内试点,积累判例,磨合条款,形成共识,再逐步扩散。制度不是设计出来的,是博弈出来的。
Part 5:
反思与预告
加法与乘法
当前的政策是在做加法——算力券、数据券、模型补贴,一笔笔钱砸下去,诚意十足。但行业需要的是乘法——通过建立规则,让所有技术投入产生可预期、可互信的实际效益。
加法是量的堆积,乘法是结构的改变。没有验收标准,没有风险共担,没有裁判机制,再多的补贴也只是把更多企业推入同一个泥潭。据行业公开调研,大量中小企业尚未完成设备上云上平台。据民建广东省委员会对省内制造企业的调研,过半企业信息化团队不足5人(转引自财新网报道)。📌 这些数字背后,不是缺钱,是缺信心——缺对"投入能换来什么"的确定感。
财政补贴的窄门
财政补贴可以挂钩交付单,但必须锁定在极窄、可量化的封闭场景。比如在一些输入输出清晰、效果易于比对的标准工序中进行试点。如果补贴范围扩大到"智能工厂整体建设",验收标准必然模糊,套利空间必然打开。政策善意需要技术门槛来守护,否则钱花了,只留下一堆无法验证的PPT。
秩序与活力的悖论
当我们终于建成了完美的AI标准体系,是否也同时扼杀了AI在车间一线野蛮生长、带来意外惊喜的可能性?
这是一个真实的张力,标准化意味着可预期,可预期意味着创新空间的压缩。车间里的老师傅有时候不按SOP操作,反而解决了算法搞不定的异常。如果一切都标准化了,这些"非正规"的智慧还有没有容身之地?
看法是:秩序和活力不是零和,需要的是"有护栏的野地"——在数据安全、质量底线、法律责任的边界内,允许算法和人在车间里试错、碰撞、生长。标准应该像足球场的边线,而不是棋盘上的格子。
这篇文章能做什么,不能做什么
最后,需要坦诚地说明这篇文章的边界。
它是一份问题诊断,提出"效果契约"这一可能的解题思路,但它本身不是一份可以立刻落地的法律文本或行业标准。一份能在全行业推广的对赌协议范本,需要法律专家、行业协会、技术供需双方在无数个具体项目中反复磨合,甚至需要几轮失败的经验才能成型。
这篇文章能做的是,把一个被遮蔽的真问题推到聚光灯下,并给出一个经初步验证的解题方向。它本身不是一份可以立刻落地的法律文本或行业标准。但它的价值在于,让那些在车间里孤立无援的老板们知道——效果写进合同,不是异想天开,是已经有人在做了。
记录者的位置
当技术跑到了制度前面,产业观察的价值,在于记录制度与技术碰撞的真实瞬间。
留白与预告
这些观察,将在后续研究中放入国际比较的坐标系中进一步展开。不同国家的工业AI治理路径——美国的市场化试错、德国的协会主导标准、日本的现场改善传统——都为中国提供了参照,也提供了警示。
但那是下一阶段的课题,此刻,我们需要先把自己的问题看清楚。
本文所涉案例均有来源,所持观点均有边界。文中判断不代表所涉机构立场,亦不构成解决方案。事实错漏,敬祈指正;决策风险,由决策者自担。

【数据来源】
大量中小企业尚未完成设备上云上平台:行业公开调研;
过半企业信息化团队不足5人:财新网引用民建广东省委员会对省内制造企业的调研;
交付验收标准缺失正成为工业配套项目纠纷的关键成因:据行业多方反馈和司法案例观察;
行业流传案例(验收异议):据行业观察和多方反馈,此类案例并不鲜见;
行业流传案例(系统集成争议):涉及传统智能制造系统集成(含MES/信息化模块),交付验收争议逻辑与AI场景相通;
华南精密制造企业案例:据行业调研信息;
聆晰科技"不增效不收费"模式:据企业公开披露及多家科技媒体报道;
Crescendo结果导向定价:据海外科技媒体公开报道。
【免责声明】
本文基于公开信息与产业逻辑进行分析,不构成投资或商业决策建议。文中涉及案例均来自公开报道、行业调研信息或行业流传信息,已做脱敏处理。开篇场景基于对多个制造企业的实地走访综合而成,非单一企业实录。

本文由「新工智道」原创发布,未经授权,禁止任何形式
的转载、复制及镜像使用。
夜雨聆风