工业AI视觉项目之所以大量烂尾,在于这件事成功的概率本身就很低,因为我们必须在一个不确定的环境和场景下行动。 而本篇文章,旨在用我本人亲历的成功经验和失误教训为AI视觉落地提供有效的参考样例,帮助大家看清项目中真实的问题,并提供确定高性的行动方案。
本篇你将看到:
为什么看起来没有异常的Demo样机交付时间硬是「推迟」了10天?
为什么不同专业的团队和同事之间会产生如此不可调和的「矛盾」?
一套什么样的「项目管理方法」才能保证项目不烂尾,有收获。

01:如何把目标拆解为可落地的任务
当天,正是4月23日,也就是说我们只有一个月的时间。最大的挑战,就在这里,时间太短了!从无到有搭建一套可验证的Demo样机,检测20多种缺陷,还要考虑模块化和柔性化设计,这真是非常巨大的挑战。
没办法,我们依然想争取这个项目,哪怕没做过,也要硬着头皮上。我跟自动化的PM商量,双方协作的方式,想办法搞定这个极具挑战的Demo验证。当务之急,需要自动化的机构工程师评估:能否设计出基于我们这套视觉方案的Demo样机,并且在半个月内完成组装和测试。
所以,我们双方马上召集会议,自动化的机构工程师L工和我这方的视觉sa D工、方案sa M工慎重研讨后,给出的结论是:Demo样机能做,半个月完成搭建应该没问题。
两天后,我制定了一套项目计划,邀请设备部P经理和相关甲方人员线上会议,向他们汇报我们的行动方案。
瞄准客户预期,确定目标和方向,完成任务拆解
我知道,P经理他们的核心诉求是,省人工降管理成本。那么,Demo验证实际上就是验证这套设备到底能不能替代人,替代率是多少?可以替代哪些缺陷的检测,机器检测的漏检率和过检率分别是多少?最后,再验证机检的节拍是否能达到量产的要求。
围绕这一系列的核心问题,我在写计划方案的同时,也在帮客户做判断。为此,我把所有能够支撑决策的依据都写入了验证计划里。所以,我的内心很笃定,这件事情可以做,而且能够做好。
以下为验证方案计划的关键内容:




整个大目标的规划设计完成,必须用“工程化”思维去拆解任务,把每件事情落实到具体的某个人身上。并且,下一步能否实施取决于上一步的反馈结果,必须对责任人提出具体的交付要求。
那么,为了让Demo验证顺利完成,我必须在头脑里预演一遍事情的发展,以及如何推进和解决卡点问题。最终,我把这份推演的项目实施计划做成一张甘特图。以时间为轴,把关键事项、责任人、里程碑、最终目标放在合适的坐标点上,这样一份清晰的实施计划才能够指导团队高效协作。
Demo验证计划持续时间30天,我的安排如下:
项目启动前,所有参与人达成目标共识,有任何疑问必须在4月30日前提出并解决。
视觉系统与相机、机构与工件等物品的准备与测试,总共13天;Demo样机运输至工厂的路途时间为3天。
在设备准备过程中,车间同时收集必要数量的样品,持续16天。
Demo样机通讯调试与AI模型构建同步完成,预期2天,每天记录问题和结果。
AI检测模型跑料验证,持续优化10天,每天必须记录检测数据,分析问题和结果。
验证结束后,汇总数据和结果,进行正式汇报,为期1天。
最后3天,拆装并收回设备,人员撤离返回(6.7号)。
这份定格在4月30号的项目计划甘特图如下:

02:项目启动后“时间与人”的不可控开始显现
抵达江西,发现Demo样机连个影子都没有
这次通讯联调,是我们双方第一次深入的技术碰撞,需要现场FAE和电控工程师协作完成。所以,必须派一个FAE工程师跟我一起到江西。协调人员也费了不少口舌,总算找来了一个,他就是欧阳。
欧阳比我先到一天,我让他先去实验室看看Demo样机搭建到什么程度。不看不知道,一看吓一跳:一点进展都没有!连我们寄过去的视觉设备都没拆封,更别说自动化实验室里的Demo样机了。
很无奈,但这就是现实的事实,5.19号只完成了视觉设备收货确认,后续的关键事项全部停滞,能否完成Demo样机搭建,什么时候系统调通,哪个时间发运到嘉善的工厂,一律未知!
我在第二天一早就去了自动化设备商的实验室,找到机构和电控两个专业的工程师,拿出那份「项目计划甘特图」跟他们对进度。
首先,让大家意识到现在延期到了哪个阶段,还有哪些重要工作没做,下一步的追赶行动和方案是什么。我们总算达成共识,想办法在5.25号完成Demo样机调试,具备随时可以发运出去的条件。
接下来的工作,有很大的挑战,也考验不同专业、双方团队之间的协同合作。后来,机构、电控、算法工程、应用,四个方向工程师齐聚一堂,确实出现了大量的冲突和分歧,这些沟通不畅的问题是当时影响进度最大的因素。
复杂高速联动的视觉要求,是电控的「PLC」与「运控板卡」之争
大概率因为我在实验室天天叫嚷进度太慢,追着机构、电控的人现场搭样机,总算在5.23号搭好。但是,电控程序才刚开始写,等调试完成,离发运条件还差一段距离,中间的时间变得很不可控。因为,出现了一个重大争议,我们要求的三个序列实现独立的高速飞拍+定拍方案,在电控负责人这里得到了否定答案,做不了!
听到这句话,我心里咯噔了一下:如果电控没办法实现这套视觉方案,那么这个项目现在就可以宣告暂停,直接放弃......可是,我不想前期两个月的努力白费,无论如何都要想办法跨过这一关。而我能做的,就是把算法、FAE、电控、机构聚在一起,听他们的说法,找出问题的卡点在哪里。
由于涉及大量跨专业的内容,为了搞清楚每个人在讲什么,我们开了3次会议,6个多小时的沟通,我在当天晚上10点多整理出了这套结构化的表格,总算明白这件事情到底在说什么。

简单点说,电控选型用的是PLC方案,整个拍摄过程“位置-速度-触发”的控制逻辑全靠PLC程序写,电控负责人按照既有的经验,绑定死X轴和Y轴的运动逻辑,限制了飞拍和定拍两种状态切换。另外,只有两个IO支持高速触发,另一个IO只支持普通触发。
这个方案与视觉需求不匹配,因为我们需要的是,三个独立可实现高速触发的序列能力,并不一定要求物理上3个IO配置。具备复杂的动态姿位拍摄,通过脉冲信号切换飞拍与定拍,只有这样才能确保一片手机中框与底壳的5个面完成全检。
这次争吵很激烈,尤其是电控专业的负责人不愿意改变。因为,这会推翻原有的框架和程序逻辑,极大增加他与团队的工作量,至少得花一周的时间才写得完,加上调试整改,恐怕会变得遥遥无期。
然而,我等不起,也不可能对核心需求妥协,必须坚持原有的视觉方案。唯一的办法就是:Demo样机拆装改线,电控重新选型,换成“正运动控制卡”,确保能实现我们这套多序列独立拍摄的视觉方案,也能减少一点电控程序的编写时间。
更重要的是,这套控制方案本身才是高速、复杂、强联动场景的最佳选型。它的优势,是基于一套「自有能力」的控制框架建模、配置,围绕运动状态来定义触发拍照的逻辑,能够同时管理相机到产品的位置、速度、拍摄方式,完成精准的拍摄取图。
而不是像PLC那样,把大量位置点、运动速度和触发关系「硬编码」进程序里,再靠反复调试去补足系统边界。这样非常不可靠。一旦出现任何偏差,或者后续增加拍摄点位,整套逻辑很可能大幅度牵动修改,导致调试无止境(这绝对是当前大量视觉项目耗费人力调试的主要原因之一)。
一句话总结:在高速、复杂的缺陷检测视觉任务要求下,沿用PLC编码控制就像是——建筑工程队用一百年前造土木房子的技术和装备去搭建一座百米高楼;而明智的最佳选择——正运动控制卡,则是用现代先进的打桩机、起重机和塔吊等这类装备盖楼。(这是电控应该重视自身转型升级的地方)
临近交付的关键时刻,越能看清一个人能否担当大任
经历一轮拆装整改,同时新选型的控制卡模块缺货需等待5天,以及电控程序并没有写完,设备调试也未全部完成的不利情况下,5.29号晚上10:30,Demo样机还是不得不打包发车运往浙江的工厂。要是再不安排入厂,恐怕我们连参与资格也没有了,因为客户的耐心已经到达极限。
原本计划样机先放在车间外调试,没有车间权限限制和网络限制的情况下,能够快速完成。可是,老天好像更喜欢捉弄犯错的人,样机刚卸货就被甲方的设备工程师送进了车间,真是有一种欲哭无泪的无奈。
所以,在这种非常受限的条件下,非常考验团队成员的责任意识。我跟团队经历了两次大考验:POC视觉成像方案推翻整改、重新收集建模的缺陷样本。这两件事情还跟电控程序整改交织在一起,总共花了半个月才解决。也就是说,Demo样机具备拍摄与检测的能力,是从6.17号开始,留给我们发挥的时间只剩7天了。
(POC视觉方案推翻的详细经历见中篇阳极外观检:高分POC汇报背后,写满了项目颠覆重整的心酸(中))
在这半个月的时间里,我一直在现场,跟两个FAE、电控K工等5人一起拼命解决各种问题。我们早上8点半多9点前进车间,晚上10点多11点出车间,每天14个小时高强度连轴转。毫不夸张地说,每天晚上人都是麻的,早上起来疲惫不堪,可还是硬着头起床干活。
所以说,我非常理解现场工程师有多累,他们有时候的推脱和逃避,的确是身体和心理双重劳累,导致不想再管任何人或事。但是,如果一个能忍受煎熬疲累的现场人员愿意主动担起自己的责任,尽职尽责做好他手上的事,真是特别值得被看见,也值得被当成宝藏对待。









03:在时间的重压下交出“理想的”检测效果

据客户反馈的消息,另一家每天跑料1600-2000以上,收集了2天,至少4000个样品,缺陷样本数量在几千张的量级。
在这样的情况下,我们用不到800多样本图训练的AI模型,在检出效果上与他们没有太大差异。每一种缺陷的漏检和过检的数量差异在1-3以内,复检学习后的差异几乎为0。
这是6.18~19号的检测结果,有了这组对比数据托底,我内心便有了底气,哪怕我们剩的时间已不多,但毕竟还有几天可以冲一冲。
奋力追赶承诺的“漏误判指标”



DDS三伤一类的缺陷可以稳定的0漏检; TOP5中的异色有大概33%漏检; TOP中的吐酸也可能出现8%漏检; 而TOP中的白点甚至会出现极大概率的漏检,因为特征太轻微受到的干扰大。



04:Demo验证是你解锁一套“标准AOI设备”的钥匙
漏检和过检只是问题的表征,解决还需触及根因
最重要的一项,制定缺陷检出量化标准 风险项有人工复检 加入所需的样本学习 整改R轴运动的匹配角度 增加X轴行程距离 增加除尘工位降低干扰



复杂的非标检测场景是考验也是机遇
🏠 Lara AI Works 我站在项目之外,帮你看清哪些 AI 视觉项目不该做。 我的个人网页已为您准备好更详细的服务模块和行业案例。 欢迎复制链接访问: http://laraaiworks.com 关注我👇 为您持续输出高质量内容🧠

夜雨聆风