乐于分享
好东西不私藏

人工智能工具或可通过数据驱动的洞察力变革制造业

人工智能工具或可通过数据驱动的洞察力变革制造业

人工智能分析数据和识别模式的能力似乎很适合帮助制造商优化流程,但是是否存在适合制造业的人工智能工具?制造商及其数据和员工是否已经为人工智能做好准备?

在波士顿举行的 Rapid + TCT 2026 大会上,一场专题讨论会探讨了人工智能在增材制造及其他领域的应用潜力。这场题为“人工智能在制造业中的应用:从早期成果到可扩展的转型”的讨论会由 ASTM International 行业联盟与合作总监 Richard Huff 主持,与会嘉宾包括:AV Inc. 自动化实验研究科学家 Erick Braham;amsight GmbH 联合创始人兼首席商务官 Peter Lindecke;以及马里兰大学机械工程系助理教授、UMD Mirage 实验室主任 Davis McGregor 博士。

数据准备:一项关键挑战

数据准备似乎是制造业面临的最大挑战之一。

相关内容:实现高效的AI集成需要一套全新的工程策略

“数据规模合理化至关重要,”布拉汉姆说道。“如果你收集了大量数据,却没有统一的使用方法,最终导致数据堆积如山,那么你很难有效地利用这些数据。你最终只会存储几GB的数据,却可能忘记了这些数据最初的配置。这些数据可能已经过时,而试图基于这些数据构建人工智能最终会成为一个巨大的挑战。”

“数据基础对于人工智能实施的成功至关重要,许多制造商都拥有数十年的遗留数据,”赫夫指出。“因此,我们开发一些通用本体、术语、语义、数据模型、模式和互操作性标准作为基础,究竟有多重要?”

“您关于数据完整性和数据基础的问题涉及面很广,”麦格雷戈说道。“我想在座各位都熟悉语言学习模型(LLM),无论是 ChatGPT、Gemini,还是其他任何您常用的模型。这些模型之所以如此成功,是因为它们拥有庞大的自然语言训练数据库。如果我们从制造业的角度来看待这个问题,我们的数据基础是什么?目前,数据分散在各个公司或研究实验室中。如果我们想要构建这些工具,如果我们想要作为一个行业整体来构建某些东西,我们就真的需要团结起来,建立一个强大的知识基础。”

“你可能听说过LKM,也就是大型知识模型,”他继续说道,“这与大型语言模型的概念相同,但它专门应用于我们的领域——制造业,无论是增材制造还是其他传统制造工艺。这个领域正在取得进展。我们马里兰大学正在筹建工业人工智能中心,我们正在引入企业和大型联盟,试图构建训练不同模型的基础。ASTM(美国材料与试验协会)也在他们自己的联盟基础上进行建设。我们正在寻找方法,将他们的知识和信息整合起来,因为我们意识到,这其中凝聚了多年的知识产权开发、资金投入和研究模型积累。如果我们真的想推动制造业迈向新时代,我们就需要携手合作,共同探索如何构建这个坚实的基础。”

相关阅读:使用人工智能没问题;但别让人工智能控制你。

结构化数据的重要性

赫夫说:“数据质量对我们的系统来说显然很重要。那么,结构化和上下文相关的数据对于增材制造究竟有多重要呢?”

“有些人总是说,‘是啊,我们有数据了,为什么还要讨论数据结构化呢?’”林德克说道。“但当你和数据科学家交流时,你会发现他们80%到90%的时间都花在了数据清洗和结构化上,这其实是个大问题,因为他们根本没时间做真正重要的工作。在研发项目中,这或许可以接受,但我们希望在生产环境中应用人工智能模型,从中获取知识,进行预测,因此我们需要一个能够真正连接数据并将所有信息整合起来的基础设施。”

相关内容:医疗器械制造领域人工智能监管迷宫的导航

将数据分散在不同的 Excel 表格中可能并无益处。“在我们与粉末床增材制造企业合作的领域,你会发现有一份 Excel 表格记录粉末质量,一份 Excel 表格记录工艺参数的使用情况,还有一份 Excel 表格记录零件的质量和特性。这些数据彼此独立,缺乏关联性,这是一个巨大的问题,”Lindecke 说道。“因此,我们需要一个能够将这些数据连接起来的架构。”

他还补充说:“有了这样的基础设施,我们就可以应用模型,做一些更酷的事情。”

布拉汉姆同意制造商不应该依赖Excel来处理数据。“我完全同意彼得的说法。你肯定不想再用Excel表格了,尤其是在人工智能时代,”他说。

为人工智能做好准备,培养劳动力

“我们如何才能让人们能够使用这些工具?”赫夫问道。

麦格雷戈说:“在我之前的岗位上,我曾就职于一家创业公司,即使在创业公司内部,人们也担心人工智能会抢走某些人的工作。但事实是,只需要一个例子就能证明,人工智能可以帮人们摆脱那些没人愿意做的低价值工作,让他们能够去追求高价值、真正有趣的机会。”

“所以,无论你的行业是增材制造工艺开发还是其他什么,我们只需要找到一种能够真正展示人工智能实用性的方式,”他补充道。

为了培养未来制造业的劳动力,麦格雷戈试图“揭开”这个黑箱的神秘面纱。“我们有数据输入,也有数据输出。我们训练他们如何质疑模型输出数据的完整性。我们也鼓励他们去尝试这些模型,即使犯错也没关系。举个例子,在我教授的一门课——‘制造质量控制的数据科学’(其实我应该把它改名为‘制造质量控制的人工智能’)——中,超过一半的学生不会编程。他们总是问我:‘我还能选这门课吗?’我的回答是:‘当然可以,因为我教的不是计算机科学家,而是工程师,教你们如何运用工程技能去质疑输入和输出的数据。至于中间的那些问题,你们可以边学边用,特别是借助这些大型语言模型来辅助编程。’”

“当我审视劳动力市场时,我认为我们需要对所有人采用相同的教育策略,”他补充道。“所以,如果你不去尝试这些模型,不去尝试处理数据,如果你没有可以访问的数据库,那就想办法获取访问权限,在一个低风险的环境下进行尝试。学习如何在这个制造业新时代保持领先地位。如果你想要更正式的培训,大学就在那里,不仅仅是马里兰大学——任何你所在地区的大学都可以……如今,几乎每所大学都有专注于人工智能的在职进修项目。”

赫夫问道:“我们如何才能让员工更好地适应与人工智能一起工作?”

“当你把人工智能模型、机器学习模型(LLM)之类的东西,或者说是工厂车间里用来做预测的工具,交给一个30年来一直沿用同样方法的工程师时,很容易产生犹豫,”布拉汉姆说。“或者交给一群不熟悉预测含义的员工,他们被告知‘这将是下一步调整流程参数的方法’,却不明白为什么。所以,机器学习工程师的价值就体现在这里,这也是我在研究中扮演的角色——他们不仅要提供一个能做出不错预测的模型,还要提供一个能解释这些预测结果的模型。”

使用逻辑逻辑模型 (LLM) 和 Vibe 编码可以帮助制造团队“快速找到分析数据、生成报告、快速交互的方法,而不一定需要创建人工智能系统。你可以把它当作一种临时的界面,将人类想要执行的操作生成一小段代码,”Braham 补充道。“这绝对是我发现这些工具最实用的地方。不要事事依赖它们,但当需要快速完成某些操作时……你可以直接说‘根据数据库中的数据创建一个条形图’,它就会为你生成。这非常实用,如果有人对使用逻辑逻辑模型犹豫不决,这是一个很好的入门方法,可以帮助他们熟悉并接受它。”

利用人工智能解决制造业挑战

“人工智能和增材制造的终极目标之一是利用机器学习快速缩短开发材料性能、验证新材料和验证工艺所需的时间,”赫夫说。

林德克认为“未来会出现一些能够在特定领域发挥作用的新模型”。例如,他的公司正在测试“能够预测新型材料激光粉末床熔融工艺参数的模型。这些模型应该能够与工程师使用的标准实验设计(DOE)相媲美。”

他正在合作的一家公司正在训练这些算法,“只需几个小的构建任务,它们就能预测下一个工艺参数集,从而更快地达到合适的工艺窗口。”他还认为,未来还会开发出其他模型,用于其他预测和验证。

布拉汉姆也在研究模型。“对于工艺-结构-性能预测……你需要确定工艺参数,以便实现一些复杂的结构,从而利用某些特定的性能。我的很多研究都集中在这个流程上,”他说道。他还谈到了未来可能出现的模型,这些模型可以取代每次都进行实验设计(DOE)的做法。

“目前我看到很多人都在谈论的最大挑战,也是我认为ASTM(美国材料与试验协会)正在认真思考的问题,是如何创建可迁移的数据,”他继续说道。“这意味着,你为一个优化项目收集数据,开发出一个新的流程,进行校准,并试图了解它的功能。然后,当你想做类似的事情时,如何才能利用之前的数据呢?我们发现,很多时候,一些无关因素会让这些数据变得不再有用。”他补充说,一些微小的变化可能会对预测流程产生“巨大的影响,导致你不得不重新收集训练数据”。

然而,布拉汉姆继续说道:“如果我们能够收集到所有相关数据,并制定一些关于测量内容、数据格式以及如何准备就绪的指导方针,那么我们不仅可以利用这些数据改进我们自身的流程,从而拓展到新的几何形状、新的材料等等,还可以将这些数据传递给拥有类似机器和瞄准镜的人,甚至传递给使用相同流程的不同类型机器。只要我们对数据有足够的了解,很多物理原理都是相同的。问题在于,当我们尝试实际重复使用数据时,哪些环境因素和外部因素会影响结果。我认为现在人们在这方面投入了很多思考,我希望我们能够在这方面看到更多成功案例。”

麦格雷戈实验室开发的许多模型都专注于处理来自相机和3D扫描仪的图像数据。“我们在处理图像数据的速度、数据量以及输出结果方面都取得了显著进步,”他解释说。“如果我们在生产过程中监控整个流程,如何才能尽早做出合格的判断呢?”

达芙妮·艾伦/设计新闻/Informa

“最近毕业的机械工程专业的学生可以使用哪些开源数据集来提升技能?”赫夫在回答观众提问时问道。

“美国国家标准与技术研究院(NIST),实际上大多数国家实验室都有开源数据集,尤其是NIST和橡树岭国家实验室,这些数据集涵盖粉末床熔融和其他一些工艺。您可以免费访问这些数据集,”麦格雷戈说。“如果您想涉足制造业并获取这些数据,我建议您查看这些资源。一些研究实验室和大学也在发布他们的数据集。”

布拉汉姆补充道:“不仅有实验室直接发布的官方数据集,还有一些数据集聚合网站。这些网站并非专门针对制造业,而是涵盖各种类型的数据,例如Kaggle,它会举办数据科学家竞赛,而且他们举办竞赛的数据集通常都可以下载。Zenodo是另一个数据托管网站,很多科学家和研究人员会通过它分享数据,上面也有很多已发布的数据集。”

然而,林德克质疑开源数据集的价值。“它们大多侧重于现场过程监测数据,却无法告诉你之前实际做了什么,比如用了什么粉末,粉末的混合策略是什么,粉末的实际质量如何,机器的设置是什么等等,以及热处理的类型,所有这些都会影响数据。遗憾的是……我认为有时使用开源数据集是在浪费时间,因为我们并不真正了解数据的含义以及数据是如何获取的。”

平衡人工智能与网络安全

“在网络安全时代,如何才能说服公司在保护其机密信息的同时共享数据?”赫夫问道。

“在模型架构方面,有几种策略可供选择。例如,你可以采用联邦学习方法,这种方法本质上就是使用一个单一的存储库来存储数据,不同的节点或公司可以以近乎匿名的方式访问这些数据,”麦格雷戈说道。“这意味着你可以获取数据并训练模型,但你实际上无法访问原始数据本身。这就是联邦学习架构,它可以让多家公司,甚至是竞争对手,基于同一个数据集进行协作。”

“我认为这与ASTM正在推进的一些举措有关。首先,我们如何激励人们贡献数据;其次,我们又该如何获取这些数据。”

“我们正在研究那种模式,”赫夫说。

赫夫还问道,企业如何在不向外界泄露信息的情况下,利用自身的数据与这些LLM建立联系?

“在amsight,我们提供数据采集基础设施软件,并拥有不同的接口,可以将不同的模型连接到该软件上,”Lindecke说道。“这些模型可以将数据推送到云端,也可以应用在本地运行的模型。如果是国防等高风险、受监管的行业,我认为未来不太可能使用公共模型,而只能在设施内应用本地运行的模型。”

“我完全同意,本地模型是解决这个问题的最佳方法之一,因为即使它们通常由私营公司训练,也完全运行在您自己的基础设施上,”布拉汉姆说道。“您从它们那里获得的只是权重、偏差以及模型的数值。您无需向它们提供任何连接……如果您没有服务器或任何基础设施来运行类似的程序,即使有些模型小到可以在笔记本电脑上运行,但如果您想要运行更大型的模型,云计算也能非常安全。”

“话虽如此,我也认为很多这类模型并不需要你的数据,它们只需要你的提示来生成代码,然后你再用这些代码与你的数据进行交互,”他补充道。“很多时候,你不应该把几GB的数据输入到LLM模型中。”

“不要把你的数据一股脑地扔给LLM,”麦格雷戈总结道。“它们不是为此而设计的。你应该提供你的数据结构,然后问自己:‘我该如何与这个结构交互?’”