AI靠多任务学习是怎么把精度硬拉37.5%的?

导览：本期主要探讨如何利用多任务学习方法，在多目标互相打架的材料设计中，从11万个候选配方里精准筛出高潜力配方，并把预测精度硬拉了37.5%，帮助材料设计从盲人摸象到精准突围。

材料设计从来不是单选题，而是极其苛刻的多目标统筹，传统试错易耗费大量精力。

2025年5月，北京科技大学材料基因工程高精尖创新中心联合 AiMaterials Research LLC 等团队，在材料学顶刊《Acta Materialia》发表了一篇论文，标题为「Design of superalloys with multiple properties via multi-task learning」。

这一群人运用AI从「十一万多个」作为候选的合金当中，成功筛选并合成出 4 种完全满足所有性能指标的新型高温合金。

当看到这个数字的时候，我在最开始的时候是存在疑问的，心里想着真的是人工智能得出的结论吗？然而在继续去了解之后发现，他们并没有使用大型的模型，而是采用「多任务学习」的方法，把预测的精度提升了37.5%。

▌传统单任务困境

钴基的耐高温合金被应用于飞机发动机的涡轮叶片，其工作的环境是极端恶劣的，需要在上千度的高温以及高压的条件之下长期地耐受。所以，合金的设计存在诸多严格的要求：密度需要低一些，从而避免飞机过重；高温强度需要足够，防止在高温之下软化；加工性能需要良好，微观组织不可以无序地生长，同时还需要具备抗氧化的性能。

元素之间存在复杂的相互作用。举例来说，添加钨来提高强度，元素之间存在复杂的相互作用。举例来说，添加钨来提高强度，却有可能改变合金的凝固过程——使得从液态到固态完全凝固的温度范围变大，这个"凝固窗口"一旦过宽，铸造时合金会出现严重的成分偏析，甚至产生裂纹，导致铸造失败；添加铬来增强抗氧化性，在高温之下铬氧化物又会挥发，破坏保护层。这种“顾此失彼”的现象，正是材料设计的难点之处。

在以往的时候，运用机器学习去处理材料的情况之下，采用那种「单任务学习」的方式，分别地去开展对密度模型、凝固范围模型等模型的训练工作，看上去好像是合理的，然而却属于头痛的时候就医治头部、脚痛的时候就医治脚部的做法。

论文明确指出，这种做法忽略了其本质所在：密度、凝固范围等方面的性能虽然表现得不一样，实际上是源自于24种元素的配比情况，要是将模型进行拆分来训练的话，就没有办法识别出背后所共享的物理机制。除此之外，材料数据仅仅只有数百个样本，单独地去训练密度模型极其容易出现过拟合的状况。

所以这篇论文就换了个思路。

▌多任务学习破局

「多任务学习」指的是多个相关任务共用一套特征提取网络（编码器），再各自用独立网络（解码器）做预测，一起训练、互相借力，能够进行复用并且从中受益。

图2. MTL 联合组识别工作流程

先去制作一个具备共享性质的「编码器」，把元素的配比情况当作输入内容，让这个编码器先去摸清楚这款合金的基础特性情况，之后处于下层位置的解码器再针对各自的任务分别开展预测工作。

图3. MTL 流程示意图，展示不同任务对应的输入端、通用编码器及解码器，这些任务与不同属性相对应

这一招真的极为绝妙，知识能够进行复用，在学习固溶温度的时候了解了钨所起到的作用，在预测凝固温度的时候同样能够加以运用，大家相互协作来防止出现过拟合的情况，而且共享编码器学习出来的高维特征空间里面隐藏着合金真正的深层规律内容。

然而这里存在一个极大的问题，并非是什么任务都能够凑到一起的，强行把两个会相互产生负面影响的任务塞到一起只会造成相互干扰的情况，这被称作「负迁移」。

这一群人没有盲目行事，他们把所有的组合情况全部尝试了一遍，总共是57种组合，运用评分机制去查看哪种组合所带来的增益是最大的，最后筛选出了「三组组合」：γ′固溶温度加上γ′尺寸，固相线温度加上液相线温度，密度加上相分类，这是特别符合物理方面直觉的，AI在这个地方并非是盲目地去寻找规律，而是真正理解了相关内容。