点击下方卡片关注AI病理视界。这里持续追踪病理AI前沿论文、深度行业观察与工具方法更新。我们不只关注模型做了什么,也关注它离真实场景还有多远。
推 文 概 览
在病理AI最常用的弱监督多示例学习(MIL)框架里,过去几年主要在两端发力:一端是追求更强的图块编码器(Patch Encoder),另一端是设计更复杂的切片聚合器(Aggregator)。然而,位于两者之间、负责将通用特征映射为任务相关特征的那一层线性变换(Linear Layer),长期被当作理所当然的透明层存在。
近日,哈佛医学院Faisal Mahmood教授团队(该团队曾开发过CLAM、UNI、CONCH等一系列病理AI标杆性工作)发布了他们的最新力作:MAMMOTH。这篇文章恰恰是从MIL中这一步看似不起眼的线性映射入手,为此设计了一个可插拔的混合专家(Mixture-of-Experts, MoE)模块,用来替换标准MIL中普遍存在的初始线性层。
这篇工作的亮点,不在于重新设计整套MIL框架,而在于对经典MIL流程做了一次很有针对性的结构性修补。文章给出的核心信息很明确:聚合器接收到的特征质量,往往比想象中更依赖于前置的任务变换;如果这一步处理得不够精细,后面的聚合算法再复杂,提升空间也可能有限。MAMMOTH在多种模型、任务、数据集上均表现出稳定的增益。
对于已经有成熟MIL流水线的团队来说,这类模块的现实意义非常直接:它可以较低成本地插入现有系统,在很多场景下继续把性能往前推一步。
如果你希望围绕相关项目、技术方向进一步沟通,欢迎扫码联系。


一、最值得关注的地方
这篇文章最值得关注的地方,可以总结为以下三点:
第一,MAMMOTH的定位极其清晰。 它是一个即插即用(Plug-and-Play)模块,替换的是标准MIL中几乎普遍存在的任务特异性线性层。因此,它能够无缝嵌入ABMIL、CLAM、TransMIL、Transformer、ILRA、DSMIL以及均值池化(Mean Pooling)、最大池化(Max Pooling)等各类MIL方法中。这种设计让它的价值超出了单篇模型表现的范围,更接近一种可迁移、可复用的通用增强件。
第二,它真正改变了我们对MIL性能来源的理解。 作者的实验结果提示,决定模型上限的关键因素,未必总是切片编码器或聚合模块;位于中间的任务特异性表征变换,同样可能左右最终表现。文章甚至展示出一个颇具冲击力的现象:加入MAMMOTH后,一些极简的均值池化和最大池化方法,其平均表现竟然可以超过带标准线性层的复杂MIL模型。这说明,很多时候问题并不出在“怎么聚合”,而出在“送去聚合的东西是否已经被充分整理成任务相关的表征”。
第三,混合专家(MoE)概念的引入逻辑非常自洽。 混合专家的基本思想,是让不同专家去处理不同类型的输入模式。病理切片本身就充满形态异质性,肿瘤区域、间质、炎症、肺泡、坏死等不同组织学内容,很难由同一套线性变换统一建模。将MoE放到多实例学习的切片级任务变换环节,本质上是在回应病理图像天然存在的组织学多样性。
二、研究背景与问题定义
混合专家模型(MoE) 起源于深度学习中的条件计算。其核心在于分而治之:模型由多个并行的专家组成,并由门控网络负责将不同的输入分配给最擅长的专家处理。这种机制允许模型在不显著增加计算开销的情况下,大幅提升参数量和表征能力。
在当前的病理WSI分析中, MIL是最主流的框架。它通常包含三个步骤:提取切片特征、特征空间映射、全切片聚合。过去几年,大家都在卷第一步和第三步,而第二步常常只是一个默认存在的初始线性层。
这个初始线性层原本起什么作用?
在标准流程中,它的任务是将基础模型提取的通用特征,映射到当前具体任务所需的表示空间中。由于基础模型输出的维度往往很高且包含大量冗余信息,线性层负责维度对齐和初步的任务相关特征筛选。
然而,传统的做法是对全切片中上万个Patches应用完全相同的一组权重参数。这产生了一个直观的矛盾: 在同一张切片中,肿瘤细胞、基质、炎症和坏死区域的形态截然不同。用同一套线性变换去处理它们,本质上是在强迫异质性极高的特征通过同一个狭窄的瓶颈。这种一刀切的映射会抹杀不同组织成分之间的细微差别。
MAMMOTH的理论起点就在于:病理图像跨越多个尺度和组织成分,某些任务依赖肿瘤形态,某些依赖间质反应。任务特异性表征的形成过程,需要更具选择性和分工性。
三、方法学拆解
MAMMOTH的核心思路是:用多个小而专的专家模块,替代对所有切片一视同仁的单一线性层,让不同成分获得更合适的变换。在具体实现上,它针对病理场景做了多重优化。

1. 多头处理(Multi-head Processing)
作者先把高维切片嵌入空间切分成多个子空间,由不同“头”分别处理。对病理基础模型提取的特征来说,这更像是在多个子表示空间内学习不同的变换逻辑。病理表征极其复杂,将其拆开处理有助于形成更细粒度的特征重组。消融实验也表明,多头设计是性能的重要来源。
2. 基于槽位的池化(Slot-based Pooling)
这是MAMMOTH很有辨识度的设计。作者没有让每个Patch独立进入专家(这在万量级的patch下计算量巨大),而是先通过可学习的“槽位原型(Slot Prototype)”,将大量patch按特征相似性汇聚成若干槽位。每个槽位可以理解为一种潜在的形态学概念摘要。这样做之后,模型面对的是一组更紧凑、更有结构的形态学摘要。
3. 低秩专家(Low-rank Experts)
为了避免引入MoE后参数量爆炸,作者没有配置完整的大矩阵,而是通过低秩分解和共享矩阵,把专家做成轻量版本。这意味着MAMMOTH 能在与原始线性层相近的参数预算下,引入更多专家。这说明文章重点不在于“用大模型换性能”,而在于用更高效的参数组织方式提升表征能力。
4. 槽位级输出
MAMMOTH输出的是一组压缩后的槽位级嵌入,再交给原有MIL模块处理。这意味着它在进入最终聚合之前,已经完成了一次面向形态学概念的重组。实验证明,如果把输出恢复成原始切片数量,效果反而下降,强调了这种“重构与压缩”的价值。
四、结果与验证表现
从实验结果看,MAMMOTH最突出的特点是稳定。
在形态学分类任务中,作者评估了6个任务、8个测试队列、8种MIL方法。结果显示,48个MIL配置中有46个在加入MAMMOTH模块后性能获得提升,平均提升幅度较为可观。

在分子标志物预测任务中,104个配置中有84个改善,整体平均性能同样上升。

在生存预测任务中,32个配置中有30个提升,说明这一模块的收益并不局限于分类任务,也能在预后建模中发挥作用。

当然,MAMMOTH的提升也有边界。比如在NSCLC这种相对简单、基线已经很高的二分类任务上,提升就比较有限,个别配置甚至略有下降。这说明 MAMMOTH并不是一个对任何任务都能大幅加分的万能模块。它更适合那些形态异质性较强、任务相关信号需要从复杂patch组合中提炼出来的场景。对于已经接近饱和的简单任务,它的空间自然会小一些。
文章的可解释性分析也增加了说服力。作者通过可视化patch到不同slot的路由权重,让两位病理专家对结果进行观察,发现模型确实倾向于将肿瘤、间质、肺泡、淋巴细胞、红细胞等不同形态学成分分派到不同槽位和专家中。这至少说明,MAMMOTH的“专家分工”并非只是抽象设想,而是与可辨识的组织学概念之间存在一定对应关系。

作者还提出了一个很值得注意的分析视角:实例梯度干扰。他们认为,在标准线性层中,不同类型的patch会共享同一套参数更新路径,因此容易产生梯度冲突;而MAMMOTH通过将异质实例分流到不同专家,降低了这种干扰,提升了训练初期的梯度一致性。这个解释还谈不上完整理论,但它为MAMMOTH的有效性提供了一个比“模块更复杂,所以性能更高”更深入的机制层说明。
在消融实验中,作者系统比较了不同专家混合形式、是否采用多头、是否使用低秩专家、是否共享矩阵、是否保留slot级输出,以及与其他聚合前处理模块的差异。整体结果非常一致:完整版本的MAMMOTH最优,各个关键组件都对性能有贡献。这也说明,这篇文章的价值不是来自某一个单独的技巧,而是来自一整套围绕病理MIL场景重新组织后的结构设计。

五、讨论与总结
MAMMOTH的出现不仅提供了一个工具,更在方法学上带来了多重启发。
首先,它重新定义了病理AI中的MIL方法的瓶颈。 它证明了MIL中的初始线性层并不是一个可以默认跳过的配角,而是参与决定最终性能的重要环节。未来在讨论某种聚合器是否优越时,需要先考虑输入给它的特征是否经过了合理的任务特异性重构。这一视角的转变,可能会引导后续研究从单纯的“聚合器”向“深耕表征转换”转型。
其次,它展示了通用概念的“病理化落地”。 MoE本身虽非新概念,但MAMMOTH没有照搬LLM中的MoE的巨量参数体系,而是针对病理任务的高异质切片、多特征标记、小样本限制,设计了软分配、低秩共享等具体结构。这种改良的MoE,才真正适配病理MIL的土壤。
再者,它提供了一个高质量的通用增强路径。 虽然它目前仍服务于既有的“编码器+聚合器”管线,没有跳出这个范式,但其跨模型、跨任务的稳定性极高。对于临床应用或工业界研发团队来说,这提供了一条工程成本可控、动机明确的性能提升方案。尤其当编码器和聚合策略已经遇到瓶颈时,MAMMOTH这种中间层模块,确实是继续挖掘性能表现的有效抓手。
总结来说, MAMMOTH最值得被记住的不是某组实验数据,而是一个深刻的直觉:病理AI的关键可能不在于如何聚合,而在于聚合之前,模型是否已经把异质的图像特征,整理成了最契合任务要求的表达。它为病理MIL提供了一次方向性的校正,将那个习以为常的线性层,变成了性能瓶颈、表征瓶颈和训练稳定性的新突破口。
MAMMOTH已经开源:https://github.com/mahmoodlab/mammoth。目前已经适配ABMIL, CLAM,TransMIL等8种MIL方法,且提供了将MAMMOTH加入到任何MIL模型的教程。大家不妨在自己的MIL项目中试一试。
AI病理视界团队在病理AI竞赛、研究发表与项目案例方面有丰富积累,覆盖病理AI模型开发、数据分析、研究方案设计与技术支持等多个环节。
如果你来自病理科、科研团队、药企/CRO或相关企业,正在推进病理AI任务设计、模型研发或转化项目,欢迎进一步交流。
如果你具备病理AI、基础模型或工具链相关背景,也欢迎围绕兼职、实习或技术合作与我们联系。

· 往期推荐
夜雨聆风