AIVEV文献分享丨《Nature》虚拟病理模型 CHIEF实现癌症诊断与预后一体化突破-夜雨聆风

AIVEV文献分享丨《Nature》虚拟病理模型 CHIEF实现癌症诊断与预后一体化突破

哈佛医学院、斯坦福大学医学院等团队在Nature发表题为“A pathology foundation model for cancer diagnosis and prognosis prediction”的研究论文。该研究由 Xiyue Wang、赵俊涵等人共同完成，构建了面向数字病理的基础模型 CHIEF。值得一提的是，赵俊涵此前还参与发表了Nature Communications论文《Uncertainty-aware ensemble of foundation models differentiates glioblastoma from its mimics》，持续聚焦病理基础模型与脑肿瘤智能诊断方向。本研究通过结合 tile-level 自监督预训练与 whole-slide 弱监督预训练，从大规模多癌种病理切片中学习通用表征，实现了癌细胞检测、肿瘤来源识别、分子特征预测以及生存预后评估等多任务分析，并在多个独立外部队列中展现出优于现有方法的泛化能力。

研究背景

传统病理 AI 多围绕单一任务分别训练专用模型，例如癌细胞检测、分型判断或预后预测。这类方法虽然在特定数据集上有效，但往往依赖大规模标注数据，且容易受到制片流程、扫描设备及人群来源差异的影响，导致外部泛化能力不足。为解决这一问题，作者提出构建病理领域的“基础模型”，希望通过大规模、多癌种、多中心数据预训练，获得可迁移、可泛化的组织学表征，从而支持多种下游任务的统一分析。

本文亮点

提出病理基础模型 CHIEF 不再局限于某一个具体任务，而是以通用表征学习为核心，支持癌症诊断、分子预测和预后分析等多任务应用。

大规模、多中心、多癌种训练与验证 模型预训练覆盖 60,530 张全视野病理切片、19 个解剖部位，并在 32 个独立切片队列、24 家医院/队列中验证，体现出较强跨中心泛化能力

性能与临床意义兼具 CHIEF 在癌细胞检测、IDH/MSI 状态预测及生存分析中均优于多种现有深度学习方法，显示其有望成为数字病理临床辅助分析的通用底座

图1｜CHIEF模型总体框架：从基础预训练到多任务病理分析

图注： 作者构建了病理基础模型 CHIEF。模型先基于大量病理图像 tile 进行无监督预训练，再在 whole-slide image（WSI）层面进行弱监督预训练，最终将学到的通用病理表征用于癌症检测、肿瘤来源识别、基因/分子状态预测及生存预后分析。训练集共纳入 19 个解剖部位、60,530 张切片。

图片解析： 这一图是全文最核心的总览图。它回答了三个关键问题：第一，CHIEF 是什么-它不是一个单任务分类器，而是一个通用病理基础模型。第二，CHIEF 怎么训练-先用海量 tile 学局部显微形态，再用大规模 WSI 学组织上下文与跨癌种差异。第三，CHIEF 能做什么-不仅能做传统的癌细胞检测，还能进一步预测肿瘤来源、基因突变状态和患者预后。也就是说，作者想证明的不是“某个任务做得更好”，而是“病理 AI 可以像大模型一样拥有统一底座”。

图2｜CHIEF在癌细胞检测中的表现：跨癌种、跨中心依然稳定

图注： 作者在 15 个独立数据集、11 种癌症来源的 13,661 张 WSI 上验证 CHIEF 的癌细胞检测能力，并与 CLAM、ABMIL、DSMIL 等方法比较。CHIEF 在多数队列中取得最高 AUROC，且注意力热图能够较准确聚焦于病理医师标注的癌变区域。

图片解析： 这一图主要证明 CHIEF 具备强泛化的癌症识别能力。左侧一系列 ROC 曲线显示，CHIEF 在不同癌种、不同队列、不同样本来源条件下，整体上都优于现有主流弱监督方法。右侧热图则进一步告诉我们：CHIEF 不是“黑箱瞎猜”，而是把高注意力集中在真正的肿瘤区域，并捕捉到了高核浆比、核异型性、结构紊乱等典型恶性组织学特征。这说明模型学到的不是某个数据集特有的伪特征，而是更具普适性的恶性形态学信号。

图3｜CHIEF可从HE切片中预测基因突变与靶向治疗相关分子

图注： 作者系统评估了 CHIEF 对多癌种基因突变的预测能力，包括高频体细胞突变及与靶向治疗相关的基因改变。结果显示，CHIEF 可在多种癌症中较好预测 TP53、GTF2I、BAP1、EZH2、BRCA2、BRAF、FGFR3 等基因状态。

图片解析： 这一图体现了 CHIEF 的一个重要升级：它不仅能“看出是不是癌”，还能进一步从形态学中挖掘分子层面的信息。作者展示了两类任务：一类是泛癌种高频突变预测，说明某些驱动突变会在组织形态上留下可识别的线索；另一类是靶向治疗相关基因预测，更接近临床应用场景。这部分结果的意义在于，常规 HE 切片未来或许不只是形态诊断工具，还可能成为快速分子分层的入口。当然，这里更适合理解为“提供辅助线索”，而不是完全替代基因检测。

图4｜CHIEF预测IDH与MSI状态：连接分子分型与治疗决策

图注：

作者分别评估了 CHIEF 对胶质瘤 IDH 状态和结直肠癌 MSI 状态的预测能力。结果显示，在训练集及独立外部验证集中，CHIEF 均优于对照模型，在 IDH 和 MSI 预测中取得较高 AUROC。

图片解析：

这一图的价值在于把 CHIEF 从“形态学工具”进一步推进到了临床分层工具。对于胶质瘤来说，IDH 状态已经深度参与 WHO 分类体系；对于结直肠癌来说，MSI 状态与免疫治疗获益密切相关。也就是说，这里不是简单增加一个预测任务，而是在说明：病理基础模型有机会在患者初诊阶段直接提供与分类、用药相关的分子信息。特别是 MSI 这种具有明确治疗指导意义的指标，如果未来在临床上能够稳定复现，将显著提升常规病理切片的附加价值。

图5｜CHIEF预测患者生存：病理图像也能成为预后分层工具

图注： 作者在 17 个数据集、7 类癌症的 9,404 张 WSI 中评估 CHIEF 的生存预测能力。结果显示，CHIEF 可在多队列中将患者区分为高风险与低风险组，其 c-index 整体优于 PORPOISE 和 DSMIL 等方法。

图片解析： 这一图说明 CHIEF 学到的表征不仅能用于“诊断当下”，还能在一定程度上反映“未来结局”。Kaplan–Meier 曲线显示，CHIEF 在多种癌症、多个独立队列中都能把患者分出明显不同的生存风险层级。这意味着模型提取到的显微组织信息，已经不只是病理分类特征，还包含与肿瘤侵袭性、微环境状态、疾病进展风险相关的综合信号。从应用角度看，这类结果对于术后风险评估、随访强度制定及辅助治疗决策都有潜在价值。

总结与展望

这项工作的重要意义，不仅在于提出了一个性能更高的模型，更在于它推动了数字病理研究范式的转变：从过去“一个任务训练一个模型”，走向“先学习通用病理表征，再适配多类下游任务”的基础模型路线。CHIEF 通过大规模、多中心、多癌种训练，证明了病理基础模型在诊断、分子预测和预后分析中的广泛适用性，也显示出较好的跨域泛化能力。

但从转化角度看，这项研究仍有几个值得继续推进的方向：第一，如何进一步提升模型在真实临床工作流中的可解释性与稳定性；第二，如何在更多前瞻性、多设备、多实验室场景中验证其鲁棒性；第三，如何把这类基础模型真正嵌入病理医生决策流程，而不是仅停留在离线评测阶段。总体而言，CHIEF 代表了病理 AI 从“专用工具”向“通用底座”升级的重要一步。

DOI：

10.1038/s41586-024-07894-z

文章链接：

https://www.nature.com/articles/s41586-024-07894-z