泛癌AI病理模型精准检出33种癌淋巴结转移
期刊:The Lancet Digital Health(柳叶刀子刊,IF=24.1,中科院1区)
发表时间:2026年3月5日(在线发表)
作者:Wu S, Hong G, Wang Y, Zeng H, Lin Z, Yang J, Chen J, Chen H, et al.;通讯作者:林天歆教授(中山大学孙逸仙纪念医院)
DOI:10.1016/j.landig.2025.100961
PMID:41792018
临床试验注册号:NCT06517979
一、研究背景
淋巴结转移是恶性肿瘤最重要的预后指标之一,其准确检测直接决定了肿瘤的病理分期(pTNM分期)和后续辅助治疗方案的制定[1]。然而,传统病理学检查存在一个隐蔽但严重的临床痛点:微小转移灶(直径<2 mm)的漏检。在繁忙的临床工作中,病理医生需要对每个淋巴结进行逐层切片和显微镜下仔细筛查,一个标准的肿瘤根治术标本可能包含数十个淋巴结,工作量巨大。在如此高负荷的工作环境下,微小转移灶和孤立肿瘤细胞极易被遗漏,导致患者真实分期被低估,进而延误辅助治疗、影响长期生存[2]。
近年来,人工智能(AI)在数字病理学领域取得了突破性进展。2024年,哈佛医学院的CHIEF模型(Nature, 2024)和微软的GigaPATH模型(Nature, 2024)分别展示了AI在泛癌病理诊断和超大尺寸全切片图像分析中的强大能力[3,4]。2025年,斯坦福大学的CONCH模型(Nature Medicine, 2024)进一步将视觉-语言模型引入病理学领域[5]。然而,这些工作大多聚焦于原发灶的诊断或生物标志物预测,专门针对淋巴结转移检测的泛癌种AI模型仍属空白——尤其是具备前瞻性临床验证的模型更是凤毛麟角。
2026年3月5日,中山大学孙逸仙纪念医院林天歆教授团队联合赛维森科技及全国17家医疗机构,在国际顶级期刊The Lancet Digital Health(IF=24.1)发表了一项里程碑式研究——PanCAM(Pan-Cancer Artificial Intelligence Diagnostic Model)[6]。该模型覆盖33种癌症类型,在9,256例患者、69,502张全切片图像和153,985枚淋巴结的大规模数据中完成训练与验证,前瞻性敏感性达0.93-1.00,且额外检出4.0%被病理医生遗漏的淋巴结转移患者。
二、研究创新点
PanCAM的核心创新体现在以下五个方面:
1. 首个泛癌种淋巴结转移AI病理模型。 不同于既往局限于单一癌种(如乳腺癌前哨淋巴结、结直肠癌区域淋巴结)的AI模型,PanCAM覆盖9种常见癌症和24种罕见癌症,共计33种癌症类型,实现了真正意义上的"一模型、多癌种"泛化能力[6]。
2. 监督学习+增量学习的双策略训练。 PanCAM采用DeepLabv3+语义分割框架和RegNet-Y40编码器,先通过像素级精细标注进行监督学习,再通过"模型自生成软标签→专家审核校正"的增量学习策略迭代优化,持续提升模型在复杂场景下的鲁棒性[6]。
3. 前瞻性多中心临床验证。 区别于大多数仅进行回顾性验证的AI病理研究,PanCAM在9家医院完成了前瞻性真实世界验证(NCT06517979),获得了AI病理模型临床价值的高级别证据[6]。
4. 罕见癌种零样本泛化。 尽管仅使用9种常见癌症数据进行训练,PanCAM对24种罕见癌症的淋巴结转移检测敏感性仍高达0.98,展现了卓越的跨癌种泛化能力[6]。
5. 以临床终点为导向的评估。 研究不仅报告了敏感性和特异性等传统指标,更将"额外检出的被遗漏转移患者数"作为核心评估终点——回顾性额外检出120例、前瞻性额外检出21例,直接回应了病理医生最关心的临床现实问题[6]。
三、技术原理
PanCAM的技术架构围绕三个核心模块展开,实现了从数字病理全切片图像到淋巴结转移诊断的端到端流程:
模块一:全切片图像预处理与组织区域检测。 每张淋巴结全切片图像(Whole Slide Image, WSI)首先经过组织区域自动检测,排除空白背景和伪影区域。随后,通过滑动窗口将WSI切割为512×512像素的图像块(patch),作为模型的输入单元。这一预处理策略确保模型聚焦于含有淋巴结组织的有效区域,避免被背景噪声干扰[6]。
模块二:DeepLabv3+语义分割与RegNet-Y40编码。 PanCAM采用DeepLabv3+作为语义分割框架,该架构凭借其空洞空间金字塔池化(ASPP)模块,能够在多个尺度上捕获淋巴结组织中的肿瘤细胞特征。编码器部分选用RegNet-Y40,这是一种通过网络架构搜索(NAS)优化设计的轻量级卷积神经网络,在保持高准确率的同时显著降低了计算开销。模型输出为像素级的肿瘤区域概率图,能够精确勾画转移灶的边界和范围[6]。
模块三:监督学习与增量学习双策略。 训练分为两个阶段。第一阶段:使用病理专家像素级精细标注的数据进行监督学习,使模型建立基本的肿瘤形态学识别能力。第二阶段:引入增量学习策略——模型对未标注数据生成"软标签"(soft label),由资深病理专家对软标签进行审核校正,校正后的数据重新加入训练集。这种"AI预标注→专家审核→迭代训练"的闭环机制,使模型在不断接触新数据的过程中持续进化,逐步覆盖更多罕见癌种和复杂形态学变异[6]。
训练与验证数据规模。 研究共纳入来自17家中国医院的9,256例患者,数据集包含69,502张WSI和153,985枚淋巴结。训练集1,303例,内部验证集558例,外部回顾性验证集6,006例(来自15家外部医院),前瞻性验证集1,389例(来自9家医院),外加CAMELYON16公开数据集(399张WSI)作为独立外部验证[6]。
四、实验结果
PanCAM在多个维度展现了卓越性能,以下为核心实验结果的系统总结:
1. 回顾性验证性能。 在16家医院(含内部验证和15家外部医院)的回顾性验证中,PanCAM检测淋巴结转移的敏感性范围为0.97(95% CI: 0.92-0.99)至1.00(0.98-1.00),在CAMELYON16公开数据集上的敏感性为0.96(0.92-0.99)。在患者层面,PanCAM在回顾性验证中额外识别出120名被常规病理报告遗漏的淋巴结转移患者,占所有转移患者的4.0%[6]。
2. 前瞻性验证性能。 在9家医院的前瞻性真实世界验证中,PanCAM的敏感性范围为0.93(0.78-0.99)至1.00(0.98-1.00),均优于常规病理报告。在前瞻性验证期间,PanCAM成功辅助发现21例常规阅片难以识别的微小转移灶,平均每位患者仅增加13秒审查时间。这一结果直接证明了AI辅助在真实临床工作流中的可行性和增益价值[6]。
3. 罕见癌种泛化能力。 尽管PanCAM仅在9种常见癌症(如乳腺癌、肺癌、结直肠癌、胃癌、膀胱癌等)数据上训练,其在24种罕见癌症中的淋巴结转移检测敏感性仍达到0.98(0.95-1.00),在回顾性和前瞻性验证中均表现稳定。这一发现颠覆了"AI模型必须针对每种癌症单独训练"的传统认知,展示了深度学习模型在病理形态学层面学习到的跨癌种通用特征[6]。
4. 与癌种特定模型的对比。 在膀胱癌数据集中,PanCAM的敏感性为0.99、特异性为0.98、阳性预测值0.81;对比之下,专门针对膀胱癌训练的特定模型(BCa model)敏感性为0.98、特异性为0.94、阳性预测值0.62。泛癌模型在膀胱癌这一特定癌种上反而超越了专门训练的癌种特定模型,说明多癌种联合训练可能通过共享形态学知识产生了正向迁移效应[6]。
5. 亚组分析。 PanCAM在不同淋巴结大小(<5 mm、5-10 mm、>10 mm)、不同肿瘤类型(癌 vs 肉瘤 vs 淋巴瘤)、不同转移灶大小(宏转移 vs 微小转移 vs 孤立肿瘤细胞)的亚组中均保持了稳定的高性能,验证了模型的广泛适用性[6]。
| 评估维度 | 核心指标 | 结果 |
| 回顾性验证 | 敏感性(16家医院) | 0.97-1.00 |
| 外部公开数据集 | CAMELYON16 敏感性 | 0.96 |
| 前瞻性验证 | 敏感性(9家医院) | 0.93-1.00 |
| 罕见癌种泛化 | 敏感性(24种罕见癌) | 0.98 |
| 额外检出遗漏转移 | 回顾性+前瞻性 | 120例+21例 |
| 数据规模 | 患者/WSI/淋巴结 | 9,256/69,502/153,985 |
| 覆盖癌种 | 常见+罕见 | 33种 |
| 审查时间增加 | 平均每位患者 | 13秒 |
五、技术优势
1. 泛癌种通用性。 一个模型覆盖33种癌症类型,无需为每种癌症单独开发和部署AI系统,显著降低了病理科的AI维护成本和操作复杂度[6]。
2. 罕见癌种零样本泛化。 仅使用常见癌症训练即可在罕见癌症中达到0.98的敏感性,这对于罕见肿瘤的病理诊断具有特殊价值——罕见癌种往往因样本量不足而难以独立训练AI模型[6]。
3. 前瞻性证据支持。 作为少数完成前瞻性多中心验证的AI病理系统,PanCAM的临床证据等级远高于仅依赖回顾性验证的同类研究,为临床采纳和监管审批提供了坚实基础[6]。
4. 不改变现有工作流。 系统可与主流数字病理扫描设备无缝对接,实现"扫描数字化→AI自动分析→结果提示"的一体化部署,平均每位患者仅增加13秒审查时间,在不增加工作负担的前提下提升诊断精度[6]。
5. 以临床价值为导向。 额外检出4.0%被遗漏的转移患者,这一指标直接关系到患者能否及时接受正确的辅助治疗,比单纯追求AUC提升更具临床现实意义[6]。
六、应用前景
1. 临床病理诊断辅助。 PanCAM可作为病理医生的"AI第二阅片者",在常规病理报告签发前自动筛查所有淋巴结切片,标记可疑转移区域供医生重点复核,有效降低微小转移灶的漏诊率[6]。
2. 基层医院病理赋能。 在病理医生严重短缺的基层医院和偏远地区,PanCAM可提供接近三甲医院水平的淋巴结转移筛查能力,缩小城乡和区域间的病理诊断水平差距[6]。
3. 肿瘤精准分期。 准确的淋巴结转移检测是实现精准pTNM分期的基础。PanCAM通过降低微小转移灶的漏检率,有助于更准确地评估患者预后和制定个体化辅助治疗方案[6]。
4. 临床试验病理质控。 在抗肿瘤新药临床试验中,淋巴结转移状态是关键的入组标准和疗效评估指标。PanCAM可提供标准化、可重复的病理评估,减少多中心试验中的评估者间差异[6]。
5. 病理教学与培训。 PanCAM的像素级肿瘤区域标注可作为病理住院医师培训的教学工具,帮助年轻病理医生快速掌握淋巴结转移的形态学识别要点[6]。
七、研究局限性与未来方向
尽管PanCAM取得了令人瞩目的成果,仍存在以下局限性:
1. 地域代表性局限。 训练和验证数据均来自中国医疗机构,虽然涵盖了17家医院的多中心数据,但尚未在欧美、非洲等不同种族和地区人群中验证。不同地区的组织处理流程、染色方案和扫描设备可能存在差异,模型的跨地域泛化能力有待进一步验证[6]。
2. 淋巴结外转移评估缺失。 PanCAM目前仅评估淋巴结内转移,未涵盖淋巴管侵犯(LVI)、神经侵犯(PNI)和淋巴结外扩展(ENE)等其他重要的病理预后指标。未来需要扩展模型以覆盖更全面的病理评估维度[6]。
3. 前瞻性验证规模有限。 前瞻性验证队列仅1,389例,虽然已覆盖9家医院,但样本量仍相对有限。更大规模的前瞻性随机对照试验(RCT)是验证PanCAM临床获益的必要下一步[6]。
4. 与分子分型的整合。 当前PanCAM仅基于H&E染色形态学特征进行诊断,未整合免疫组化(IHC)和分子病理信息。未来将AI形态学分析与分子分型相结合,有望实现更精准的淋巴结转移评估[6]。
5. 临床落地路径。 从学术研究到临床常规使用,PanCAM仍需通过医疗器械注册审批、医院信息系统集成、医保定价和临床医生培训等多个环节,商业化落地路径仍存在挑战[6]。
八、结论
PanCAM是首个基于大规模多中心数据开发的泛癌种淋巴结转移AI病理检测模型,覆盖33种癌症类型,在回顾性和前瞻性验证中均展现了卓越的诊断敏感性(0.93-1.00)。该模型在真实临床环境中额外检出4.0%被病理医生遗漏的转移患者,且对罕见癌种表现出优异的零样本泛化能力。PanCAM的发表标志着AI病理从"专病专模型"向"泛癌通用模型"的范式转变,为全球病理诊断的智能化升级提供了重要的技术基础和临床证据。随着更多前瞻性验证的开展和临床落地路径的推进,PanCAM有望成为病理科日常工作中不可或缺的AI辅助工具,最终惠及更广泛的肿瘤患者[6]。
参考文献
1. Amin MB, et al. The Eighth Edition AJCC Cancer Staging Manual: Continuing to build a bridge from a population-based to a more "personalized" approach to cancer staging. CA Cancer J Clin. 2017;67(2):93-99. PMID: 28094848.
2. Weaver DL. Pathology evaluation of sentinel lymph nodes in breast cancer: protocol recommendations and rationale. Mod Pathol. 2010;23 Suppl 2:S26-S32. PMID: 20436499.
3. Wang X, et al. A pathology foundation model for cancer diagnosis and prognosis prediction. Nature. 2024;634:970-978. PMID: 39260416.
4. Xu H, et al. A whole-slide foundation model for digital pathology from real-world data. Nature. 2024;630:181-188. PMID: 38778098.
5. Lu MY, et al. A visual-language foundation model for computational pathology. Nat Med. 2024;30(8):2256-2267. PMID: 38886623.
6. Wu S, Hong G, Wang Y, et al. Artificial intelligence-based pathological model for pan-cancer lymph node metastasis detection: a multicentre diagnostic study with retrospective and prospective validation. Lancet Digit Health. 2026;8(3):100961. PMID: 41792018. DOI: 10.1016/j.landig.2025.100961.

夜雨聆风