

研究目的
数 据
本研究共纳入 517 例小细胞肺癌患者,来自三个独立医学中心。
1. CHCAMS 队列共 348 例患者,来自中国医学科学院肿瘤医院,时间范围为 2005 年 1 月至 2021 年 12 月。该队列又被分为发现集和内部测试集,其中发现集 209 例,测试集 139 例。
2. TMUGH 队列共 60 例患者,来自天津医科大学总医院,时间范围为 2012 年 2 月至 2023 年 3 月,主要用于外部验证。
3. HMUCH 队列共 109 例患者,来自哈尔滨医科大学附属肿瘤医院,时间范围为 2014 年 12 月至 2020 年 12 月,同样用于外部验证。
4. 病理图像数据所有患者均有 FFPE 肿瘤组织切片,并进行 H&E 染色全切片扫描。图像被缩放到 5× 分辨率,并切割成 224×224 像素的小图块。
5. 蛋白组数据作者使用了 CHCAMS 队列中 129 例小细胞肺癌患者的蛋白组数据,用于分析不同病理图像分型背后的生物学通路差异。
6. 免疫组化数据作者对 CHCAMS 队列中 48 例患者进行了 CD45 免疫组化染色,用于验证不同分型之间免疫细胞浸润差异。
模型构建
1. 病理切片数字化和预处理
作者首先将所有 FFPE 肿瘤组织切片进行 H&E 染色并扫描成全切片图像。为了让图像可以进入深度学习模型,作者把整张大图缩放到 5× 分辨率,并切成不重叠的 224×224 小图块。随后用 Otsu 阈值法去除背景、空白区域和明显伪影,只保留组织覆盖面积超过 60% 的图块。为了减少不同医院、不同扫描批次、不同染色强度带来的影响,作者还使用 Reinhard 方法进行染色标准化,让图像颜色尽量统一。
2. 自监督深度表征学习
这一步是文章的核心。作者没有人工标注每个图块是什么组织,而是采用自监督学习,让模型自己从大量病理图像中学习形态特征。具体来说,作者对同一个图块做两种随机图像增强,然后用共享参数的 ResNet50 提取图像特征,再通过对比学习让模型学会判断“哪些图像变化后仍然属于同一类形态”。这种方法的优势是不用病理医生逐块标注,也能从海量图像中提取肿瘤细胞形态、坏死、纤维化、间质、正常组织等复杂结构信息。
3. 图块水平形态聚类
模型学习到图块特征后,作者先在图块水平得到 64 个形态聚类。这些聚类代表病理切片中不同的局部形态模式,例如肿瘤细胞密集区域、坏死区域、纤维间质区域、邻近肺组织区域等。随后作者用 t-SNE 把这些高维特征降维可视化,观察不同图块形态是否能够自然分开。这一步相当于先把整张病理切片拆成很多局部区域,再给每个局部区域分配一个形态标签。
4. GMM 聚类生成 HIPO
由于最开始得到的 64 个图块聚类可能过细,部分聚类在病理形态上很相似,所以作者进一步用高斯混合模型进行合并,最终得到 15 种组织形态表型,称为 HIPO。这些 HIPO 包括正常支气管软骨、黏膜腺体、纤维组织、邻近肺组织,以及多种肿瘤相关区域。不同 HIPO 之间在肿瘤纯度、坏死程度、纤维化程度、淋巴细胞浸润等方面存在明显差异。
5. 患者水平 HIPO 特征构建
得到 15 种 HIPO 后,作者不再只看单个图块,而是回到患者水平。对每位患者,作者统计其全切片图像中 15 种 HIPO 各自占总组织面积的比例。这样,每个患者就可以被表示成一个 15 维向量。这个向量反映的是:这个患者的肿瘤切片里,哪些形态区域更多,哪些区域更少。
6. 共识聚类定义 HIPOS 分型
作者基于患者的 HIPO 比例特征进行共识聚类,最终把小细胞肺癌患者分成两个稳定的图像亚型:HIPOS-I 和 HIPOS-II。HIPOS-I 中 HIPO7、HIPO11、HIPO12、HIPO14、HIPO15 比例更高;HIPOS-II 中 HIPO2、HIPO3、HIPO4、HIPO8、HIPO9 比例更高。简单理解,HIPOS-I 更偏向肿瘤纯度较高且免疫浸润更明显的形态,而 HIPOS-II 更偏向坏死、纤维化、间质成分和低免疫浸润的形态。
7. 生存分析和 Cox 回归
为了判断这两个图像分型是否有临床意义,作者进行了 Kaplan-Meier 生存分析和 Cox 回归分析。结果显示,HIPOS-I 患者总体生存和无病生存都明显优于 HIPOS-II 患者。更重要的是,在调整年龄、性别、吸烟、分期等临床因素后,HIPOS 分型仍然是独立预后因素。这说明它不是简单重复临床分期,而是提供了额外的预后信息。
8. HIPOS 深度学习分类模型
为了让这个分型更容易临床应用,作者又开发了一个简化版深度学习模型,用患者的 HIPO 特征直接预测其属于 HIPOS-I 还是 HIPOS-II。该模型包含全局特征提取和局部注意力机制,可以同时捕捉整体组织形态和关键形态区域。在内部测试集中,模型区分 HIPOS-I 和 HIPOS-II 的 AUC 接近 0.98,说明分类性能很高。随后在 TMUGH 和 HMUCH 两个外部队列中也验证了其预后价值。
9. SHAP 可解释性分析
为了避免模型变成“黑箱”,作者使用 SHAP 分析不同 HIPO 对模型判断的贡献。结果显示,HIPO15、HIPO7、HIPO11 等更倾向于支持 HIPOS-I;而 HIPO4、HIPO5、HIPO2 等更倾向于支持 HIPOS-II。作者还把模型关注区域映射回原始病理切片,发现模型高关注区域主要集中在肿瘤细胞、坏死、间质和免疫浸润区域,而低关注区域多为正常组织或非关键结构。这增强了模型结果的病理解释性。
10. 蛋白组学功能富集分析
作者进一步利用 129 例患者的蛋白组数据,分析 HIPOS-I 和 HIPOS-II 背后的生物学差异。结果显示,HIPOS-I 富集了干扰素反应、补体、移植排斥等免疫相关通路,提示其免疫活性更强;而 HIPOS-II 主要富集氧化磷酸化通路,提示其代谢状态可能更加异常。这说明图像分型不仅仅是形态差异,也对应真实的分子功能差异。
11. 肿瘤微环境分析
作者使用 ssGSEA 和 xCell 方法,从蛋白组数据中推断肿瘤微环境状态。结果显示,HIPOS-I 具有更高的免疫细胞浸润和更强的抗肿瘤免疫特征;HIPOS-II 则表现为免疫浸润较低,更接近“免疫冷”状态。也就是说,HIPOS-I 可能代表免疫活跃型小细胞肺癌,而 HIPOS-II 可能代表免疫抑制或免疫冷型小细胞肺癌。
12. CD45 免疫组化验证
为了验证计算分析结果,作者对 48 例患者进行了 CD45 免疫组化染色。CD45 是泛白细胞标志物,可以反映免疫细胞浸润情况。结果显示,HIPOS-I 中 CD45 表达更高,说明免疫细胞浸润确实更多。这一步把前面的蛋白组和算法推断结果,用传统病理实验进行了验证,使结论更加可靠。
结果解读
Fig.1 研究流程
作者先从三个中心收集小细胞肺癌患者的 H&E 全切片图像,再把图像切成小块输入深度学习模型。模型先在图块水平学习不同组织形态,再把相似形态合并成 HIPO,最后根据每位患者不同 HIPO 的比例,将患者分成 HIPOS-I 和 HIPOS-II 两类,并进一步比较两类患者的生存差异。

Fig.2 形态表型
模型从病理图像中先识别出 64 类局部形态特征,再通过聚类整合成 15 种 HIPO。不同 HIPO 对应不同病理结构,包括正常支气管软骨、黏膜腺体、邻近肺组织、纤维组织、坏死区域以及不同肿瘤形态区域,说明小细胞肺癌内部存在明显的组织形态异质性。

Fig.3 预后分型
作者根据每位患者 15 种 HIPO 的组成比例,把患者分成 HIPOS-I 和 HIPOS-II 两类。HIPOS-I 患者总体生存和无病生存明显更好,HIPOS-II 患者预后更差。多因素 Cox 分析后,这种图像分型仍然具有独立预后价值,而且它与传统分子分型并不完全重合,说明它提供了新的风险分层信息。

Fig.4 多中心验证
作者进一步建立了一个简化的 HIPOS 深度学习分类模型,用来自动判断患者属于 HIPOS-I 还是 HIPOS-II。模型在内部队列中分类效果很好,在天津和哈尔滨两个外部队列中也能稳定区分预后差异。HIPOS-I 患者生存更好、复发率更低,说明这个病理图像分型具有一定的跨中心稳定性。

Fig.5 模型解释
作者用 SHAP 和注意力热图解释模型为什么会做出 HIPOS-I 或 HIPOS-II 的判断。HIPOS-I 主要与肿瘤纯度较高、淋巴细胞浸润较明显的区域有关;HIPOS-II 则更多与坏死、纤维化、间质带明显、淋巴细胞浸润减少的区域有关。这说明模型并不是随意分类,而是抓住了具有病理意义的组织形态特征。

Fig.6 生物学验证
作者用蛋白组、ssGSEA、xCell 和 CD45 免疫组化进一步解释两类分型的生物学差异。HIPOS-I 富集干扰素反应、补体、抗原呈递和免疫细胞浸润,属于更“免疫热”的状态;HIPOS-II 则富集氧化磷酸化,免疫浸润更低,更接近“免疫冷”状态。这说明病理图像分型背后对应真实的免疫微环境和代谢差异。

总 结
1. 作者认为,小细胞肺癌虽然一直被认为形态相对单一,但实际上在组织结构、细胞形态、坏死、纤维化和免疫浸润方面存在明显异质性。传统分子检测可以解释一部分差异,但成本高、流程复杂,也不一定能完整反映空间和形态层面的肿瘤异质性。
2.这项研究的核心价值在于,把常规 H&E 病理切片变成了可量化的数据。通过自监督深度学习,模型不需要人工逐块标注,就能从病理图像里学习小细胞肺癌的形态模式,并建立 15 种 HIPO 表型,相当于给小细胞肺癌建立了一套“数字病理形态图谱”。
3. HIPOS-I 和 HIPOS-II 的意义不只是图像上不同,更重要的是它们能区分患者预后。HIPOS-I 生存更好,HIPOS-II 生存更差,而且这种差异在多个中心都能验证,说明这个分型有较强的稳定性和临床转化潜力。
4. 作者强调,HIPOS 分型不同于传统分子分型。它与 NE/非 NE 分型、转录因子分型并不完全一致,说明病理图像可以提供分子分型之外的新信息。换句话说,H&E 图像不是简单替代分子检测,而是补充了肿瘤空间结构和微环境层面的信息。
5. 从生物学解释看,HIPOS-I 更像免疫活跃型小细胞肺癌,表现为免疫细胞浸润更多、干扰素反应更强、CD45 表达更高;HIPOS-II 更像免疫冷型小细胞肺癌,表现为纤维化、细胞异型性、坏死和氧化磷酸化增强。这也解释了为什么两类患者预后不同。
6. 文章也指出了潜在治疗启发:HIPOS-I 可能更值得关注免疫治疗相关反应,HIPOS-II 因为氧化磷酸化增强,未来可以探索代谢靶向治疗,比如 OXPHOS 抑制剂。但这些只是方向性提示,还需要后续临床队列验证。
7. 研究也有局限性。首先,这是回顾性研究,虽然做了多中心验证,但仍需要前瞻性临床研究确认;其次,作者主要结合的是 bulk 蛋白组数据,如果能加入单细胞、空间转录组或空间蛋白组,机制解释会更深入;另外,图像分析是在 5× 分辨率下完成,可能遗漏更细的细胞级特征。
8. 总体来看,这篇文章证明了一个重要思路:常规病理切片不仅能用于诊断,也能通过 AI 提取预后、微环境和生物学信息。对于小细胞肺癌这种分子分型推广困难、临床风险分层不足的肿瘤,基于 H&E 图像的深度学习分型有望成为更便宜、更容易落地的辅助工具。
文章代码


论文链接:https://link.springer.com/article/10.1186/s13073-025-01526-5
夜雨聆风