Genome Medicine | AI把小细胞肺癌分成两类,预后差异很明显

文章研究的是小细胞肺癌的病理图像分型和风险分层。作者没有依赖昂贵的分子测序，而是直接利用临床常规的 H&E 染色全切片图像，通过深度学习从病理形态中提取隐藏信息，识别小细胞肺癌内部不同的组织形态模式，并进一步把患者分成预后不同的两类：HIPOS-I 和 HIPOS-II。整体思路是把普通病理切片转化为可量化的“数字病理特征”，用于判断患者预后和肿瘤微环境状态。

研究目的

文章的核心目的是建立一种基于常规病理切片的小细胞肺癌分型系统，解决传统分子分型成本高、操作复杂、临床推广困难的问题。作者希望证明：仅靠 H&E 全切片图像，也可以识别小细胞肺癌的组织形态异质性，并进一步完成患者预后分层；同时结合蛋白组学和免疫组化，解释不同图像分型背后的生物学基础。

数据

本研究共纳入 517 例小细胞肺癌患者，来自三个独立医学中心。

1. CHCAMS 队列共 348 例患者，来自中国医学科学院肿瘤医院，时间范围为 2005 年 1 月至 2021 年 12 月。该队列又被分为发现集和内部测试集，其中发现集 209 例，测试集 139 例。

2. TMUGH 队列共 60 例患者，来自天津医科大学总医院，时间范围为 2012 年 2 月至 2023 年 3 月，主要用于外部验证。

3. HMUCH 队列共 109 例患者，来自哈尔滨医科大学附属肿瘤医院，时间范围为 2014 年 12 月至 2020 年 12 月，同样用于外部验证。

4. 病理图像数据所有患者均有 FFPE 肿瘤组织切片，并进行 H&E 染色全切片扫描。图像被缩放到 5× 分辨率，并切割成 224×224 像素的小图块。

5. 蛋白组数据作者使用了 CHCAMS 队列中 129 例小细胞肺癌患者的蛋白组数据，用于分析不同病理图像分型背后的生物学通路差异。

6. 免疫组化数据作者对 CHCAMS 队列中 48 例患者进行了 CD45 免疫组化染色，用于验证不同分型之间免疫细胞浸润差异。

模型构建

1. 病理切片数字化和预处理

作者首先将所有 FFPE 肿瘤组织切片进行 H&E 染色并扫描成全切片图像。为了让图像可以进入深度学习模型，作者把整张大图缩放到 5× 分辨率，并切成不重叠的 224×224 小图块。随后用 Otsu 阈值法去除背景、空白区域和明显伪影，只保留组织覆盖面积超过 60% 的图块。为了减少不同医院、不同扫描批次、不同染色强度带来的影响，作者还使用 Reinhard 方法进行染色标准化，让图像颜色尽量统一。

2. 自监督深度表征学习

这一步是文章的核心。作者没有人工标注每个图块是什么组织，而是采用自监督学习，让模型自己从大量病理图像中学习形态特征。具体来说，作者对同一个图块做两种随机图像增强，然后用共享参数的 ResNet50 提取图像特征，再通过对比学习让模型学会判断“哪些图像变化后仍然属于同一类形态”。这种方法的优势是不用病理医生逐块标注，也能从海量图像中提取肿瘤细胞形态、坏死、纤维化、间质、正常组织等复杂结构信息。

3. 图块水平形态聚类

模型学习到图块特征后，作者先在图块水平得到 64 个形态聚类。这些聚类代表病理切片中不同的局部形态模式，例如肿瘤细胞密集区域、坏死区域、纤维间质区域、邻近肺组织区域等。随后作者用 t-SNE 把这些高维特征降维可视化，观察不同图块形态是否能够自然分开。这一步相当于先把整张病理切片拆成很多局部区域，再给每个局部区域分配一个形态标签。

4. GMM 聚类生成 HIPO

由于最开始得到的 64 个图块聚类可能过细，部分聚类在病理形态上很相似，所以作者进一步用高斯混合模型进行合并，最终得到 15 种组织形态表型，称为 HIPO。这些 HIPO 包括正常支气管软骨、黏膜腺体、纤维组织、邻近肺组织，以及多种肿瘤相关区域。不同 HIPO 之间在肿瘤纯度、坏死程度、纤维化程度、淋巴细胞浸润等方面存在明显差异。

5. 患者水平 HIPO 特征构建

得到 15 种 HIPO 后，作者不再只看单个图块，而是回到患者水平。对每位患者，作者统计其全切片图像中 15 种 HIPO 各自占总组织面积的比例。这样，每个患者就可以被表示成一个 15 维向量。这个向量反映的是：这个患者的肿瘤切片里，哪些形态区域更多，哪些区域更少。

6. 共识聚类定义 HIPOS 分型

作者基于患者的 HIPO 比例特征进行共识聚类，最终把小细胞肺癌患者分成两个稳定的图像亚型：HIPOS-I 和 HIPOS-II。HIPOS-I 中 HIPO7、HIPO11、HIPO12、HIPO14、HIPO15 比例更高；HIPOS-II 中 HIPO2、HIPO3、HIPO4、HIPO8、HIPO9 比例更高。简单理解，HIPOS-I 更偏向肿瘤纯度较高且免疫浸润更明显的形态，而 HIPOS-II 更偏向坏死、纤维化、间质成分和低免疫浸润的形态。

7. 生存分析和 Cox 回归

为了判断这两个图像分型是否有临床意义，作者进行了 Kaplan-Meier 生存分析和 Cox 回归分析。结果显示，HIPOS-I 患者总体生存和无病生存都明显优于 HIPOS-II 患者。更重要的是，在调整年龄、性别、吸烟、分期等临床因素后，HIPOS 分型仍然是独立预后因素。这说明它不是简单重复临床分期，而是提供了额外的预后信息。

8. HIPOS 深度学习分类模型

为了让这个分型更容易临床应用，作者又开发了一个简化版深度学习模型，用患者的 HIPO 特征直接预测其属于 HIPOS-I 还是 HIPOS-II。该模型包含全局特征提取和局部注意力机制，可以同时捕捉整体组织形态和关键形态区域。在内部测试集中，模型区分 HIPOS-I 和 HIPOS-II 的 AUC 接近 0.98，说明分类性能很高。随后在 TMUGH 和 HMUCH 两个外部队列中也验证了其预后价值。

9. SHAP 可解释性分析

为了避免模型变成“黑箱”，作者使用 SHAP 分析不同 HIPO 对模型判断的贡献。结果显示，HIPO15、HIPO7、HIPO11 等更倾向于支持 HIPOS-I；而 HIPO4、HIPO5、HIPO2 等更倾向于支持 HIPOS-II。作者还把模型关注区域映射回原始病理切片，发现模型高关注区域主要集中在肿瘤细胞、坏死、间质和免疫浸润区域，而低关注区域多为正常组织或非关键结构。这增强了模型结果的病理解释性。

10. 蛋白组学功能富集分析

作者进一步利用 129 例患者的蛋白组数据，分析 HIPOS-I 和 HIPOS-II 背后的生物学差异。结果显示，HIPOS-I 富集了干扰素反应、补体、移植排斥等免疫相关通路，提示其免疫活性更强；而 HIPOS-II 主要富集氧化磷酸化通路，提示其代谢状态可能更加异常。这说明图像分型不仅仅是形态差异，也对应真实的分子功能差异。

11. 肿瘤微环境分析

作者使用 ssGSEA 和 xCell 方法，从蛋白组数据中推断肿瘤微环境状态。结果显示，HIPOS-I 具有更高的免疫细胞浸润和更强的抗肿瘤免疫特征；HIPOS-II 则表现为免疫浸润较低，更接近“免疫冷”状态。也就是说，HIPOS-I 可能代表免疫活跃型小细胞肺癌，而 HIPOS-II 可能代表免疫抑制或免疫冷型小细胞肺癌。

12. CD45 免疫组化验证

为了验证计算分析结果，作者对 48 例患者进行了 CD45 免疫组化染色。CD45 是泛白细胞标志物，可以反映免疫细胞浸润情况。结果显示，HIPOS-I 中 CD45 表达更高，说明免疫细胞浸润确实更多。这一步把前面的蛋白组和算法推断结果，用传统病理实验进行了验证，使结论更加可靠。

结果解读

Fig.1 研究流程

作者先从三个中心收集小细胞肺癌患者的 H&E 全切片图像，再把图像切成小块输入深度学习模型。模型先在图块水平学习不同组织形态，再把相似形态合并成 HIPO，最后根据每位患者不同 HIPO 的比例，将患者分成 HIPOS-I 和 HIPOS-II 两类，并进一步比较两类患者的生存差异。

Fig.2 形态表型

模型从病理图像中先识别出 64 类局部形态特征，再通过聚类整合成 15 种 HIPO。不同 HIPO 对应不同病理结构，包括正常支气管软骨、黏膜腺体、邻近肺组织、纤维组织、坏死区域以及不同肿瘤形态区域，说明小细胞肺癌内部存在明显的组织形态异质性。

Fig.3 预后分型

作者根据每位患者 15 种 HIPO 的组成比例，把患者分成 HIPOS-I 和 HIPOS-II 两类。HIPOS-I 患者总体生存和无病生存明显更好，HIPOS-II 患者预后更差。多因素 Cox 分析后，这种图像分型仍然具有独立预后价值，而且它与传统分子分型并不完全重合，说明它提供了新的风险分层信息。

Fig.4 多中心验证

作者进一步建立了一个简化的 HIPOS 深度学习分类模型，用来自动判断患者属于 HIPOS-I 还是 HIPOS-II。模型在内部队列中分类效果很好，在天津和哈尔滨两个外部队列中也能稳定区分预后差异。HIPOS-I 患者生存更好、复发率更低，说明这个病理图像分型具有一定的跨中心稳定性。

Fig.5 模型解释

作者用 SHAP 和注意力热图解释模型为什么会做出 HIPOS-I 或 HIPOS-II 的判断。HIPOS-I 主要与肿瘤纯度较高、淋巴细胞浸润较明显的区域有关；HIPOS-II 则更多与坏死、纤维化、间质带明显、淋巴细胞浸润减少的区域有关。这说明模型并不是随意分类，而是抓住了具有病理意义的组织形态特征。

Fig.6 生物学验证

作者用蛋白组、ssGSEA、xCell 和 CD45 免疫组化进一步解释两类分型的生物学差异。HIPOS-I 富集干扰素反应、补体、抗原呈递和免疫细胞浸润，属于更“免疫热”的状态；HIPOS-II 则富集氧化磷酸化，免疫浸润更低，更接近“免疫冷”状态。这说明病理图像分型背后对应真实的免疫微环境和代谢差异。

总结

1. 作者认为，小细胞肺癌虽然一直被认为形态相对单一，但实际上在组织结构、细胞形态、坏死、纤维化和免疫浸润方面存在明显异质性。传统分子检测可以解释一部分差异，但成本高、流程复杂，也不一定能完整反映空间和形态层面的肿瘤异质性。

2.这项研究的核心价值在于，把常规 H&E 病理切片变成了可量化的数据。通过自监督深度学习，模型不需要人工逐块标注，就能从病理图像里学习小细胞肺癌的形态模式，并建立 15 种 HIPO 表型，相当于给小细胞肺癌建立了一套“数字病理形态图谱”。

3. HIPOS-I 和 HIPOS-II 的意义不只是图像上不同，更重要的是它们能区分患者预后。HIPOS-I 生存更好，HIPOS-II 生存更差，而且这种差异在多个中心都能验证，说明这个分型有较强的稳定性和临床转化潜力。

4. 作者强调，HIPOS 分型不同于传统分子分型。它与 NE/非 NE 分型、转录因子分型并不完全一致，说明病理图像可以提供分子分型之外的新信息。换句话说，H&E 图像不是简单替代分子检测，而是补充了肿瘤空间结构和微环境层面的信息。

5. 从生物学解释看，HIPOS-I 更像免疫活跃型小细胞肺癌，表现为免疫细胞浸润更多、干扰素反应更强、CD45 表达更高；HIPOS-II 更像免疫冷型小细胞肺癌，表现为纤维化、细胞异型性、坏死和氧化磷酸化增强。这也解释了为什么两类患者预后不同。

6. 文章也指出了潜在治疗启发：HIPOS-I 可能更值得关注免疫治疗相关反应，HIPOS-II 因为氧化磷酸化增强，未来可以探索代谢靶向治疗，比如 OXPHOS 抑制剂。但这些只是方向性提示，还需要后续临床队列验证。

7. 研究也有局限性。首先，这是回顾性研究，虽然做了多中心验证，但仍需要前瞻性临床研究确认；其次，作者主要结合的是 bulk 蛋白组数据，如果能加入单细胞、空间转录组或空间蛋白组，机制解释会更深入；另外，图像分析是在 5× 分辨率下完成，可能遗漏更细的细胞级特征。

8. 总体来看，这篇文章证明了一个重要思路：常规病理切片不仅能用于诊断，也能通过 AI 提取预后、微环境和生物学信息。对于小细胞肺癌这种分子分型推广困难、临床风险分层不足的肿瘤，基于 H&E 图像的深度学习分型有望成为更便宜、更容易落地的辅助工具。

文章代码

（扫码进群获取）

华哥AI科研交流群（如果二维码过期添加微信：huagesx）

论文链接：https://link.springer.com/article/10.1186/s13073-025-01526-5