点击蓝字 关注我们



投
医
问
药

Summary
空间转录组学(Spatial Transcriptomics, ST)正在深刻改变人们对肿瘤异质性的认知,但其高昂的检测成本严重制约了其在大规模生物标志物发现中的应用潜力。如何从临床常规苏木精-伊红(H&E)病理切片中低成本、可扩展地获取肿瘤微环境的空间基因表达信息,目前仍不清楚。此外,基于空间信息的乳腺癌分子亚型划分,以及能够准确预测化疗与曲妥珠单抗治疗响应的空间生物标志物,至今尚未阐明。
2026年5月8日,美国国家癌症研究所癌症数据科学实验室(Cancer Data Science Laboratory, Center for Cancer Research, National Cancer Institute)的Eldad D. Shulman与西达斯-赛奈医疗中心转化研究所(Translational Research Institute, Cedars-Sinai Medical Center)的Eytan Ruppin在《Cell》发表题为"AI-predicted spatial transcriptomics unlocks breast cancer biomarkers from pathology"(AI预测空间转录组学从病理切片中解锁乳腺癌生物标志物)的研究论文。研究团队开发了深度学习模型Path2Space,可直接从H&E病理切片预测数千个基因的空间表达,性能超越21种已有方法;应用于976例TCGA乳腺癌样本后识别出具有不同生存预后的三种空间亚型(SpatioTypes);基于空间HER2表达异质性的生物标志物(SPAND)在多个独立队列中对曲妥珠单抗治疗响应预测的AUC最高达0.83,整体性能优于或媲美传统昂贵的大规模测序方法,为大队列治疗生物标志物发现开辟了可扩展的新路径。

欢迎关注公众号/设置星标并下载原文
01
|INTRODUCTION
空间转录组学正在深刻改变人们对乳腺癌的认知,它能够在完整肿瘤组织中绘制基因表达的空间分布图谱,揭示瘤内异质性与肿瘤微环境(TME)的组织架构。近期的ST研究对空间上具有独特特征的肿瘤细胞群及基质-免疫龛进行了详细描述,其中包括与临床结局相关的巨噬细胞亚群。ST还鉴定出富含趋化因子的血管龛,这类结构可促进淋巴细胞浸润,且更高的血管密度与更佳的临床预后相关。在HER2阳性乳腺癌中,ST勾勒出T细胞与巨噬细胞之间的空间相互作用,揭示了与这些免疫龛相关的I型干扰素应答。在转移性病灶中,ST还能区分免疫排斥区域与T细胞浸润区域,以及上皮-间质转化表型,为理解肿瘤转移和治疗耐药提供了新视角。
然而,ST的临床转化潜力仍受限于其高昂的检测成本,这使得需要进行生物标志物发现与验证的大型队列研究难以开展。由于ST数据通常与苏木精-伊红(H&E)图像配对,因此从H&E切片中预测空间基因表达是一种可扩展的替代方案。深度学习应用于H&E全切片图像(WSI)已能识别细胞类型和多种分子特征,包括基因突变、整体mRNA表达水平以及甲基化模式。然而,此前从H&E图像预测空间基因表达的工作仅局限于少数基因子集,无法用于大型临床队列的生存分析和治疗响应研究。
为应对这一挑战,研究团队开发了"Path2Space"——一种从病理切片预测空间基因表达的深度学习模型,专注于乳腺癌领域,因为该癌种具有高发病率和丰富的数据资源优势。该模型在外部数据集上展现出稳健的预测性能,并能从预测的空间基因表达模式中可靠推断局部细胞类型组成。当应用于来自癌症基因组图谱(TCGA)的乳腺癌队列时,Path2Space基于预测的空间转录组聚类组成识别出三种具有预后意义的乳腺癌亚组,研究团队将这一分类框架命名为"SpatioTypes"。在四个接受曲妥珠单抗治疗的乳腺癌队列和三个接受化疗的乳腺癌队列中,Path2Space发现了空间生物标志物,并以高于或相当于实测整体肿瘤转录组的准确率预测治疗响应,且无需进行昂贵而耗时的肿瘤测序。
02
|RESULTS
研究人员构建了Path2Space深度学习框架,利用4个H&E-ST配对数据集进行训练与评估,其中训练集(Bassiouni et al.)包含56,567个匹配图像-表达数据点;模型随后应用于976例TCGA乳腺癌样本进行空间表达预测和SpatioTypes分型,以及TransNEO、PBCP、IMPRESS和Cedars-Sinai共4个治疗响应队列,建立了从常规病理切片到空间生物标志物发现的完整计算流程。

图1. 数据集与计算流程概览
研究人员在交叉验证队列中实现了中位基因Pearson相关系数(PCC)0.38,6,629个基因的PCC超过0.4;在三个独立外部验证队列(HEST、Martinez et al.、HTAN)中,中位PCC分别达到0.40、0.36和0.33;值得关注的是,4,807个基因在交叉验证和外部验证中均稳健可预测(包括CHEK2、ERBB2/HER2、CDH1等乳腺癌关键基因),且对10项癌症标志性通路均达显著富集(FDR < 0.05),证明模型具有优异的跨队列泛化能力和生物学相关性。

图2. Path2Space空间基因表达预测性能
研究人员将Path2Space与16种现有ST预测方法进行系统基准测试,在988个高变异基因上,Path2Space在交叉验证和外部验证中均以显著优势排名第一(p < 0.001);进一步扩展至全基因组14,068个基因的预测时,Path2Space同样实现了最高中位PCC(p < 0.001),综合超过21种已有方法,确立了其在该领域最优的预测性能地位。

图3. Path2Space与现有最先进ST预测模型的基准测试比较
研究人员在PanopTILs数据集(来自151例患者的1,709个感兴趣区域)上验证,Path2Space推断的癌细胞、淋巴细胞和基质细胞分类AUC分别为0.85、0.80和0.85;与HEST实测ST数据相比,Path2Space的癌细胞和基质细胞分类AUC达0.85–0.89,接近实测ST的0.93–0.94,且对淋巴细胞分类性能甚至优于实测ST(AUC 0.92–0.93 vs. 0.82),证明仅凭H&E图像即可实现准确的肿瘤微环境细胞组成推断。

图4. Path2Space预测性能与细胞类型推断能力评估
研究人员对1,096张TCGA乳腺癌切片的约670万个伪位点进行空间聚类,获得7,295个空间一致域,识别出11个空间转录组聚类和3种SpatioTypes(增殖富集型、免疫调节型、免疫静默型);在853例有生存数据的患者中,免疫调节型与免疫静默型之间的无病生存差异达到显著水平(p = 0.001),免疫静默型患者经调整年龄和肿瘤分期后危险比(HR)为2.04(p = 0.002),该分层规律在HR+、HER2+和TNBC各分子亚型中均成立,并在独立的METABRIC队列中得到验证(p = 0.01,HR = 5.45)。

图5. TCGA-BRCA中预后性肿瘤SpatioTypes的鉴定
研究人员提出空间邻域多样性(SPAND)指标量化HER2表达的空间异质性,并在4个独立曲妥珠单抗治疗队列中验证其预测效能:TransNEO(AUC = 0.80)、PBCP(AUC = 0.69)、IMPRESS(AUC = 0.72)、Cedars-Sinai(AUC = 0.83);在HER2高表达肿瘤亚组中,HER2 SPAND的预测性能远超整体RNA-seq ERBB2表达(TransNEO:0.89 vs. 0.65;PBCP:0.78 vs. 0.40),提示肿瘤组织内HER2高/低细胞的空间混合模式是决定曲妥珠单抗响应的关键空间特征。

图6. 空间表达异质性预测曲妥珠单抗响应
研究人员以11个TCGA衍生空间聚类的比例作为输入特征,在TransNEO化疗队列中训练逻辑回归模型(交叉验证AUC = 0.75),并在PBCP(AUC = 0.89)和IMPRESS(AUC = 0.74)中成功泛化;曲妥珠单抗模型在交叉验证中AUC达0.86,外部验证中分别为0.90(PBCP)、0.74(IMPRESS)和0.72(Cedars-Sinai),结合HER2 SPAND的联合模型进一步提升性能;对预测响应者的比值比分析显示,化疗OR = 3.38(p = 0.008),曲妥珠单抗OR = 2.57(p = 0.03),整体优于或媲美基于整体转录组测序的生物标志物。

图7. Path2Space基于TME组成预测化疗和曲妥珠单抗响
03
|DISCUSSION
Path2Space的开发为空间转录组学的大规模临床转化提供了一条实用且可扩展的路径。研究揭示,基于H&E图像推断的HER2空间异质性(SPAND)与曲妥珠单抗治疗响应的关联,与曲妥珠单抗通过Fc受体介导免疫细胞毒性的已知机制高度吻合——高SPAND肿瘤中HER2高/低细胞的空间混合有助于通过旁观者免疫效应影响周围HER2低细胞;而基于TCGA来源11个空间聚类构建的紧凑型肿瘤表示方式,使简单的逻辑回归模型即可直接从H&E切片预测治疗响应,凸显了空间微环境的特异性临床意义。在应用层面,Path2Space支持两大互补场景:在缺乏分子数据的大型回顾性队列中发现与临床结局相关联的空间特征,以及在常规H&E切片上实现直接的治疗响应预测,从而降低对昂贵分子检测的依赖。该研究亦坦率指出其局限性:模型目前针对Visium分辨率数据(约55 μm/spot)优化,尚不能直接推广至CosMx、Xenium等单细胞或亚细胞分辨率荧光成像平台;对低丰度细胞亚群的推断精度也因Visium分辨率内在限制而降低,这是Visium分辨率数据本身的约束,而非模型特有的缺陷。未来随着Visium HD等高分辨率训练数据的积累,Path2Space有望进一步延伸至单细胞分辨率,并推广至其他癌种和多模态空间组学平台,为大规模肿瘤生物标志物发现与精准肿瘤学开辟新的可能。

References
[1] Shulman E.D., Campagnolo E.M., Lodha R., et al. AI-predicted spatial transcriptomics unlocks breast cancer biomarkers from pathology. Cell, 189, 1–16, July 9, 2026. https://doi.org/10.1016/j.cell.2026.04.023
[2] Klughammer J., Abravanel D.L., Segerstolpe Å., et al. A multi-modal single-cell and spatial expression map of metastatic breast cancer biopsies across clinicopathological features. Nature Medicine, 2024.
[3] Hoang D.-T., Shulman E.D., Turakulov R., et al. Prediction of DNA methylation-based tumor types from histopathology in central nervous system tumors with deep learning. Nature Medicine, 2024.
[4] Coudray N., Ocampo P.S., Sakellaropoulos T., et al. Classification and mutation prediction from non-small cell lung cancer histopathology images using deep learning. Nature Medicine, 2018.
[5] Sammut S.-J., Crispin-Ortuzar M., Chin S.-F., et al. Multi-omic machine learning predictor of breast cancer therapy response. Nature, 2022.
[6] Mo C.-K., Liu J., Chen S., et al. Tumour evolution and microenvironment interactions in 2D and 3D space. Nature, 2024.
[7] Curtis C., Shah S.P., Chin S.-F., et al. The genomic and transcriptomic architecture of 2,000 breast tumours reveals novel subgroups. Nature, 2012.
[8] Hu J., Li X., Coleman K., et al. SpaGCN: Integrating gene expression, spatial location and histology to identify spatial domains and spatially variable genes by graph convolutional network. Nature Methods, 2021.
[9] Cable D.M., Murray E., Zou L.S., et al. Robust decomposition of cell type mixtures in spatial transcriptomics. Nature Biotechnology, 2022.
[10] Palla G., Fischer D.S., Regev A., and Theis F.J. Spatial components of molecular tissue biology. Nature Biotechnology, 2022.
[11] Wu S.Z., Al-Eryani G., Roden D.L., et al. A single-cell and spatially resolved atlas of human breast cancers. Nature Genetics, 2021.
往期回顾
投医问药
投医问药起源于清华大学、北京大学和中国科学院,包含投医问药分享会和投医问药俱乐部,以及与清华大学生命科学学院合办的行业大咖论坛等板块,为生物医药领域专业人士专门打造,通过小型圆桌论坛和分享会的形式,提供一个深度交流和合作的平台。俱乐部成员包括PI、博士后、博士生以及生物医药产业和金融界的专业人士。在这里,大家可以分享自己的研究成果,讨论科研转化的可能性,寻找合作伙伴和资本介入的机会。投医问药注重建立信任关系,保持公益性,为生物医药相关人士促成各类资源的精准匹配,促进科研成果、创业想法的转化和社会价值的实现。
欢迎关注投医问药,并添加小编微信号:seekmedicine,添加微信时请备注:单位/职业/姓名,如果是PI/教授、创始人、合伙人等,还请注明。

声明:本内容仅用作生物医药行业信息传播,不构成任何用药和投资建议。如需转载,请务必注明文章作者和来源。对本文有异议或投诉,请联系seekmedicine@163.com。

点赞
收藏
分享
夜雨聆风