
免疫治疗已经改变了肿瘤治疗,但一个尖锐问题一直没消失:真正获得临床响应的患者仍然只是少数。于是,研究者不只需要判断“某个患者会不会响应现有免疫治疗”,还需要系统性寻找新的免疫肿瘤靶点,绕开耐药机制,打开新的治疗入口。
Nature Machine Intelligence 这篇论文提出了 MIDAS,完整名称是 Mining Immunotherapy Drug tArgetS。它把基因互作网络、多组学患者资料、免疫细胞状态、抗原呈递、疾病关联、CRISPR 扰动等证据放进一个多模态图神经网络里,用来给基因打分:这个基因是否值得作为免疫肿瘤药物靶点?
这篇文章的亮点不只是“又做了一个模型”。更关键的是,作者把模型预测一路推进到患者来源肿瘤外植体实验中,验证了 OSM–OSMR 轴这一候选靶点对肿瘤免疫微环境的功能影响。
1. 这篇论文要解决什么问题?
传统靶点发现经常被分成两条路:一条是实验筛选,比如 CRISPR 共培养;另一条是计算整合,比如基因疾病关联、药物可成药性、表达差异分析。问题在于,免疫治疗靶点的生物学背景太复杂:它不只取决于肿瘤细胞本身,还涉及 T 细胞状态、巨噬细胞、抗原呈递、炎症通路、遗传关联、患者队列中的真实响应差异。
MIDAS 的核心想法是:既然这些证据天然构成一个互相连接的生物网络,那就不该只把每个基因看成一行特征表,而应该把基因放回图结构里,让模型同时学习“基因自身有什么证据”和“它在网络里连接着哪些生物过程”。
【图1:MIDAS 多模态图机器学习框架】

图1展示了 MIDAS 的整体思路。输入端整合了单细胞转录组、HLA peptidomics、GWAS 与疾病关联、患者多组学队列、CRISPR 肿瘤-T 细胞共培养、基因互作网络和基因调控网络。模型端使用图神经网络进行 message passing,让一个基因节点的表示可以吸收邻居节点的信息。验证端则包括时间切片靶点、临床开发靶点分层,以及免疫检查点治疗响应相关差异基因。
2. MIDAS 和普通“打分模型”有什么不同?
普通表格模型往往假设每个基因是一条独立样本;MIDAS 则利用 gene-interaction-gene network,把基因作为节点,把相互作用作为边。这样做的直觉是:免疫治疗靶点并不是孤立发挥作用的,它通常嵌在抗原呈递、TCR 信号、细胞因子、髓系免疫抑制等通路里。
论文比较了多种图神经网络结构,最终表现最好的是 MIDAS GIN。它在传统 GIN 框架上使用线性层、batch normalization、ReLU、dropout 等模块,并通过交叉验证集成来给基因输出免疫肿瘤靶点概率。
模型训练时,作者构建了已知免疫肿瘤靶点作为正例,并使用大量未标注基因作为背景。更重要的是,作者没有只在同一批标签上看交叉验证,而是设计了几个更接近真实靶点发现的问题:后来才被发现的新靶点,模型能否提前排高?已经获批的靶点是否比临床开发中的靶点得分更高?在未见过的患者队列里,模型高分基因是否更能覆盖治疗响应相关基因?
3. 模型表现:不是只赢一点点
【图2:MIDAS 在免疫肿瘤靶点发现基准上的表现】

在 held-out 基因集上,MIDAS GIN 的 ROC-AUC 高于多种替代方法,包括 OpenTargets、TargetDB、DepMap 和 CRISPR 共培养筛选。论文报告中,MIDAS GIN 与这些方法相比均达到统计显著差异。
更有意思的是时间切片验证:作者用 2017-2019 年之前可获得的标签训练模型,再看 2020-2023 年新出现的临床开发靶点。MIDAS 给这些“未来才被开发”的靶点显著更高的分数,提示模型不是简单背诵已有标签,而是在捕捉可迁移的靶点生物学。
模型还把已获批靶点排在临床试验阶段靶点之前,把临床试验阶段靶点排在未开发背景基因之前。这一点很关键,因为真正有用的靶点发现工具,应该能在“候选很多、证据不完整”的情况下给出优先级,而不是只在已知答案上表现好看。
4. 模型看到了什么生物学?
解释性分析显示,MIDAS 依赖的不只是泛泛的表达量信号。论文中排在前面的信息类别包括自身免疫、调控网络、T 细胞状态、抗原呈递、巨噬细胞和肿瘤免疫相关通路。这与免疫治疗靶点的真实机制是相符的:许多有效靶点本质上是在调节免疫系统和肿瘤微环境之间的相互作用。
在候选靶点筛选中,MIDAS 把 OSM 和 OSMR 排得非常靠前,预测概率分别为 0.966 和 0.965。OSM 属于 IL-6 细胞因子家族,主要由活化 T 细胞和巨噬细胞产生;OSMR 则可参与相关受体复合物形成,影响成纤维细胞、肿瘤细胞和髓系细胞。
【图3:OSM–OSMR 作为候选免疫治疗靶点】

图3左侧显示 OSM 和 OSMR 在候选靶点概率空间中落在很高的位置;右侧通路重要性分析显示,模型判断 OSM–OSMR 轴时高度依赖细胞因子、白细胞介素和免疫系统相关通路。这说明它不是凭一个孤立相关性把 OSM/OSMR 推上来,而是从免疫通路上下文中给出这一预测。
5. 最关键的一步:从模型预测走向功能验证
真正让这篇文章站住脚的,是作者没有停在计算预测。他们在 n = 8 个 3/4 期黑色素瘤患者来源肿瘤外植体中,用 anti-OSM 抗体阻断 OSM–OSMR 信号,并观察 T 细胞表型和细胞因子变化。
【图4:患者来源肿瘤外植体验证 anti-OSM 的功能影响】

结果显示,anti-OSM 处理后,dysfunctional CD8+ T 细胞比例下降,P = 0.00781;而 pre-dysfunctional CD8+ T 细胞没有显著变化,P = 0.933。培养液中的 CCL4 水平也下降,P = 0.0391。CCL4 与肿瘤促进型巨噬细胞相关,因此这一结果支持 OSM–OSMR 可能参与塑造免疫抑制、促肿瘤的微环境。
这并不等于 OSM–OSMR 已经成为成熟药物靶点。更准确的说法是:MIDAS 提供了一个从多模态数据中提出候选靶点的框架,而 OSM–OSMR 的外植体验证给了这个框架一个有生物学方向感的正反馈。
6. 这篇论文的启发
这篇文章的科研思路很值得借鉴:先把靶点发现问题图化,再用时间切片和临床响应数据做更接近真实世界的验证,最后用患者来源实验系统验证候选靶点的功能影响。
它也提醒我们,AI 药物发现最重要的不是“模型名字新不新”,而是证据链是否闭合:输入证据是否覆盖真实生物学,验证方式是否避免同源数据泄漏,候选结果是否能走到实验系统里,最终是否能解释肿瘤微环境中的可干预机制。
对于免疫肿瘤领域,MIDAS 的价值不只是给出一串基因排名,而是把分散的组学证据、网络结构和患者功能验证连接成一个可迭代的靶点发现流程。
论文信息
论文题目:Immunotherapy drug target identification using machine learning and patient-derived tumour explant validation
期刊:Nature Machine Intelligence
DOI:https://doi.org/10.1038/s42256-026-01201-3
作者:Marcellus Augustine, Nuno Rocha Nene, Hongchang Fu, Christopher L. Pinder, Lorena Ligammari, Alexander P. Simpson, Irene Sanz-Fernández, Krupa Thakkar, Danwen Qian, Evelyn Fitzsimons, Benjamin S. Simpson, Roberto Vendramin, Andrea Castro, Heather Niederer, Samra Turajlic, Sergio A. Quezada, Nicholas McGranahan, Chris Watkins, Charles Swanton & Kevin Litchfield
夜雨聆风