🔬 Highlights · 阿里达摩院推出“灵枢细胞”(Lingshu-Cell),一种基于掩码离散扩散的生成式细胞世界模型,旨在突破单细胞分析的静态瓶颈。 · 模型核心是“基因填空”游戏,能高保真生成虚拟细胞,并精准预测细胞在基因敲除、药物刺激等未知扰动下的反应。 · 实验验证其在跨9种组织、5个物种的数据中保持优异性能,为虚拟药物筛选和个性化医疗提供了新工具。 · 该模型已开源,标志着单细胞研究从“拍照存档”向“动态模拟”的关键范式跃迁。 |
长久以来,构建一个能够像预测天气一样,动态模拟细胞状态并预判其对药物或基因改变反应的“虚拟细胞”,是生物医学研究的前沿梦想。单细胞RNA测序技术在过去十年积累了海量数据,但大多数分析仍停留在对细胞状态进行“拍照存档”的静态描述阶段,缺乏预测和模拟能力。
现有模型的局限性明显:基础模型仅学习静态表征,生成模型与单细胞数据离散、稀疏的本质不匹配,而扰动预测方法则泛化能力不足。整个领域迫切需要一个能够显式表征细胞状态、并支持条件模拟的“细胞世界模型”。
近日,阿里达摩院研究团队在预印本平台arXiv上发布了名为Lingshu-Cell(灵枢细胞)的生成式细胞世界模型。其名称源自《黄帝内经》的“灵枢”,寓意捕捉生命活动的核心机制。这一成果为虚拟细胞建模和扰动响应预测提供了全新的技术路径。

一、核心技术:从“基因填空”开始
Lingshu-Cell的核心创新在于其掩码离散扩散模型架构。该设计从单细胞数据“稀疏、离散、无序”的本质出发,进行了三项关键革新。
首先,模型将基因表达值转换为离散的“词元”。其前向过程如同逐步擦除部分基因信息,反向过程则像教AI玩“基因填空”游戏,通过迭代预测被擦除的表达值来学习细胞内部的调控规律。这种方法避免了连续扩散模型对数据的全局干扰,也无需自回归模型的固定生成顺序,完美适配单细胞数据特性。
其次,模型直接对约18000个全转录组基因进行建模,跳过了传统分析中筛选高变异基因等预处理步骤,从而保留了更完整的基因间依赖关系网络。
最后,模型通过联合嵌入技术,将细胞类型、供体身份与扰动条件(如基因敲除)编码到同一隐空间中。这使得模型能够预测从未在训练数据中出现过的“细胞身份-扰动组合”会如何改变全转录组表达,无需为每种新扰动重新训练。
二、两大核心能力验证
Lingshu-Cell通过生成虚拟细胞和预测扰动响应两大任务,证明了其作为“细胞世界模型”的价值。
1. 高保真“创造”虚拟细胞
在涵盖人类大脑皮层、心脏、肺等9种组织,以及小鼠、斑马鱼等5个物种的数据集上测试显示,模型生成的虚拟细胞具有惊人的真实性。它不仅能够准确复现实测数据的基因表达分布和细胞亚型比例,还能稳定地还原不同组织乃至不同物种特有的细胞转录组特征。定量评估指标(如皮尔逊相关系数)优于scDiffusion、scVI等现有方法。

灵枢细胞框架概述
2. 精准预测细胞“应激反应”
在预测细胞如何响应未知扰动方面,Lingshu-Cell同样表现出色。在Virtual Cell Challenge H1基准测试中,它仅用约60万个训练细胞就取得了领先性能,精准捕捉了基因扰动后全转录组的表达变化。此外,在预测人类外周血单个核细胞对90种细胞因子刺激的反应时,其预测结果与真实实验数据的吻合度远超现有方法,为个性化免疫研究提供了有力工具。

灵枢细胞准确预测细胞系对基因扰动的单细胞转录组反应

灵枢细胞准确预测外周血单个核细胞(PBMC)对细胞因子干扰的单细胞转录组反应
三、开启硅基生物医学新范式
Lingshu-Cell的成功为多个生物医学领域带来了新的可能性。其核心应用价值主要体现在三个方面:
· 虚拟数据生成:可生成稀有细胞类型或疾病状态的模拟数据,弥补实验样本不足,降低测序成本,为疾病标志物开发等提供训练资源。
· 硅基扰动筛选:在计算机中模拟药物或基因编辑对各类细胞的影响,快速初筛潜在的治疗靶点,大幅降低湿实验的周期和成本。
· 多领域赋能:加速药物发现过程,帮助揭示复杂疾病的细胞机制,并结合个人基因组数据推动个性化治疗方案的预测。
展望未来,研究团队计划整合多组学数据以构建更全面的模型,扩大预训练数据规模以提升对罕见状态的预测精度,并持续优化推理效率。目前,该模型框架已开源,为生物信息学研究者提供了一个可修改和拓展的基础,有望推动整个领域的协同创新。
总结 阿里达摩院的Lingshu-Cell模型,通过掩码离散扩散这一贴合数据本质的创新架构,实现了单细胞生物学从构建“静态图谱”到进行“动态模拟”的关键跨越。其全转录组建模、高保真生成和泛化扰动预测能力,解决了现有模型的多个核心缺陷。这不仅为药物研发和疾病研究打开了新的大门,更揭示了一个重要启示:只有从数据本身的特性出发进行模型设计,才能打破路径依赖,实现真正的技术革新。虚拟细胞的时代,正随着“灵枢”的到来而加速开启。 |
(免责声明:部分文字及图片来源于网络,仅供学习、交流使用,版权归原作者所有;如有问题请及时联系我们以做处理)
夜雨聆风