乐于分享
好东西不私藏

基因编辑器的“智能导航”:AI如何帮你选出最强引导RNA

基因编辑器的“智能导航”:AI如何帮你选出最强引导RNA

如果你做过CRISPR实验,一定经历过这样的纠结:面对同一个基因,几十条gRNA该选哪一条?碱基编辑器的窗口位置是否合适?引导编辑的PBS和RTT长度如何组合?传统方法靠“试错”,效率低、成本高。如今,高通量评估技术机器学习预测模型的联姻,正在让“无脑设计”成为可能。一篇最新综述系统梳理了这一领域,让我们沿着主线看看如何“算”出最优编辑方案。

第一站:基因编辑工具箱的“烦恼”——工具越多,选择越难

CRISPR家族已从最初的SpCas9扩展到数十种Cas9变体(高保真、广PAM)、Cas12a(TTN PAM)、Cas13(靶向RNA)、碱基编辑器(CBE、ABE)和引导编辑器(PE)。每种工具在不同细胞类型、不同靶点上的效率和特异性差异巨大。更麻烦的是,引导编辑的pegRNA设计需同时优化guide序列、PBS长度(8-15 nt)和RTT长度(5-30 nt),组合爆炸式增长。如何快速从海量可能中筛选出最佳方案? 答案:用数据说话。

主线一:工具多样化 → 设计参数暴增 → 亟需高通量评估

第二站:高通量评估方法——让gRNA在芯片上“赛跑”

研究者开发了多种方法在数千至数万个靶点上并行测量编辑效率:

  • in vitro切割法:构建含随机PAM序列的DNA库,加入Cas-sgRNA,通过NGS测序确定PAM偏好。HT-PAMDA可实现上百种核酸酶的并行鉴定。

  • 表型筛选法:构建sgRNA慢病毒库,感染Cas9细胞,通过FACS分选敲除表面标记物或抗药基因的细胞,富集高效sgRNA。适用于基因必需性筛查。

  • 配对文库法(pairwise library):每个寡核苷酸同时编码sgRNA和对应的靶序列,经慢病毒整合入细胞。转染编辑器后,通过测序直接计算每个sgRNA的编辑效率。这是目前最强大的方法,已成功用于Cas9、碱基编辑器、引导编辑器的大规模评估(超10万对数据)。可同时测量编辑效率、产物纯度、PAM序列和脱靶倾向。

  • 全基因组脱靶检测:GUIDE-seq、Digenome-seq、DISCOVER-Seq+等,在活细胞或体外定位Cas9切割位点。针对碱基编辑器的EndoV-seq和PE的PE-tag也已开发。

主线二:in vitro切割 → 表型筛选 → 配对文库 → 脱靶检测,层层递进

第三站:机器学习预测模型——从“测”到“算”的飞跃

高通量实验产生的大数据(数万至数十万条gRNA-靶点对)成为训练预测模型的黄金素材。

  • Cas9活性预测:DeepSpCas9、DeepCpf1等深度卷积网络,基于靶点序列特征预测 indel 频率,泛化能力远超传统评分工具。

  • 产物预测:inDelphi、FORECast根据切割位点附近的微同源序列,预测缺失/插入的长度分布。已用于无模板修复致病突变。

  • 碱基编辑器预测:BE-HIVE、DeepBE等模型可预测C→T或A→G的效率及旁观者突变概率。甚至能为63种碱基编辑器(9种Cas变体×7种脱氨酶)推荐最佳组合。

  • 引导编辑器预测:DeepPrime(训练自33.9万pegRNA)可预测8种PE系统在7种细胞类型中1-3 bp替换的效率;PRIDICT2.0将预测范围扩至15 bp;ePRIDICT还整合了染色质可及性信息。

这些模型已在线开放(如CRISTA、DeepPrime web server),实验前先用AI算一下,效率可提升2-20倍。

主线三:大数据 → 深度学习模型 → 在线预测工具 → 理性设计

第四站:AI逆向设计——从“评估”到“创造”编辑器

不仅预测gRNA,AI还能设计全新的编辑器蛋白。生物学大语言模型Evo在百万级原核和噬菌体基因组上训练,经微调后能“生成”功能性的Cas9-sgRNA复合物,虽与SpCas9序列相似度仅73%,但体外切割活性真实。另一框架EVOLVEpro用蛋白语言模型(ESM-2)结合回归模型,仅需几轮迭代(每轮12个突变)就可将小型Cas12f和引导编辑的逆转录酶活性提升2-44倍,极大加速传统定向进化。

主线四:大语言模型 → 生成/优化编辑器 → 湿实验验证 → 迭代增强

展望:通往“一键编辑”时代

未来,随着更复杂的双pegRNA、PASTE等技术的出现,高通量评估将面临更长的合成序列和更易解偶联的挑战。但一旦突破,我们将能直接比较Cas9、碱基编辑和引导编辑在同一靶点上的表现,一键选出最优工具。AI模型将不仅预测效率,还能预测染色体大片段缺失、RNA脱靶等罕见风险。从“筛选”到“设计”,基因编辑正从经验科学迈向数据驱动的精准工程。

参考文献:Kim & Kim, Nature Reviews Bioengineering, 2025

相关阅读:
从基因打靶到精准修复:CRISPR-Cas技术如何重塑现代遗传学——一篇综述带你看懂基因编辑的技术演进、核心突破与未来方向
从细菌免疫记忆到精准基因治疗:CRISPR-Cas系统如何重塑现代医学

1.提供CRISPR基因编辑相关产品,Cas9,cas12a、cas13a以及其他分子酶产品。
2.提供基因编辑技术服务基因敲入(Knock in)、基因敲除( Knock out)、基因定点突变等服务,欢迎交流咨询。