乐于分享
好东西不私藏

纯干货|用AI设计一款抗查加斯病疫苗,这篇Nature子刊把流程讲透了

纯干货|用AI设计一款抗查加斯病疫苗,这篇Nature子刊把流程讲透了

查加斯病(Chagas Disease),一种由克氏锥虫(Trypanosoma cruzi) 引起的热带传染病,每年夺走上万人生命,却长期缺乏有效疫苗。传统疫苗研发周期长、成本高、成功率低,面对高变异的寄生虫更是难上加难。

而这篇发表在 Scientific Reports 的研究,直接用计算生物学+反向疫苗学,从零到一“算”出了一款多表位亚单位疫苗,把复杂的研发流程变成了可复制的流水线。

今天就用最通俗的方式,带你读懂这篇硬核论文,看完就能复现一套AI疫苗设计全流程


一、研究背景:为什么要做这件事?

  1. 查加斯病危害极大全球约650万人感染,主要在拉美,美国南部也有流行,每年致死1–2万人。现有药物只能抑制,无法根治慢性心脏病。

  2. 传统疫苗研发卡壳

    • 克氏锥虫株型多、变异快
    • 单抗原疫苗保护力弱
    • 实验筛选慢、假阳性高
    • 真核寄生虫的疫苗算法很少
  3. 计算疫苗学迎来风口反向疫苗学、免疫信息学、机器学习、组学大数据,已经能从基因组直接预测抗原,大幅提速降本。

于是,这支跨国团队做了一件事:搭建一套全自动计算 pipeline,从锥虫蛋白质组里筛抗原、拼表位、造疫苗。


二、核心研究内容:一张图看懂整个设计流程

🔹 Figure 1 | 多表位疫苗设计总 workflow

Figure 1 疫苗设计总流程图

这是整篇文章的灵魂框架,步骤清晰到可以直接照抄:

  1. 下载锥虫基因组/蛋白质组
  2. 用 Vax‑ELAN 管道筛选候选抗原
  3. 过滤:非人体同源、低跨膜、稳定、无毒、无过敏原
  4. 预测 B细胞 / CTL / HTL 表位
  5. 加佐剂、用连接子拼接成嵌合疫苗
  6. 理化性质、结构、对接、免疫模拟验证
  7. 密码子优化→可工业化表达

一句话:从序列到疫苗,全程电脑完成。


🔹 Figure 2 | 抗原 vs 非抗原的 Pi 得分分布

Figure 2 Pi得分分布图
  • Pi = 符合理想抗原特征的概率
  • 红色=真抗原,蓝色=非抗原
  • 真抗原明显集中在高Pi区间(0.5–0.8)
  • 统计学差异显著(p<0.005) → 证明这套打分标准能有效区分好坏抗原

🔹 Figure 3 | B细胞表位筛选流程

Figure 3 B细胞表位筛选

步骤:

  1. 用BcePred预测亲水性、柔性、表面可及性
  2. VaxiJen评估抗原性
  3. IEDB做保守性分析
  4. 只保留高抗原性+100%保守的表位

🔹 Figure 4 | CTL(细胞毒性T细胞)表位筛选

Figure 4 CTL表位筛选
  1. NetCTL预测MHC-I结合
  2. 抗原性筛选
  3. 免疫原性筛选
  4. 去重叠、去低效表位 → 最终选出8条最强CTL表位。

🔹 Figure 5 | HTL(辅助性T细胞)表位筛选

Figure 5 HTL表位筛选
  1. IEDB MHC-II预测
  2. 去过敏原
  3. 去毒性
  4. 保留IFN-γ诱导能力强的表位 → 保证疫苗能激活持久的细胞免疫

🔹 Figure 6 | 最终疫苗V1的组装结构

Figure 6 疫苗V1结构

这是研究的最终成品

  • 24个表位(B+CTL+HTL)
  • 3种佐剂(β-defensin等)
  • 4种连接子(EAAAK/GGGS/AAY/KK)
  • 全长406个氨基酸,分子量42.3 kDa

结构稳定、可溶性好、无过敏原、无毒性。


🔹 Figure 7 | 疫苗二级结构预测

Figure 7 二级结构
  • 螺旋:55.2%
  • 折叠:14.0%
  • 无规卷曲:40.9% → 结构合理,适合抗体识别。

🔹 Figure 8 | 3D结构建模、优化与验证

Figure 8 3D结构与拉氏图
  • I‑TASSER建模
  • 3Drefine + GalaxyRefine优化
  • ProSA Z‑score = -2.9(合格)
  • 拉氏图:82.4%在核心区→ 模型质量非常可靠。

🔹 Figure 9 | 不连续B细胞表位预测

Figure 9 构象表位
  • 共5个构象表位,221个残基
  • 得分0.61–0.75 → 能强烈诱导体液免疫。

🔹 Figure 10 | 疫苗与TLR‑4分子对接

Figure 10 对接TLR4
  • 结合能极低:-314.02 kcal/mol
  • 与TLR-4结合稳定 → 疫苗能有效激活天然免疫。

🔹 Figure 11–12 | 密码子优化与克隆

Figure 11–12 密码子优化与载体构建
  • CAI=0.98,GC=51.8%
  • 克隆进pET‑28a(+) → 可在大肠杆菌高效表达,适合工业化生产。

🔹 Figure 13 | 免疫模拟结果

Figure 13 免疫模拟

三次免疫后:

  • IgG1、IgM大幅升高
  • 活化B细胞、CTL、HTL显著上升
  • 建立长效记忆免疫→ 计算机模拟显示保护力极强。

🔹 Figure 14 | 表位在多株锥虫中高度保守

Figure 14 保守性比对
  • 13个株系 + 4个近缘种
  • 关键表位100%保守→ 疫苗可广谱保护,不怕变异。

三、实验与分析方法:一套可复制的标准流程

我把整篇文章的方法浓缩成7步流水线,任何病原体都能用:

1. 数据准备

  • 下载NCBI基因组/蛋白质组
  • Prodigal预测ORF

2. 候选抗原筛选(Vax‑ELAN)

  • 亚细胞定位(外膜/胞外优先)
  • 跨膜螺旋≤2
  • 非人体同源(<30%相似)
  • 无肠道菌群同源
  • 稳定(不稳定指数<40)
  • 无过敏原
  • 高抗原性(VaxiJen>0.4)
  • 必需基因+毒力因子

3. 表位预测

  • B细胞:BcePred、ABCPred、BepiPred
  • CTL:NetCTL、NetMHC
  • HTL:IEDB MHC-II

4. 疫苗组装

  • 加佐剂
  • 用连接子拼接(EAAAK/GGGS/AAY/KK)

5. 理化与结构验证

  • ProtParam、Protein‑Sol
  • PSIPRED、I‑TASSER
  • 拉氏图、ProSA

6. 分子对接

  • 对接TLR‑4、HLA
  • ClusPro、HDOCK、PatchDock

7. 免疫模拟与保守性

  • C‑ImmSim
  • 多序列比对、进化距离

四、结论与展望

核心结论

  1. 成功搭建 Vax‑ELAN + Vaxi‑DL 两套计算疫苗工具
  2. 从克氏锥虫中筛出8个最优抗原
  3. 设计3个多表位疫苗,其中V1综合最优
  4. V1:可溶性好、稳定、无毒、无过敏原、保守性强、免疫模拟效果优异
  5. 可在大肠杆菌高效表达,适合产业化

未来展望

  • 开展动物实验验证安全性与保护力
  • 拓展到mRNA疫苗设计(作者已在推进)
  • 把 pipeline 通用化,支持细菌、真菌、病毒、寄生虫
  • 降低假阳性,提升机器学习精度

一句话总结:这篇文章证明:用AI和计算生物学,真的可以快速、低成本、高质量设计出安全有效的传染病疫苗。


五、论文基本信息

  • 题目:Identification of vaccine targets in pathogens and design of a vaccine using computational approaches
  • 期刊:Scientific Reports
  • DOI:10.1038/s41598-021-96863-x
  • 发表单位:
    1. Amity University Uttar Pradesh, India
    2. Baylor College of Medicine, USA
    3. Baylor University, USA

💡 小总结如果你正在做疫苗设计、免疫信息学、反向疫苗学、抗原预测、多表位疫苗,这篇论文就是一份完美的标准作业,从方法到图表到代码思路,全都可以直接借鉴。