纯干货|用AI设计一款抗查加斯病疫苗,这篇Nature子刊把流程讲透了

而这篇发表在 Scientific Reports 的研究,直接用计算生物学+反向疫苗学,从零到一“算”出了一款多表位亚单位疫苗,把复杂的研发流程变成了可复制的流水线。
今天就用最通俗的方式,带你读懂这篇硬核论文,看完就能复现一套AI疫苗设计全流程。
一、研究背景:为什么要做这件事?
-
查加斯病危害极大全球约650万人感染,主要在拉美,美国南部也有流行,每年致死1–2万人。现有药物只能抑制,无法根治慢性心脏病。
-
传统疫苗研发卡壳
-
克氏锥虫株型多、变异快 -
单抗原疫苗保护力弱 -
实验筛选慢、假阳性高 -
真核寄生虫的疫苗算法很少 -
计算疫苗学迎来风口反向疫苗学、免疫信息学、机器学习、组学大数据,已经能从基因组直接预测抗原,大幅提速降本。
于是,这支跨国团队做了一件事:搭建一套全自动计算 pipeline,从锥虫蛋白质组里筛抗原、拼表位、造疫苗。
二、核心研究内容:一张图看懂整个设计流程
🔹 Figure 1 | 多表位疫苗设计总 workflow

这是整篇文章的灵魂框架,步骤清晰到可以直接照抄:
-
下载锥虫基因组/蛋白质组 -
用 Vax‑ELAN 管道筛选候选抗原 -
过滤:非人体同源、低跨膜、稳定、无毒、无过敏原 -
预测 B细胞 / CTL / HTL 表位 -
加佐剂、用连接子拼接成嵌合疫苗 -
理化性质、结构、对接、免疫模拟验证 -
密码子优化→可工业化表达
一句话:从序列到疫苗,全程电脑完成。
🔹 Figure 2 | 抗原 vs 非抗原的 Pi 得分分布

-
Pi = 符合理想抗原特征的概率 -
红色=真抗原,蓝色=非抗原 -
真抗原明显集中在高Pi区间(0.5–0.8) -
统计学差异显著(p<0.005) → 证明这套打分标准能有效区分好坏抗原。
🔹 Figure 3 | B细胞表位筛选流程

步骤:
-
用BcePred预测亲水性、柔性、表面可及性 -
VaxiJen评估抗原性 -
IEDB做保守性分析 -
只保留高抗原性+100%保守的表位
🔹 Figure 4 | CTL(细胞毒性T细胞)表位筛选

-
NetCTL预测MHC-I结合 -
抗原性筛选 -
免疫原性筛选 -
去重叠、去低效表位 → 最终选出8条最强CTL表位。
🔹 Figure 5 | HTL(辅助性T细胞)表位筛选

-
IEDB MHC-II预测 -
去过敏原 -
去毒性 -
保留IFN-γ诱导能力强的表位 → 保证疫苗能激活持久的细胞免疫。
🔹 Figure 6 | 最终疫苗V1的组装结构

这是研究的最终成品:
-
24个表位(B+CTL+HTL) -
3种佐剂(β-defensin等) -
4种连接子(EAAAK/GGGS/AAY/KK) -
全长406个氨基酸,分子量42.3 kDa
结构稳定、可溶性好、无过敏原、无毒性。
🔹 Figure 7 | 疫苗二级结构预测

-
螺旋:55.2% -
折叠:14.0% -
无规卷曲:40.9% → 结构合理,适合抗体识别。
🔹 Figure 8 | 3D结构建模、优化与验证

-
I‑TASSER建模 -
3Drefine + GalaxyRefine优化 -
ProSA Z‑score = -2.9(合格) -
拉氏图:82.4%在核心区→ 模型质量非常可靠。
🔹 Figure 9 | 不连续B细胞表位预测

-
共5个构象表位,221个残基 -
得分0.61–0.75 → 能强烈诱导体液免疫。
🔹 Figure 10 | 疫苗与TLR‑4分子对接

-
结合能极低:-314.02 kcal/mol -
与TLR-4结合稳定 → 疫苗能有效激活天然免疫。
🔹 Figure 11–12 | 密码子优化与克隆


-
CAI=0.98,GC=51.8% -
克隆进pET‑28a(+) → 可在大肠杆菌高效表达,适合工业化生产。
🔹 Figure 13 | 免疫模拟结果

三次免疫后:
-
IgG1、IgM大幅升高 -
活化B细胞、CTL、HTL显著上升 -
建立长效记忆免疫→ 计算机模拟显示保护力极强。
🔹 Figure 14 | 表位在多株锥虫中高度保守

-
13个株系 + 4个近缘种 -
关键表位100%保守→ 疫苗可广谱保护,不怕变异。
三、实验与分析方法:一套可复制的标准流程
我把整篇文章的方法浓缩成7步流水线,任何病原体都能用:
1. 数据准备
-
下载NCBI基因组/蛋白质组 -
Prodigal预测ORF
2. 候选抗原筛选(Vax‑ELAN)
-
亚细胞定位(外膜/胞外优先) -
跨膜螺旋≤2 -
非人体同源(<30%相似) -
无肠道菌群同源 -
稳定(不稳定指数<40) -
无过敏原 -
高抗原性(VaxiJen>0.4) -
必需基因+毒力因子
3. 表位预测
-
B细胞:BcePred、ABCPred、BepiPred -
CTL:NetCTL、NetMHC -
HTL:IEDB MHC-II
4. 疫苗组装
-
加佐剂 -
用连接子拼接(EAAAK/GGGS/AAY/KK)
5. 理化与结构验证
-
ProtParam、Protein‑Sol -
PSIPRED、I‑TASSER -
拉氏图、ProSA
6. 分子对接
-
对接TLR‑4、HLA -
ClusPro、HDOCK、PatchDock
7. 免疫模拟与保守性
-
C‑ImmSim -
多序列比对、进化距离
四、结论与展望
核心结论
-
成功搭建 Vax‑ELAN + Vaxi‑DL 两套计算疫苗工具 -
从克氏锥虫中筛出8个最优抗原 -
设计3个多表位疫苗,其中V1综合最优 -
V1:可溶性好、稳定、无毒、无过敏原、保守性强、免疫模拟效果优异 -
可在大肠杆菌高效表达,适合产业化
未来展望
-
开展动物实验验证安全性与保护力 -
拓展到mRNA疫苗设计(作者已在推进) -
把 pipeline 通用化,支持细菌、真菌、病毒、寄生虫 -
降低假阳性,提升机器学习精度
一句话总结:这篇文章证明:用AI和计算生物学,真的可以快速、低成本、高质量设计出安全有效的传染病疫苗。
五、论文基本信息
-
题目:Identification of vaccine targets in pathogens and design of a vaccine using computational approaches -
期刊:Scientific Reports -
DOI:10.1038/s41598-021-96863-x -
发表单位: -
Amity University Uttar Pradesh, India -
Baylor College of Medicine, USA -
Baylor University, USA
💡 小总结如果你正在做疫苗设计、免疫信息学、反向疫苗学、抗原预测、多表位疫苗,这篇论文就是一份完美的标准作业,从方法到图表到代码思路,全都可以直接借鉴。
夜雨聆风