
摘要概括
抗生素耐药性正在成为全球公共卫生的长期难题。传统抗生素研发周期长、失败率高,而肽类抗生素虽然具有潜力,却面临序列空间巨大、优化困难、体内稳定性和毒性难以平衡等问题。
这篇发表在 Nature Machine Intelligence 的研究提出了一个生成式人工智能框架:APEX generative optimization,简称 ApexGO。它不是简单地从数据库里“筛选”抗菌肽,也不是完全无约束地“生成”新分子,而是以已有肽序列为模板,在保持一定相似度的前提下,对其进行定向优化。
研究团队选取了10条来自“分子去灭绝”研究的远古动物来源肽作为模板,包括猛犸象、巨型地懒、已灭绝海牛等物种相关蛋白中的片段。ApexGO 以这些模板为起点,生成了100条优化肽,并全部进行了化学合成和实验验证。
结果相当亮眼:
100条优化肽中,86条对至少一种细菌表现出可检测抗菌活性; 对革兰阴性菌的优化成功率达到72%; 以实验真实结果计算,革兰阴性菌方向的命中率约为85%; 在两种小鼠鲍曼不动杆菌感染模型中,部分AI优化肽的抗感染效果优于原始模板,并可达到或接近多黏菌素B、左氧氟沙星等阳性对照抗生素的水平。
简单说,这项工作展示了一条新的抗生素研发路径:先从自然界或远古生命中找到可用骨架,再让AI在可控范围内做“定向改造”。
研究背景
抗生素耐药性,尤其是革兰阴性病原菌耐药,已经成为临床感染治疗中的棘手问题。肽类抗生素因此重新受到关注。它们通常由短氨基酸序列组成,很多可以通过破坏细菌膜、干扰细菌生理过程来发挥作用。过去几年,AI已经被用于抗生素发现。例如,深度学习模型可以从大型分子库中筛出潜在抗生素,也可以从蛋白质组中寻找“隐藏”的抗菌肽。不过,APEX本质上是一个“预测器”。它能判断一条肽好不好,但不能主动告诉你:如果想让这条肽更强,应该怎么改。
这就是 ApexGO 要解决的问题。

研究问题
这篇文章的核心问题不是“AI能不能生成抗菌肽”,而是更进一步:能不能在一个已有肽骨架上,按照实验可行的约束,定向优化出更强的抗菌肽?
这个问题很关键。
因为真实药物研发往往不是从零开始乱生成,而是先有一个“先导分子”或“模板骨架”,然后围绕它做结构优化。研究人员希望分子更有效、更安全、更稳定,同时又不能改得面目全非,否则合成难度、性质、机制和风险都会发生不可控变化。
研究方案
这项研究可以理解为一个“AI设计—化学合成—体外验证—机制分析—动物实验”的闭环。
第一步,研究人员选取了10条模板肽。这些模板来自此前“分子去灭绝”工作中挖掘出的远古生物蛋白序列,包括猛犸象、巨型地懒、已灭绝海牛等来源的肽片段。这些模板本身并不是特别强的抗菌肽,MIC大多处于中等微摩尔水平,因此有优化空间。

第二步,ApexGO使用一个基于Transformer的变分自编码器,将离散的氨基酸序列映射到连续潜在空间中。这样,原本难以直接优化的序列问题,就转化成了连续空间里的优化问题。
第三步,模型用贝叶斯优化在潜在空间中搜索。每生成一批候选肽,就由APEX预测其MIC。预测结果再反馈给优化器,指导下一轮搜索。这个过程不是一次性生成,而是不断迭代,类似“试探—评分—调整—再试探”。
第四步,研究人员设置了相似性约束:优化后的序列与模板至少保持75%相似。这一点使得ApexGO更接近真实先导化合物优化,而不是无边界生成。
第五步,团队对最终得到的100条优化肽进行了实验验证。具体包括:
对11种临床相关病原菌进行MIC测定; 圆二色谱分析二级结构; 使用NPN检测外膜通透性; 使用DiSC3-5检测细胞质膜去极化; HEK293T细胞毒性测试; 人血清蛋白酶降解稳定性测试; 两种小鼠鲍曼不动杆菌感染模型验证体内抗感染效果。

研究结论与创新点
这项研究证明,ApexGO不仅能“生成”肽,更能在已有模板基础上进行定向优化。研究团队从10条远古来源肽出发,最终筛选并实验验证了100条优化肽,其中大多数都表现出更好的抗菌活性,尤其是在革兰阴性菌方向上效果更突出。
在小鼠感染模型中,部分优化肽的抗感染效果甚至接近或达到多黏菌素B、左氧氟沙星等对照药物,说明这种“AI+实验”闭环设计具有真实的应用潜力。

点击下方链接-下载原文pdf

往期好文推荐

往期课程推荐


夜雨聆风