
2026年4月30日,美国哥伦比亚大学与麻省理工学院、哈佛大学等机构的科学家团队在《科学》(Science)杂志上发表了一项突破性研究。他们利用生成式人工智能成功对大肠杆菌进行了基因工程改造,创造出一种仅需19种氨基酸(而非自然界中普遍存在的20种)就能存活的新型菌株 “Ec19”。值得关注的是,该研究由哥伦比亚大学系统生物学系的 Harris H. Wang 教授团队主导,论文第一作者为 Liu Liyuan 等人,他们通过生成式人工智能,系统性替换了大肠杆菌核糖体中的所有382个异亮氨酸,并整合了21个经重新设计的不含异亮氨酸的核糖体亚基,最终获得了这一突破性成果。
0
1自然界中,从细菌到人类,所有已知的自由生活生物都使用完全相同的20种标准氨基酸来构建蛋白质。这一保守特性是地球生命的共同基础,也引发了一个根本性的科学问题:20种氨基酸是否是生命必需的“字母表”下限? 20种氨基酸对于生命来说,是“刚好的组合”还是“进化的偶然”?目前科研界的两种探索路径,正在从不同方向试探这个问题的边界:
做减法(路径1):尝试从生命的“字母表”中删减一种氨基酸,观察细胞是否仍能存活。
做加法(路径2):为细胞增加自然界中不存在的“非天然氨基酸”(ncAAs),观察蛋白质能否获得全新功能。
Ec19正是在“做减法”路径上取得的里程碑式成果,证明生命可以基于更少的构建模块运行。
Ec19的成功并非简单的遗传替换,其关键在于利用生成式AI解决了蛋白质工程领域的核心难题——复杂蛋白的功能重构与稳定性维持。
传统的简单替换为什么会失败?科学家们最初尝试用缬氨酸或亮氨酸去取代大肠杆菌39种必需或高表达蛋白中的所有异亮氨酸,结果只有约43%的替换蛋白仍能正常行使功能。这是因为蛋白质的功能不仅取决于单个氨基酸,更依赖其精准的三维空间结构。单一的氨基酸替换,可能会引发多米诺骨牌效应,彻底改变蛋白质的折叠方式,使其失活。
AI是如何解决这一难题的?为了设计出新的蛋白质,研究团队部署了多种顶尖AI模型协同工作:
基于序列的语言模型:如ESM2和MSA Transformer,它们从海量蛋白质序列中学习规律,能够预测序列改变带来的影响。
基于结构的预测模型:如ProteinMPNN和AlphaFold2,它们能精准预测和设计蛋白质的三维结构。
通过这些AI的“智能重设计”,它们不仅找到了替换异亮氨酸的最佳方案,还能提出人类难以直觉发现的大量“补偿性突变”——即在蛋白质的其他位置引入额外变异,以补偿结构变化,维持整体稳定与功能。
为了验证这一策略的可行性,团队选择了细胞中最复杂、最保守的分子机器——核糖体(由52个蛋白质亚基和3段RNA链组成)。如果连核糖体都能被成功改造,就几乎能证明19种氨基酸的可行性。
1. 实现高成功率替换: 在AI的帮助下,团队成功使大肠杆菌核糖体中几乎所有的必需蛋白质(52种中的50种)都成功去除了异亮氨酸,且改造后的细胞适应性保持在90%以上,远超简单替换的约43%成功率。
2. 构建遗传稳定的新菌株Ec19: 最终,团队将21个经重新设计、完全不含异亮氨酸的核糖体亚基整合到一个大肠杆菌的基因组中,创造了 “Ec19”菌株。这个“半合成生命”无需任何人工辅助,能够正常生长和增殖。
3. 验证长期进化稳定性: 最关键的是,该菌株在实验室中连续培养超过450代后,其基因组保持了惊人的稳定。全基因组测序显示,没有发现任何恢复使用异亮氨酸的“倒退”突变。
这项技术从“模仿自然”迈向了 “工程化重构生命基础” 的新阶段,开辟了广阔的应用前景:
揭示生命起源: 为探究早期生命可能在更有限的生化约束下演化提供了实验依据,暗示了进化早期的生命可能依赖于更有限的构建模块。
创造全新功能: 推动产生更强的抗病毒能力、高效利用非天然氨基酸、或在工业环境中表现更稳定的“定制化”合成生物体。
推动生物安全与工业创新: 随着基因组规模建模与DNA合成技术的发展,科学家们将能通过置换氨基酸,创造出具备新特性的细胞,在生物医药、生物材料、环境治理等领域带来革新。
展示技术可及性: 该研究所用的ESM2、AlphaFold2、ProteinMPNN等均为开源或已广泛发布的AI模型,这意味着全球的科学家都可能利用类似的工具开展创新性研究。

欢迎添加小编微信 加入交流群
加好友请备注:姓名+公司+职务
同时也欢迎合成生物学及生物制造领域企业投稿~

夜雨聆风