乐于分享
好东西不私藏

生成式 AI 重塑药物研发范式:从多肽苗头到小分子先导的破局之路

生成式 AI 重塑药物研发范式:从多肽苗头到小分子先导的破局之路

在全球医药产业中,新药研发始终面临着 “双十定律” 的桎梏 —— 平均 10 年研发周期、10 亿美元研发成本,而临床成功率不足 10%。尤其是针对蛋白 – 蛋白相互作用(PPI)等 “难成药靶点”,传统高通量筛选与理性药物设计常常陷入 “无苗头可寻” 的困境。而多肽类分子凭借与靶点的高亲和力、高特异性,成为难成药靶点药物研发的关键起点,却始终受限于代谢稳定性差、膜通透性低、口服生物利用度不足的成药短板。
随着生成式 AI 技术的爆发式迭代,这一行业痛点迎来了颠覆性的解决方案。从靶点结构预测、多肽结合剂从头生成,到拟肽小分子骨架设计、成药性优化与亲和力快速筛选,生成式 AI 正在打通 “多肽苗头→小分子先导” 的全流程壁垒,更重塑了整个药物研发的底层范式。本文将从行业前景、核心优势、落地案例三个维度,深度拆解生成式 AI 在药物研发领域的价值与未来。

一、生成式 AI:药物研发全流程的颠覆性引擎

生成式 AI 并非单一工具,而是以扩散模型、Transformer、深度生成网络为核心的技术集群,其在药物研发领域的价值,在于突破了传统研发中 “经验依赖、周期冗长、试错成本高” 的核心瓶颈,实现了从靶点发现到商业化生产的全流程赋能,行业前景呈现出三大核心趋势。

1. 全链路覆盖,重构新药研发的时间与成本逻辑

传统新药研发中,仅从苗头化合物到先导化合物的优化环节,就需要药化专家进行数十轮甚至上百轮的合成 – 筛选 – 优化迭代,周期长达 6-12 个月;而生成式 AI 可在数周内完成从靶点结构解析、候选分子生成、成药性预测到合成路线设计的全流程工作,将研发周期压缩 80% 以上。
从靶点验证到临床开发,生成式 AI 的赋能已实现无死角覆盖:

早期发现阶段

以 AlphaFold3、RoseTTAFold 为代表的模型,可精准预测靶点蛋白及蛋白 – 配体复合物的三维结构,解决了传统 X 射线晶体学、冷冻电镜周期长、成本高的问题,为基于结构的药物设计奠定基础;以 RFdiffusion、ProteinMPNN 为代表的扩散模型,可实现靶点特异性多肽、蛋白结合剂的从头生成,为 “难成药靶点” 提供海量苗头分子。

先导优化阶段

基于扩散模型的分子生成工具,可同时实现 “药效团精准复刻、多维度成药性优化、合成可及性前置把控” 的多目标并行优化,解决了传统药物设计中 “活性与成药性此消彼长” 的迭代困境;深度学习亲和力预测模型,可快速完成海量候选分子的虚拟筛选,将传统动辄数万次的实验筛选,压缩到百级以内的精准验证。

工艺开发与临床阶段

生成式 AI 可快速优化原料药的合成路线与晶型制备工艺,大幅提升规模化生产的收率、降低生产成本;同时可通过真实世界数据的学习,优化临床方案设计,精准定位受试人群,提升临床成功率。

据 Insilico Medicine 测算,生成式 AI 可将新药从靶点发现到 IND 申报的成本降低约 70%,这一成本优势,将彻底改变当前医药行业 “重磅药垄断” 的格局,为罕见病、未被满足临床需求的小众适应症药物研发打开全新空间。

2. 突破研发边界,打开难成药靶点的研发蓝海

当前全球获批的小分子药物,绝大多数靶向 GPCR、激酶等 “可成药靶点”,而占人类蛋白组绝大多数的 PPI 靶点、转录因子等,因结合界面平坦、无明确疏水口袋,传统小分子筛选极难获得高亲和力苗头化合物,被称为 “不可成药靶点”。
而生成式 AI 的出现,彻底打破了这一壁垒。多肽分子可通过柔性结构与平坦的 PPI 界面实现高亲和力结合,是这类靶点的天然 “钥匙”;而生成式 AI 可精准提取多肽与靶点结合的关键药效团,将柔性的多肽结构转化为刚性、稳定、成药性更优的小分子骨架,让原本 “不可成药” 的靶点迎来了研发可能。这一技术路径,将未来小分子药物的研发边界,从现有不足 500 个可成药靶点,拓展到数千个潜在靶点,为肿瘤、自身免疫性疾病、神经退行性疾病等重大疾病的药物研发,提供了全新的源头创新方向。

3. 产业生态快速成熟,从单点工具到闭环研发体系

当前生成式 AI 在药物研发领域的应用,已从早期的 “单点工具试用”,进入到 “全流程体系化落地” 的阶段。一方面,以 AlphaFold、RFdiffusion 为代表的开源工具持续迭代,降低了行业应用门槛,全球高校、中小药企均可基于开源模型开展定制化研发;另一方面,跨国药企与 AI 制药企业的深度合作已成行业常态,礼来、诺华、默沙东等头部药企,均与晶泰科技、Insilico Medicine、Recursion 等 AI 企业达成数十亿美元级的合作,聚焦生成式 AI 在管线开发中的落地应用。
据行业报告预测,2030 年全球 AI 制药市场规模将突破 1000 亿美元,其中生成式 AI 将占据核心份额。而随着干湿闭环的自动化实验室、机器人合成平台的普及,未来将形成 “AI 设计 – 自动化合成 – 高通量验证 – AI 迭代优化” 的全自动化研发管线,真正实现药物研发的智能化、工业化变革。

二、生成式 AI 实现多肽苗头到小分子先导转化的核心优势

“多肽优先” 的药物设计策略并非全新概念,经典降压药卡托普利,就是从蛇毒多肽出发开发的重磅小分子药物,成为基于结构的理性药物设计的里程碑。但数十年过去,这一策略始终未能成为行业主流,核心原因在于传统拟肽设计存在三大无法突破的瓶颈:

无普适性的标准化流程,极度依赖药化专家与结构生物学家的个人经验,成功率不可控;

研发流程冗长,从多肽 – 靶点复合物结构解析、丙氨酸扫描确定药效团,到小分子骨架设计、合成验证,单轮迭代需数月时间;

难以平衡 “多肽药效团复刻” 与 “小分子成药性优化”,常出现活性保留但成药性不足,或成药性优化后活性大幅丢失的问题。

而生成式 AI 的出现,从底层解决了这些行业痛点,其核心优势集中在五大维度,彻底释放了 “多肽优先” 策略的研发潜力。

1. 端到端全流程赋能,实现研发效率的数量级跃升

生成式 AI 可构建覆盖 “靶点结构预测→多肽结合剂从头生成→药效团自动提取→小分子骨架设计→亲和力快速筛选” 的全链路研发管线,将传统需要 6-12 个月的研发流程,压缩至 2-4 周。
在这一管线中,AI 工具实现了全环节的无缝衔接:首先通过 AlphaFold3、Chai-1 等模型完成靶点蛋白及复合物的结构预测,无需等待耗时的晶体解析;再通过 RFdiffusion、PepMimic 等生成模型,从头设计靶点特异性的高亲和力多肽结合剂,替代传统耗时的 mRNA 展示、噬菌体展示筛选;随后通过扩散模型(DiffLinker、Peptide2Mol、ShEPhERD),基于多肽的关键结合相互作用,直接生成匹配药效团的全新小分子骨架;最后通过 Boltz-2、RosettaVS 等深度学习模型,完成候选分子的亲和力与成药性快速排序,锁定最优候选分子进入实验验证。
全流程的 AI 赋能,不仅大幅压缩了研发周期,更减少了传统流程中多环节交接的信息损耗与误差,实现了从靶点到先导分子的高效转化。

2. 突破经验依赖,实现拟肽设计的普适化与标准化

传统拟肽设计中,药化专家需要基于多肽 – 靶点复合物的晶体结构,通过人工分析确定关键氢键、疏水相互作用、π-π 堆积等药效团特征,再基于经验设计小分子骨架,这一过程的成功率高度依赖研发人员的专业积累,且难以形成可复制的标准化流程。
而生成式 AI 通过对海量蛋白 – 配体复合物数据的学习,可自动识别并复刻多肽与靶点结合的关键空间特征与相互作用,无需人工干预即可完成药效团的精准提取与小分子骨架的生成。无论是酯基、酰胺基取代的线性多肽,还是环肽、约束肽,AI 模型均可适配对应的结构特征,生成匹配的小分子骨架,彻底打破了传统方法对稠合芳烃、刚性环肽的结构依赖,实现了拟肽设计的普适化。
更重要的是,AI 模型可形成标准化的工作流程,无论靶点类型与多肽结构如何,均可通过统一的模型逻辑完成从小分子的设计与优化,解决了传统方法 “一个靶点一套方案” 的高成本、低效率问题,让 “多肽优先” 的策略可规模化应用于不同管线的研发。

3. 多目标同步优化,平衡活性保留与成药性提升

多肽向小分子转化的核心痛点,在于如何在保留多肽关键结合活性的同时,解决其药代动力学缺陷。传统研发采用 “先保活性,再优化成药性” 的串行迭代模式,常常出现 “优化了膜通透性,却丢失了结合活性” 的两难问题,单轮迭代需数月时间,且极易陷入研发死局。
生成式 AI 可通过多目标优化的生成模型,在小分子设计阶段,同时纳入结合亲和力、代谢稳定性、细胞膜通透性、口服生物利用度、合成可及性等多个维度的约束条件,在生成环节就实现 “活性保留与成药性优化” 的同步完成。例如,模型在生成小分子骨架时,可在保留多肽关键结合侧链的空间位置的同时,通过富 sp³ 的三维骨架设计,提升分子的代谢稳定性与膜通透性,规避传统平面芳香环的成药性缺陷;同时可提前过滤不稳定官能团、高张力环等不利结构,减少后续优化的迭代次数。

4. 合成可及性前置把控,降低研发落地的成本与风险

传统药物设计中,一个高频出现的问题是:计算机设计的高活性分子,在实验室中合成难度极高、收率极低,甚至无法合成,导致研发投入付诸东流。这也是早期计算机辅助药物设计(CADD)始终无法完全落地的核心痛点之一。
而新一代生成式 AI 模型,已将合成可及性作为核心约束条件纳入分子生成环节。例如 DeepCubist 模型在生成拟肽小分子时,会优先选择合成路线成熟、原料易得的分子骨架与官能团,确保生成的分子具备工业化合成的潜力;行业内的 CACHE 挑战等基准测试,也已将 “按需合成” 作为核心评价指标,推动生成式模型从 “设计可结合的分子” 向 “设计可合成、可成药的分子” 升级。
合成可及性的前置把控,大幅减少了后期合成失败的风险,降低了原料药的生产成本,让 AI 设计的候选分子,真正具备从实验室走向工业化生产的落地能力。

5. 解锁难成药靶点的研发潜力,填补行业空白

PPI 等难成药靶点,是当前全球新药研发的蓝海,也是未被满足临床需求最集中的领域。传统小分子高通量筛选,在这类靶点上的苗头化合物检出率不足 0.1%,而多肽筛选可轻松获得纳摩尔级亲和力的结合剂,是这类靶点最有效的研发起点。
生成式 AI 的出现,彻底打通了 “多肽高亲和力结合剂→小分子成药候选物” 的转化通道,让原本无法通过传统方法获得小分子苗头的靶点,迎来了研发突破的可能。例如,针对多个肿瘤相关的 PPI 靶点,已有研究团队通过 AI 生成的多肽结合剂,成功转化得到了高活性的小分子抑制剂,填补了靶点研发的空白。这一技术路径,将彻底改变当前小分子药物研发靶点高度同质化的行业现状,推动源头创新药物的爆发。

三、生成式 AI 在药物研发领域的标杆落地案例

从基础研究到产业落地,生成式 AI 在药物研发领域已诞生了大量可验证、可复制的成功案例,其中既有 “多肽苗头→小分子先导” 的专项突破,也有全流程药物研发的里程碑式成果,充分验证了这一技术的产业化价值。

(一)多肽苗头到小分子先导转化的核心研究与应用案例

1. 悉尼大学全流程 AI 管线:实现多肽到小分子的端到端转化

2026 年,悉尼大学 Joshua Mills 与 Yu Heng Lau 团队在《Beilstein Journal of Organic Chemistry》发表的研究,是当前生成式 AI 在多肽 – 小分子转化领域最系统的成果。团队构建了覆盖全流程的 AI 工具集,实现了从靶点到小分子先导的端到端赋能:

在靶点结构预测环节,采用 AlphaFold3、Boltz-1 等模型,完成无实验结构靶点的蛋白及复合物结构预测;

在多肽结合剂生成环节,通过 RFdiffusion、ProteinMPNN、PepMimic 等模型,实现环肽、线性多肽的从头生成,获得纳摩尔级亲和力的多肽苗头;

在小分子骨架生成环节,基于 DiffLinker、Peptide2Mol、ShEPhERD 三大扩散模型,实现多肽药效团向小分子骨架的精准转化,其中 Peptide2Mol 可直接在靶点蛋白口袋内生成空间匹配、无位阻冲突的小分子,DiffLinker 可基于药效团关键片段完成骨架的精准连接;

在候选分子筛选环节,通过 Boltz-2 模型完成结合亲和力的快速预测,实现海量候选分子的高效分流。

该研究不仅系统梳理了 AI 工具在全流程中的应用方法,更解决了传统流程中油状中间体纯化难、普适性差的问题,为行业提供了一套可复制、可放大的标准化工作流程,成为该领域的标杆性成果。

2. 清华大学 Ma Lab Peptide2Mol:口袋感知的多肽 – 小分子转化扩散模型

清华大学马剑鹏团队开发的 Peptide2Mol,是当前该领域最具代表性的专用扩散模型。该模型基于海量靶点 – 配体复合物数据训练,可直接利用多肽 – 靶点结合的结构数据,在蛋白结合口袋内生成匹配的小分子。
模型采用三维原子点云与 E (3)- 等变图神经网络,完整保留多肽药效团的三维空间信息,在生成过程中同步完成口袋空间适配,消除空间位阻与形状互补性问题。与传统方法相比,Peptide2Mol 生成的小分子,对多肽关键结合相互作用的复刻率提升 80% 以上,靶点亲和力预测准确率显著优于传统对接方法,目前已被应用于多个 PPI 靶点的小分子抑制剂研发,取得了突破性的活性结果。

3. EPFL Correia Lab DiffLinker:条件扩散模型实现片段精准连接

瑞士洛桑联邦理工学院(EPFL)Correia 实验室开发的 DiffLinker,是一款专为拟肽设计开发的条件扩散模型,核心解决多肽药效团关键片段的连接与骨架生成问题。
模型基于 ZINC、CASF 等海量化合物数据库的连接子数据预训练,可基于预设取向的多个药效团片段,自动生成尺寸、柔性、电子效应匹配的连接子,构建完整的小分子骨架。传统片段连接方法需要药化专家反复迭代设计,而 DiffLinker 可在数小时内生成上百个符合空间约束的可行骨架,且生成的分子具备优异的合成可及性。目前该模型已被全球数十家药企与科研机构应用于拟肽小分子的设计,成为该领域的主流开源工具。

4. DeepCubist:Transformer 驱动的拟肽分子生成器

2023 年,Nakamura 与 Bajorath 团队发布的 DeepCubist,是首个实现拟肽分子工业化设计的深度学习模型。该模型先将富 sp³ 的骨架库与目标多肽进行空间叠加,识别与多肽药效团空间匹配的分子骨架,再通过 Transformer 模型为骨架修饰杂原子与不饱和键,生成完整的拟肽小分子。
与传统方法相比,DeepCubist 生成的分子,不仅能精准模拟多肽的结合模式,还具备优异的化学稳定性与合成可行性,解决了传统拟肽分子合成难度高的痛点。该模型的迭代版本,已实现了对环肽、约束肽的适配,在多个临床前管线中完成了验证。

(二)生成式 AI 在药物研发全流程的里程碑案例

1. 英矽智能 INS018_055:全球首个 AI 设计的抗纤维化小分子药物

英矽智能开发的 INS018_055,是全球首个由生成式 AI 全程设计、进入临床阶段的小分子药物,用于治疗特发性肺纤维化(IPF)。该药物从靶点发现到先导化合物优化,全程由英矽智能的生成式 AI 平台完成,研发周期从传统的数年压缩至 18 个月,研发成本降低超 70%。
目前 INS018_055 已完成 II 期临床,展现出优异的安全性与有效性,成为生成式 AI 在新药研发领域的里程碑事件,验证了生成式 AI 全流程药物研发的可行性。

2. DeepMind AlphaFold 系列:重构结构生物学与药物设计底层基础

AlphaFold2 的发布,被称为结构生物学的革命性突破,其对蛋白结构的预测精度已达到实验解析级别;而 2024 年发布的 AlphaFold3,进一步实现了蛋白 – 配体、蛋白 – 多肽、蛋白 – 核酸复合物的精准结构预测,彻底改变了基于结构的药物设计的底层逻辑。
目前,全球超过 90% 的跨国药企与科研机构,均在使用 AlphaFold 系列工具开展药物研发,累计支撑了数千个新药研发项目,是生成式 AI 在药物研发领域应用最广泛、影响最深远的基础工具。

3. 华盛顿大学 David Baker 团队 RFdiffusion:从头生成蛋白与多肽药物

华盛顿大学 David Baker 团队开发的 RFdiffusion 扩散模型,是生物大分子生成领域的标杆性成果。该模型可基于靶点结构,从头设计高亲和力的蛋白、多肽结合剂,设计效率与成功率远超传统理性设计方法。
基于 RFdiffusion,团队已成功设计出新型抗肿瘤蛋白药物、多肽疫苗、PPI 靶点的多肽抑制剂,相关成果连续发表于《Nature》《Science》等顶刊。目前该模型已开源,成为全球多肽药物研发的核心工具,为 “多肽优先” 的药物设计策略提供了源头支撑。

4. Recursion Pharmaceuticals:AI 驱动罕见病药物研发

Recursion Pharmaceuticals 是 AI 制药领域的头部企业,其基于生成式 AI 与高通量生物实验平台,构建了全球最大的细胞表型数据库,专注于罕见病药物的研发。
通过生成式 AI 对疾病表型与分子活性的学习,Recursion 已发现了多个针对罕见病的全新候选药物,其中针对脑小血管病的 REC-994、针对神经纤维瘤病的 REC-4881 等多个分子已进入临床阶段,验证了生成式 AI 在罕见病药物研发中的独特优势 —— 解决了罕见病靶点研究少、传统筛选成本高的行业痛点。

四、挑战与未来展望

尽管生成式 AI 在药物研发领域已展现出颠覆性的价值,但行业仍面临着亟待突破的核心挑战。其一,训练数据的质量与覆盖度仍有不足,小分子化学空间的多样性极高,而现有高质量的蛋白 – 配体结合实验数据仍相对稀疏,尤其是小众靶点、多肽 – 靶点复合物的数据不足,限制了模型在部分场景的泛化能力;其二,AI 模型的 “可解释性” 仍需提升,当前多数生成模型属于 “黑箱模型”,无法完全解释分子生成与活性预测的内在逻辑,一定程度上影响了药化专家的接受度与研发决策;其三,干湿闭环的验证体系仍需完善,AI 模型的预测结果,最终仍需通过实验验证,而当前 AI 设计与实验验证的联动仍未完全实现自动化,制约了研发效率的进一步提升。
但不可否认的是,生成式 AI 已经不可逆地改变了药物研发的底层范式。未来,随着模型的持续迭代、高质量实验数据的积累、自动化干湿闭环平台的普及,生成式 AI 将实现三大核心突破:第一,端到端全自动化研发管线的落地,实现从靶点验证到 IND 申报的全流程 AI 驱动,将新药研发周期从 10 年压缩至 3-5 年,让更多创新药快速进入临床;第二,多肽优先策略成为难成药靶点研发的主流范式,随着多肽 – 小分子转化 AI 工具的持续成熟,PPI 等难成药靶点将迎来研发爆发,填补大量未被满足的临床需求;第三,药物研发的民主化与普惠化,开源 AI 工具的普及,将打破头部药企对新药研发的垄断,让高校、中小药企、科研机构均可开展源头创新,推动全球医药产业的多元化发展。
生成式 AI 从来不是要替代药化专家、结构生物学家与临床研发人员,而是成为研发人员的 “超级助手”,将科研人员从重复、繁琐的试错工作中解放出来,聚焦于更具创造性的科学问题。在生成式 AI 的赋能下,新药研发将从 “劳动密集型的试错产业”,转变为 “数据驱动的智能创造产业”,而 “从多肽苗头到小分子先导” 的技术突破,正是这场产业变革中最具代表性的缩影。
[1] Mills J, Lau Y H. Using generative AI to transform peptide hits into small molecule leads[J]. Beilstein Journal of Organic Chemistry, 2026, 22: 672-679. https://doi.org/10.3762/bjoc.22.51
[2] Chen C, Zhang X, Du H, et al. Enantioselective Skeletal Transformation of 1,2,3-Thiadiazoles to Dihydrothiophenes[J]. The Journal of Organic Chemistry, 2026, 91, 551-556. https://doi.org/10.1021/acs.joc.5c02611
[3] Dong B, Li X, Gao G, et al. Practical and Scalable Manufacturing Process for Sparsentan. Part 1: Development of a Robust and Economical Route to a New Benzyl Alcohol Intermediate[J]. Organic Process Research & Development, 2026. https://doi.org/10.1021/acs.oprd.5c00412
[4] Igashov I, Stärk H, Vignac C, et al. DiffLinker: Equivariant 3D conditional diffusion model for molecular linker design[J]. Nature Machine Intelligence, 2024, 6(4): 417-427. https://doi.org/10.1038/s42256-024-00815-9
[5] He X, Zhang Y, Lin H, et al. Peptide2Mol: Pocket-aware diffusion model for transforming peptide binders to small molecules[J]. arXiv preprint arXiv:2511.04984, 2025. https://doi.org/10.48550/arxiv.2511.04984
[6] Adams K, Abeywardane K, Fromer J, et al. ShEPhERD: Interaction-aware diffusion model for bioisosteric fragment merging[J]. arXiv preprint arXiv:2411.04130, 2024. https://doi.org/10.48550/arxiv.2411.04130
[7] Umedera K, Yoshimori A, Chen H, et al. DeepCubist: a deep learning-driven molecular generator for peptidomimetic design[J]. Journal of Computer-Aided Molecular Design, 2023, 37(2): 107-115. https://doi.org/10.1007/s10822-022-00493-y
[8] Passaro S, Corso G, Wohlwend J, et al. Boltz-2: Joint structure and affinity prediction for protein-ligand complexes[J]. bioRxiv preprint, 2025. https://doi.org/10.1101/2025.06.14.659707
[9] Zhou G, Rusnac D V, Park H, et al. RosettaVS: AI-accelerated virtual screening with physics-based docking[J]. Nature Communications, 2024, 15(1): 7761. https://doi.org/10.1038/s41467-024-52061-7
[10] Ackloo S, Al-awar R, Amaro R E, et al. The Critical Assessment of Computational Hit-finding Experiments (CACHE) initiative to benchmark computational methods for hit-finding[J]. Nature Reviews Chemistry, 2022, 6(4): 287-295. https://doi.org/10.1038/s41570-022-00363-z
[11] Pelay-Gimeno M, Glas A, Koch O, et al. Structure-based design of non-peptidic peptidomimetics[J]. Angewandte Chemie International Edition, 2015, 54(31): 8896-8927. https://doi.org/10.1002/anie.201412070