规模效应在基因序列与蛋白质结构领域节节取胜,却在至关重要的下一代小分子药物研发中陷入停滞。
内容仅代表作者观点。 文章来源:https://x.com/SylvainGariel/status/2051711278033596423
核心摘要 行业共性规律 小分子药物研发的精准性难题 平庸成果与重磅药物的差距 AlphaFold模型的固有短板 实测数据获取难题 Sutton's bitter footnote 参考文献
“The Bitter Lesson(萨顿定律)” 是Richard Sutton 在 2019 年写的一篇非常有影响力的文章/观点。
核心思想可以概括成一句话:
长期来看,真正推动AI进步的,不是人类手工设计的复杂规则,而是“计算规模(compute)+ 通用学习方法”。
1.The Bitter Lesson已然在基因序列生物学与蛋白质结构领域应验。Evo2、AlphaFold2代/3代、ProGen3、RFdiffusion纷纷证明:融合任务固有归纳偏置的通用规模化算法,正在战胜那些精巧的人工启发式规则(hand-crafted heuristics),而且其scaling law(规模定律)表现得非常清晰。
2.该规律尚未适用于高难度靶点的小分子药物研发。这类靶点的选择性差异,仅取决于蛋白质瞬时构象中的一两个原子,对应的有效训练数据往往无从获取。
3.小分子药物是打造低成本口服、可穿透血脑屏障、作用胞内靶点药物的最优路径之一。
但当下生成式技术突破仅能预测蛋白及蛋白-配体复合物结构,无法自主设计全新小分子;分子设计属于专属领域难题,且相关数据十分稀缺。
4.AlphaFold无法弥补这一短板。蛋白质数据库收录的基本都是分子静态结构;二代、三代模型对单点突变不敏感,且倾向输出优势构象,难以解析特异性构象与三元复合物结构。
5.研发瓶颈源于实验层面,而非计算能力。绝大多数药用靶点,尚不具备训练基础大模型所需的海量实测数据,短期内也难以补齐。
6.破局之道为物理赋能人工智能:优化并加速分子动力学模拟,而非将其取代,具体包括构象系综建模、机器学习力场、闭环化学研发;目前该方向尚无获批上市药物。
2019年,理查德・萨顿提出观点:纵观七十年人工智能发展史,最终胜出的算法均依托算力与数据规模迭代优化,而非依靠人工堆砌专业知识。
国际象棋算法依托搜索取胜,围棋依靠自我对弈迭代,计算机视觉先以卷积神经网络崛起,后续视觉Transformer 模型更进一步。
每一轮技术更迭中,投入更多算力与数据的通用算法,总能超越人工定制化系统。
生命科学领域已然多处印证该规律。
基因组领域,Arc Institute的Evo2 模型依托约9万亿碱基序列训练,无需专项任务监督,便可预判跨物种基因突变带来的功能改变。
蛋白质结构领域,AlphaFold2代、3代,以及RoseTTAFold、ESMFold、Boltz、Chai等开源工具,将耗时半个世纪的结构解析工作压缩至数天即可完成。
Hassabis and Jumper凭借该成果斩获2024年诺贝尔奖;Baker也因利用相关技术设计自然界不存在的全新蛋白质,共享该奖项。曾经足以支撑博士毕业论文的研究课题,如今调用程序接口便可完成。
2025 年,Profluent公司的ProGen3模型进一步完善了蛋白模型缩放规律。模型参数量从 1.12 亿扩充至 460 亿,训练数据涵盖 1.5 万亿氨基酸片段,验证出适用于蛋白质语言模型的最优算力缩放法则。
大模型生成的蛋白序列多样性大幅提升,且表达活性与天然蛋白持平,还能构建小模型无法触及的蛋白家族。
Ali Madani表示,蛋白设计现已迈入基础大模型时代,仍有海量生物数据等待挖掘整合。
蛋白设计行业发展轨迹同理。RFdiffusion与 ProteinMPNN 让全新结合蛋白研发实现流水线化:批量生成上万候选分子,经计算筛选后选取数百个开展实验,便能得到靶向疑难靶点的皮摩尔级高亲和力结合蛋白。
这类研发工作十年前足以耗费一名博士生全部研究周期。抗体设计曾是难度最高的研发方向,如今技术也同步进阶,智源发现的Chai-2模型针对全新靶点,全新抗体结合分子筛选命中率达到两位数。
以上成果均契合萨顿定律。序列与结构领域能依托规模效应快速发展,根源在于自然界本身完成了海量实验,相关数据尽数收录于公共数据库。
DNA仅有四种碱基,可用训练片段规模达 10 的 12 次方级别;蛋白质数据库存有 20 万余个实测解析结构;蛋白序列样本更是数以百亿计,训练数据覆盖整个生物圈。
需要明确各类模型的能力边界:现有模型仅能预测结构、生成蛋白序列,均不能创制全新小分子药物。
与之相近的配体扩散生成模型、图分子生成模型、口袋定向分子设计模型,所依托的数据体量差距悬殊,目前尚无等同于蛋白质数据库的活性小分子结构库,也缺少可解析结合构象状态的标准化数据库。
针对特定靶点特定瞬时构象口袋设计小分子,是难度更高的独立课题。
候选药物需从多维度评估药效:效价(Potency)代表分子与靶点的结合紧密程度;选择性指分子精准靶向目标靶点、不误伤体内同源蛋白的能力;吸收、分布、代谢、排泄性质决定药物能否以安全剂量抵达病灶发挥药效。脱靶结合会引发副作用、毒性反应,也是临床试验失败的重要诱因。成药性缺陷甚至会导致药物尚未验证疗效便终止研发。
反观近三年蛋白类药物研发,RFdiffusion与ProteinMPNN实现全新结合蛋白规模化研发,原本耗时数年的疑难靶点皮摩尔级结合分子开发,如今数周即可完成。
抗体设计技术同步升级,Chai-2 模型零样本模式下,全新靶点抗体筛选命中率表现亮眼。
蛋白药物依靠大面积接触面,便能轻松兼顾药效与选择性,人工智能技术进一步放大了这一优势。
既然蛋白药物研发效率突飞猛进,为何仍坚持研发小分子药物?
原因在于蛋白药物无法穿透细胞膜与血脑屏障,不具备口服给药条件,生产与使用成本更是高出一个数量级。
人体诸多关键靶点,包括大部分G蛋白偶联受体、离子通道、转录因子、胞内信号蛋白,都只能依靠小分子药物作用。
美国食药监局获批药物中,约三分之一作用于G蛋白偶联受体,这类靶点也恰恰最难实现原子级精准靶向。
小分子药物研发难度不止体现在分子设计层面。
全新化学实体需要满足药代动力学、口服吸收、代谢排泄、心脏离子通道安全、药物相互作用、代谢产物性质、稳定生产工艺等多重严苛标准,单克隆抗体药物无需应对如此繁杂的限制条件。
临床淘汰数据也印证差距:一期临床阶段,蛋白药物最终获批概率约为小分子药物的两倍。仅依靠虚拟设计优化,无法抹平二者的成药差距。
小分子仅依靠少量原子和靶点产生相互作用,高难度靶点很难同时兼顾药效与选择性。
决定药效的化学作用,往往和把控选择性的作用机制截然不同,药物化学的核心难点,便是研发能同时满足两项条件的分子。分子间每一处微观相互作用,都会最终影响药物综合性能。
2026年仍有诸多遗留研发难题,数十年药物化学研究,始终无法同步攻克部分靶点的选择性、药效与成药性问题。
例如部分受体氨基酸序列高度相似,却要求药物实现百倍靶向区分效果;部分蛋白构象仅短暂存在,占比不足百分之一,需要药物精准结合该状态;还需定向作用突变蛋白,同时规避正常蛋白。这类药效差异,往往仅由靶点一两个氨基酸残基,或是药物分子少数结合位点决定。
两个实例可直观体现研发难点
1.赛诺美林与毒蕈碱受体(Xanomeline / Muscarinic receptors)
该药物搭配曲司氯铵组成复方制剂,2024年获批用于精神分裂症治疗,开辟全新作用机制。
药物对五种毒蕈碱受体结合亲和力近乎一致,却能优先作用 M1、M4 亚型,规避 M2、M3 亚型带来的副作用。该选择性机制长久以来始终未解。
2022年Ron Dror's group at Stanford联合莫纳什大学科研人员揭晓答案:选择性差异仅源于一处氨基酸残基,M4 受体中的亮氨酸在 M2 受体中替换为体积更大的苯丙氨酸,同时胞外环盐桥结构联动改变氨基酸空间姿态。
本质上仅两个原子的差异,便决定受体能否传递药物信号。唯有开展高精度模拟运算、足量采样观测跨膜结构域通道开合,才能发现这一关键机制。
2.达拉曲尼布(Daraxonrasib)、索托拉西布(Sotorasib)、阿达格拉西布(adagrasib)与 KRAS蛋白
2013年,Kevan Shokat团队发现 KRAS G12C 突变体存在隐秘的二号开关口袋,该位点在蛋白基态结构中不存在,仅在突变体短暂构象变化时显现。
基于该发现,索托拉西布、阿达格拉西布两款靶向药相继问世。仅仅一个氨基酸从半胱氨酸突变为天冬氨酸,共价结合的药物作用模式便彻底失效。同源蛋白仅单个残基差异,就需要完全不同的药物分子。
革新医药公司研发的达拉曲尼布更进一步,属于三元复合物抑制剂,借助cyclophilin A形成复合界面,可结合多种突变类型的活化态 KRAS 蛋白。
药物设计不再局限于匹配单一蛋白结构,而是打造能适配瞬时三元复合构象、同时规避同源 KRAS 亚型的分子。这类研发,聚焦药物诱导形成的全新分子界面,探究原子间微观相互作用。
当下遗留的研发课题,早已超越静态结构研究范畴,核心围绕蛋白构象状态、动态变化、差异化结合特性展开。
这款复方精神分裂症药物是近七十年来首款全新作用机制抗精神病药,不作用于传统多巴胺 D2 受体,可全面改善三类病症。
百时美施贵宝斥资 140 亿美元收购研发企业,这一切都依托两个原子差异带来的靶向选择性。
索托拉西布与阿达格拉西布虽成功获批造福患者,但疗效局限明显,患者无进展生存期仅约六个月,耐药性极易产生,且仅针对单一突变类型,无法惠及其他突变患者。
daraxonrasib突破原有技术壁垒,依托三元复合作用机制展现出众疗效。2026年4月,该药胰腺癌三期关键临床数据出炉:患者中位总生存期 13.2 个月,化疗组仅 6.7 个月,死亡风险降幅达六成。
药企股价单日大涨 41%,市值突破 270 亿美元,此前也传出默克公司拟 300 亿美元收购的消息。
针对单一突变仅能小幅提升生存期的药物,和广谱作用实现生存期翻倍的新药,代表着改良型药物与颠覆性药物的本质差距。
从分子机制来看,二者区别就在于三元复合物内部特定构象下的原子相互作用。
精准把控微观作用即可打造重磅新药,稍有偏差则只能产出价值有限的普通药物。
客观而言,AlphaFold 2 代、3 代是结构生物学领域里程碑式成果,科研团队日常研发均会使用该工具。
模型输出的单一结构,本质是训练集中低能量构象的加权平均值。但蛋白质数据库以基态结构为主,药物发挥作用的关键状态均属于小众构象:G蛋白偶联受体的激动 / 拮抗状态、KRAS 蛋白活化 / 休眠状态、瞬时显现的隐秘口袋、激酶活化环、离子通道失活形态。这些并非特殊个案,恰恰是药物研发需要靶向的核心形态。
多项研究证实模型缺陷:实验证明,部分会彻底改变蛋白折叠形态的突变,在模型预测结构中与天然蛋白毫无区别;
大规模检测上千组突变样本后发现,模型置信度评分和实验测得的蛋白稳定性变化不存在关联。
DeepMind官方资料也承认,原版模型无法识别单点氨基酸突变带来的结构改变。
相关变异预测研究也只能规避该短板,依托种群基因频率数据另行训练模型。
AlphaFold3依旧未能解决该问题。药物研发相关实测评估显示,模型解析静态蛋白-配体复合物表现优异,但无法处理大幅度构象形变;无论配体类型如何,模型都会倾向判定受体为活化状态;解析三元复合物、评估分子结合亲和力的表现均不理想。
多项研究均验证,两代模型都存在明显的 G蛋白偶联受体构象预判偏差。
业内虽衍生出多状态建模、序列筛选、模型修正等优化手段,但改善效果有限。
这类优化均需要科研人员手动标注构象信息,无法由模型自主学习识别,无法从根源解决缺陷。数据库仅收录天然折叠结构,无法还原蛋白完整热力学动态变化规律,模型只能复刻已知折叠形态。
众多核心药物靶点的关键构象,难以通过实验手段捕捉测定。
G蛋白偶联受体存在多种动态平衡构象:失活态、中间态、活化态、结合抑制蛋白态、偏向信号态,不同构象结合不同药物,启动截然不同的信号通路,实验捕获难度极大。
2012年诺贝尔化学奖部分成果,便是首次解析出活化态 G蛋白偶联受体结构。获取该结构需要多重特殊技术:蛋白热稳定突变改造、融合蛋白构建、纳米抗体修饰、脂立方相结晶等。
即便冷冻电镜技术革新推动膜蛋白结构研究,失活态受体结构解析依旧难题重重,通用纳米抗体辅助解析也仅是少数特例。
绝大多数药用靶点,无法大规模获取建模所需的真实构象数据,也不能像基因组研究一样批量扩充样本。
每类靶点、每种构象都需要单独开展复杂实验,实验流程无法并行推进,成本也难以快速下降。
不同研发项目的实验数据无法通用。针对天然KRAS蛋白的结合实验数据,无法适配结合亲环蛋白的 G12V 突变活化态;结合拮抗药物的受体晶体结构,也不能用于分析激动剂诱导产生的特异性变构口袋。
高难度研发项目均需要定制化数据集,实验精度需要识别出两个原子级别的细微差异。
这也是萨顿定律落地药物研发的核心阻碍。该理论默认数据与算力成本会呈指数级下降,但高难度小分子靶点研发的数据获取成本,无法遵循该下降趋势。
以失活态受体冷冻电镜解析为例,单个高质量结构解析耗时数月,综合成本高达数十万美金。
数百个靶点、数十种构象及对应突变体的数据累积,需要数亿资金与数年时间。实验技术虽可实现相关检测,但规模与效率达不到深度学习模型训练要求。
行业无需摒弃人工研发经验,萨顿定律核心观点依旧成立:依托算力的通用算法终将成为主流。关键在于明确算力运算的核心载体。
当下最优解法为物理赋能人工智能。在数据充足的场景运用模型学习规律,同时依托物理学通用准则约束、推演分子特性。
现阶段核心基础工具仍是分子动力学模拟。赛诺美林选择性机制研究,就依托全原子动力学模拟完成。
二十年来,David Shaw 团队依靠自研超级计算机,完成毫秒级别的受体、激酶动态模拟。
受体偏向激动效应、隐秘口袋形成等核心机制突破,均来自动力学模拟与传统结构生物学结合研究,并非单纯依靠大模型运算。
行业发展趋势并非以人工智能取代模拟技术,而是用智能算法赋能升级,让模型处理数据充足的研发环节。
具体落地方向如下:摒弃单一静态结构,构建完整构象集合,以此定位隐秘结合口袋与构象特异性靶向位点;融合量子化学精度与神经网络运算速度,搭建机器学习力场;运用主动学习与闭环化学实验,由模型自主筛选最优实验方案,也是药物研发领域类自我博弈的应用形式。
Patrick Schwab提出中肯观点:AI 药物研发的现实难题在于,仅海量生成候选分子却缺乏有效验证,无法产出临床药物。唯有紧密联动分子设计与实验验证,才能真正推动研发突破。
该发展思路并未背离萨顿定律,只是适配蛋白动态特性,而非图像、基因序列类数据。
物理学是自然科学通用准则,将物理规律融入模型,无论是直接结合模拟运算、力场能量计算,还是依托模拟数据间接训练模型,都是适配药物研发的实践路径。
客观而言,全新物理智能算法至今未产出获批药物。
赛诺美林早在九十年代就被发现,靶向选择性机制近年才得以解析;达拉曲尼布诞生依托模拟技术、药物化学与传统结构研究协同发力。
物理赋能AI技术前景广阔,但临床落地成果稀少,相关宣传难免存在夸大成分。
萨顿定律是否适用于药物研发领域?基因序列、蛋白结构、蛋白设计领域已全面印证;细胞生物学相关数据也在逐步积累完善;高难度靶点小分子研发虽契合定律核心思想,但训练数据无法取自常规实验室数据库,必须依托动力学模拟、力场能量计算、仿真观测等物理手段生成。
单纯扩增静态结构数据、开展细胞筛选实验,无法实现原子级精准靶向区分,也不能研制突变特异性药物。
关键构象的实测实验难以规模化开展,该现状短期不会改变。
未来十年药物研发的优胜方向,将贴合以下特征:依据特定靶点、构象、突变体定制专属数据;以分子动态变化作为靶向选择性的研究核心;保留分子动力学模拟的基础地位,借助人工智能提升研发效率;最终仅以获批上市药物作为评判标准。
模型跑分成绩,无法支撑巨额三期临床研发开支。
萨顿定律具备正确性,但药物研发领域的落地方式,不再是单纯堆砌数据与显卡算力,而是打造融合物理规律、动态感知、联动实验的计算分析工具,挖掘现有模型无法观测的蛋白微观特征。
若未来诞生融合序列、结构、动态构象、结合稳定性、分子亲和力多维度数据的基础大模型,能够精准预判全新构象形态、具备优秀泛化能力,物理规则约束的必要性将会降低。
蛋白序列模型已迈出相关步伐,但尚未纳入动态特征,动态层面的技术突破仍未到来,模拟与实验数据依旧是核心瓶颈。
这便是萨顿定律留下的现实缺憾,同时也是当下药物研发最具探索价值的研究方向。

• Sutton, R. The Bitter Lesson. incompleteideas.net, 2019.
• Patrick Schwab, The Bitter Lesson of AI-driven Drug Discovery, schwabpatrick.com, Sept. 2025.
• Huafeng Xu, The Bitter Lesson and Its Discontent, Medium, 2025.
• Corin Wagen, Bitter Lessons in Chemistry, corinwagen.github.io, 2023.
• Sequoia Capital, Richard Sutton's Second Bitter Lesson, Inference, 2025.
Sequence, structure and design victories
• Brixi, G. et al. Evo 2: Genome modeling and design across all domains of life. Arc Institute / bioRxiv, 2024.
• Bhatnagar, A., Ruffolo, J., Madani, A. et al. Scaling Unlocks Broader Generation and Deeper Functional Understanding of Proteins. NeurIPS 2025 Spotlight. See also Nathan Benaich, Biology has scaling laws too, Air Street Press, 2025.
• Jumper, J. et al. Highly accurate protein structure prediction with AlphaFold. Nature 596, 2021.
• Abramson, J. et al. Accurate structure prediction of biomolecular interactions with AlphaFold 3. Nature, 2024.
• Watson, J.L. et al. De novo design of protein structure and function with RFdiffusion. Nature, 2023.
• Chai Discovery, Chai-2: Zero-shot de novo antibody design, technical report, 2024.
• Baker, D. Nobel lecture materials on de novo protein design, 2024.
AlphaFold's limitations for drug discovery
• Buel, G.R. & Walters, K.J. Can AlphaFold2 predict the impact of missense mutations on structure? Nature Structural & Molecular Biology, 2022.
• Pak, M.A. et al. Using AlphaFold to predict the impact of single mutations on protein stability and function. PLOS One, 2023.
• Cheng, J. et al. Accurate proteome-wide missense variant effect prediction with AlphaMissense. Science, 2023.
• Zheng, H. et al. AlphaFold3 in Drug Discovery: A Comprehensive Assessment of Capabilities, Limitations, and Applications. bioRxiv, 2025.
• Chib, G., Mollaei, P. et al. Characterizing the Conformational States of G Protein Coupled Receptors Generated with AlphaFold. arXiv:2502.17628, 2025.
• Heo, L. & Feig, M. Multi-state modeling of G-protein coupled receptors at experimental accuracy. Proteins, 2022.
• Sala, D. et al. Biasing AlphaFold2 to predict GPCRs and kinases with user-defined functional or structural properties. Frontiers in Molecular Biosciences, 2023.
• DeepMind / EMBL-EBI, Strengths and limitations of AlphaFold 2, ebi.ac.uk training materials.
• Zhang, J. et al. MoDAFold: a strategy for predicting the structure of missense mutant protein based on AlphaFold2 and molecular dynamics. Briefings in Bioinformatics, 2024.
• Nussinov, R. et al. AlphaFold, allosteric, and orthosteric drug discovery: Ways forward. Drug Discovery Today, 2023.
• Bowman, G. et al. AlphaFold and protein folding: Not dead yet! The frontier is conformational ensembles. Annual Review of Biomedical Data Science, 2024.
• Lowe, D. Why AlphaFold won't revolutionise drug discovery. Chemistry World, 2022.
• Discngine Labs panel with Seth Harris (Genentech) and Christian Tyrchan (AstraZeneca), 2023. The xanomeline / muscarinic selectivity mechanism & Cobenfy
• Powers, A.S., Pham, V., Burger, W.A.C., ... Christopoulos, A., Thal, D.M., Valant, C., Dror, R.O. Structural basis of efficacy-driven ligand selectivity at GPCRs. Nature Chemical Biology, 2023.
• Burger, W.A.C. et al. Xanomeline displays concomitant orthosteric and allosteric binding modes at the M4 mAChR. Nature Communications, 2023.
• Bristol Myers Squibb, Cobenfy (xanomeline/trospium) prescribing information and launch materials, 2024-2025.
• Analyst coverage: William Blair, Leerink Partners, Truist, Jefferies, Stifel, Citi, GlobalData sales forecasts for Cobenfy, 2024-2025.
KRAS and mutant-selective drugging
• Ostrem, J.M., Peters, U., Sos, M.L., Wells, J.A., Shokat, K.M. K-Ras(G12C) inhibitors allosterically control GTP affinity and effector interactions. Nature, 2013.
• Canon, J. et al. (sotorasib / AMG 510), Nature, 2019.
• Hallin, J. et al. (adagrasib / MRTX849), Cancer Discovery, 2020.
• Awad, M.M. et al., Acquired Resistance to KRAS G12C Inhibition in Cancer, NEJM, 2021.
• Revolution Medicines, RASolute 302 topline press release and investor materials, April 2026. GPCR inactive state and membrane protein structural biology
• Robertson, M.J., Meyerowitz, J.G., Panova, O., Nwokonko, R., Skiniotis, G. Structure determination of inactive-state GPCRs with a universal nanobody. Nature Structural & Molecular Biology, 2022.
• Manglik, A. & Kobilka, B. The role of protein dynamics in GPCR function. Cell, 2014.
• Zhang, M. et al. GPCRs: advances in structures, mechanisms and drug discovery. Signal Transduction and Targeted Therapy, 2024.
• Dror, R.O. et al. GPCR Dynamics: Structures in Motion. Chemical Reviews, 2017.
Cell biology data and foundation models
• Kedzierska, K.Z. et al. Assessing the limits of zero-shot foundation models in single-cell biology, 2023.
• JUMP-CP Consortium; Tahoe-100M (Vevo / Arc); Recursion RxRx3 data releases.
• insitro and Daphne Koller's public talks on target discovery at scale.
Physics-informed AI and conformational ensembles
• Noe, F. et al. Boltzmann generators: sampling equilibrium states of many-body systems with deep learning. Science, 2019.
• Jing, B. et al. AlphaFlow: Generating protein ensembles from AlphaFold. ICML, 2024.
• Lewis, S. et al. BioEmu: Scalable emulation of protein equilibrium ensembles with generative deep learning. Microsoft Research / bioRxiv, 2024.
• Batatia, I. et al. MACE: Higher order equivariant message passing neural networks for fast and accurate force fields. NeurIPS, 2022.
• Shaw, D.E. and colleagues, Anton-based millisecond MD on GPCRs, kinases, and signaling proteins, 2010 to present.
Drug development and clinical attrition
• Hay, M., Thomas, D.W., Craighead, J.L., Economides, C., Rosenthal, J. Clinical development success rates for investigational drugs. Nature Biotechnology 32, 40-51, 2014.
夜雨聆风