AlphaFold 解决了很多结构问题,但药物发现⾥的许多关键变量,并不只是静态结构。它们是构象分布、结合路径、能量差异、突变体选择性、ADMET,以及这些因素在真实⽣物体系中的耦合。这背后可能需要的是physics-informed AI、MD、机器学习⼒场和闭环实验,需要让计算真正进⼊构象、能量、动⼒学和状态之中...
以下分享睿陉生科(Ridging Biotech)创始人竺立哲和吴楚浩的一篇文章,讲述了为什么小分子药物发现真正缺失的是“动力学设计能力”。
从“Sutton’s Bitter Footnote”谈起:为什么小分子药物发现真正缺失的是“动力学设计能力”
竺立哲、吴楚浩睿陉生科2026年5月16日
最近读到一篇很有深度的文章——《Sutton’s Bitter Footnote in Small Molecule Drug Discovery》。这篇文章难得地指出了一个过去几年越来越明显,但很少被系统表达的问题:
尽管大模型已经深刻改变了蛋白结构预测与序列生物学,但小分子药物发现并没有因此被真正“AI化”。我们整体是认同这个判断的。
但我们也认为文章对问题根源的理解还可以再往前走一步。因为小分子药物发现真正缺失的也许并不是“更多结构数据”,甚至不只是“更大的模型”,而是:对分子相互作用过程的计算与设计能力。
而这背后真正缺失的核心对象是:过渡态构象(Transition state Conformation)、动力学路径(Kinetic Pathways)、能垒与速率机制(Energy Barriers and Kinetic Mechanism)。
一、AI范式已经完整进入生命科学
诚如Richard Sutton在文中总结得那样,AI领域的基础共识即大规模数据与通用学习系统最终会战胜大量人工规则与专家知识,已经在过去几年走进了生命科学。
1. 序列生物学已经被大模型重塑
蛋白语言模型、多组学Foundation Model、分子生成模型正在迅速重构整个生命科学。构建于序列大数据这类生物产业内目前唯一的大数据基座之上的序列比对解析、变异预测、功能注释、多组学关联都已经进入“大规模学习时代”。
2. 蛋白结构预测也已经发生范式跃迁
同样地,AlphaFold(准确地说是AF2)的意义毋庸置疑。它解决了一个长期存在的问题: 如何从序列预测稳态结构。从科学与产业角度看,这都是一次真正的范式迁移。但并非所有人都意识到:AF2的成功也主要归源自基因序列大数据(而非功能、结构等小数据)。
二、但小分子药物发现并没有被真正解决
这也是原文最重要的洞见之一。即使今天的蛋白结构预测已经高度成熟,AI生成分子已经非常容易,但真正高质量的小分子创新药发现仍然极其困难。原因在于:小分子不仅没有序列,无法利用序列大数据,其药效、选择性和毒性,本质上也不是一个“静态结构问题”,而是药物分子及其代谢产物与人体内所有可能遇到的大分子之间发生的“动态相互作用问题”。
三、PDB更像“基态结构博物馆”
这是我们非常认同的一点。PDB中(通过结构生物学实验捕捉)记录的是系统“稳定在哪里”, AlphaFold预测的是系统“最可能稳定成什么样”;但药物真正关心的问题往往是:系统如何发生构象跃迁?为什么某些跃迁更快(或更容易)发生?哪些跃迁路径决定功能输出?哪些能垒控制活化与失活? 哪些稀有事件决定药效与选择性?换句话说:基态(稳态)结构只是动力学过程中的“快照”,而不是过程本身。
四、为什么AlphaFold没有真正补上这个缺口
因为AlphaFold本质上解决的是:“结构预测问题”,而不是 “动力学行为问题”;但生命系统不是静态对象,蛋白并不是固定形状的“锁”,小分子也不是简单插进去的“钥匙”。真正的生命体系更接近:高维、非平衡、连续涨落、动力学驱动的复杂系统。而很多真正决定药效的问题,本质上属于:稀有事件触发、构象跃迁、过渡态、动力学路径和速率竞争问题。
五、为什么“学习构象集合”仍然不够
过去几年,越来越多前沿工作开始强调:Conformational Ensemble 、Energy Landscape、Ensemble Learning 这些都是重要进步,但仍然不够。因为学习稳态构象概率分布,并不等于理解动力学行为和运动速率机制。药物设计真正需要知道的并不只是:“系统可能出现哪些状态”,而是:系统如何跨越能垒? 究竟通过哪条路径发生跃迁? 哪些路径贡献主要动力学通量? 哪些过渡态决定整体运动速率? 换句话说:真正决定药效的往往不是“状态本身”,而是“状态之间如何转变”。
六、为什么过渡态如此重要
这是传统结构生物学方法始终无法触及的问题。在分子运动过程中:一旦知道过渡态结构与能垒高度,也就知道了运动速率及其背后的原子级机制。而速率恰恰决定了很多药物最核心的性质:Kon、 Koff、 Residence Time、Activation Barrier、Signaling Bias ;这些问题本质上都属于动力学问题,而不仅仅是热力学问题。
七、为什么传统MD(分子动力学)模拟长期无法真正成为“药物设计引擎”
过去几十年,Molecular Dynamics在理论上一直被寄予厚望;但它始终没有真正改变小分子药物研发效率。原因在于:
1. 时间尺度鸿沟、稀有事件问题
很多药物与靶点互作的关键事件,如药物与靶点的结合与解离、靶点的激活等运动过程(构象跃迁),发生在:毫秒或秒级,甚至更长的时间尺度;而传统全原子MD(分子动力学)模拟计算太慢、通常能模拟的时间长度停留在微秒级;这导致MD(分子动力学)所能模拟的长度内,这些事件几乎不可能发生,属于“Rare Events(稀有事件)”。
2.过渡态与速率的预测缺乏训练数据
由于这些关键运动在有限时长的模拟中是稀有事件,可能压根就没来得及发生,导致目前很多“AI增强MD”路线事实上连最重要的过渡态真值都尚未获得,不具备学习和预测“过渡态构象、动力学能垒、路径通量”的前提条件。因此,市场上出现了一大批所谓“不以准确获得过渡态构象为目的”的“伪动力学AI工具”,它们盲目地追求扩大采样规模,在短时间内看到更多稳态,却完全忽略运动速率问题(Scale Up Sampling ≠ Solve Kinetics)。
八、小分子药物发现真正缺失的也许是“动力学设计能力”
这是我们在睿陉生科长期思考的问题,也是创业原因。我们越来越认为:小分子药物发现下一阶段真正重要的,不只是单纯的更大的模型、更多的数据、更强的结构预测;而是:是否能够对分子系统的动力学行为进行计算预测、优化与设计。这也是睿陉生科TAPS(Travelling-Salesman-based Automated Path Searching,基于旅行商的自动路径搜索算法)技术路线长期关注的问题。
九、从“结构学习”进入“动力学学习”
睿陉生科TAPS并不是传统意义上的“增强版MD”。它更接近于:面向过渡态、动力学路径与稀有事件进行显式建模。核心目标不是:“模拟更长时间”;而是:找到真正控制系统行为的动力学路径、能垒和过渡态结构。因为一旦知道:系统如何跨越能垒;哪些路径占主导;哪些过渡态控制跃迁;实际上也就逐渐接近: 速率(Kinetics)、Residence Time、Potency、Selectivity 背后的原子机制;这些都是长期困扰小分子药物研发的核心问题。
十、为什么这件事会改变药物设计
因为很多长期困难的问题本质上都是动力学问题。例如:
1. 激动剂 vs 拮抗剂:
区别往往不是:“是否结合”,而是:阻碍(减慢)还是促进(加快)激活过程的构象跃迁。
2. Potency vs Selectivity :
这是药化里最经典的问题之一。很多时候驱动Potency 的化学因素,并不是驱动 Selectivity 的因素。原因可能在于:Selectivity 很多时候来自不同靶点之间的动力学路径差异,而不仅是静态结构差异。即使两个靶点的稳态结构和其中的药物结合口袋(Binding Pocket)高度相似:它们的构象跃迁路径、过渡态结构、动力学能垒也可能完全不同。而这些差异是传统静态结构方法难以观测的。
3. Residence Time :
越来越多研究已经表明:真正决定体内效果的往往不是单纯Kd;而是 Kon 、Koff 、Residence Time ;而这些本质上也都属于动力学行为。
十一、为什么下一代AI药物发现可能会发生范式迁移
过去几年,行业主流路线是:更大的模型+ 更多的数据。但生命体系与互联网不同。互联网数据天然规模化:文本、图像、视频都可以无限生成(相对而言)。但药物发现中很多最关键的信息:过渡态、稀有事件、动力学路径、速率机制都并不会自然大量存在于公开数据集中。因此,下一阶段真正重要的问题可能不是“如何学习更多静态结构”,而是:“如何学习驱动生命系统发生跃迁的动力学机制”。
十二、Sutton’s Bitter Lesson 在小分子药物发现中的真正“脚注”
我们非常认同“The Bitter Lesson”。规模化学习、通用模型与大数据仍然是不可逆的方向。但在小分子药物发现里,它需要增加一个新的脚注:
当关键知识并不会自然出现在大规模数据中时,真正重要的也许不是单纯扩大模型规模,而是让Physics-informed AI、动力学建模、机器学习力场与闭环实验,共同进入“可设计的动力学层”。因为生命系统最终不是静态数据库,而是一个高维、非平衡、由动力学路径与稀有事件驱动的复杂系统。因此谁先真正进入这一层,谁才可能把AI药物发现从: “结构生成”、“数据拟合”、 “经验筛选 ” 推进到:“动力学设计”。而这,也许才是真正意义上的下一代生物计算。
声明:本文只代表个人观点,仅供参考。文章信息及附图、视频均整理来自于公开可获取的网络内容。限于个人理解及判读,文中信息可能有不当或不准确的地方,还请多多指正。
欢迎点击关注、转发、分享给更多感兴趣的朋友!!
夜雨聆风