NEXT WORD | AlphaFold 4 深度拆解:当 AI 开始“幻觉”出蛋白质的动态社交圈,药物发现的死结开了吗?

Buzz words: AlphaFold4
如果你在过去几年里常在药物研发圈的茶水间出没,那你听到 AlphaFold 这个名字的频率,大概比听到自家 CEO 名字的次数还要多。2018 年,它还只是业界的一声低语;2020 年,它变成了一阵狂吼;而到 2024 年初 AlphaFold 3 问世时,它几乎被神化成了“结构生物学的终结者”。
但现在是 2026 年,行业再次触碰到了一个新的拐点。我们不再满足于看蛋白质的“证件照”了;我们正试图构建一台活生生的机器。DeepMind 的最新力作 AlphaFold 4 并非只是一个微小的版本迭代,它代表了基础逻辑的范式转移:从“这个蛋白质长什么样?”转向“这个蛋白质在做什么?”
欢迎来到《Next Word in Biotech》。今天,我们将深挖 AlphaFold 的进化史、闭门谢客的开源争议,以及为什么 Isomorphic Labs 成了目前药研圈最有趣(也最守口如瓶)的头号玩家。
一、 进京之路:从 AF1 到动态化的 AF4
要看清我们身处何方,得先看看我们踩过的废墟。药物化学一直是一场“蒙眼射箭”的游戏。我们手里有序列(单词),但关于折叠的“语法”却是个谜,往往需要耗费数年的 X 射线晶体学或冷冻电镜(cryo-EM)才能解开一个。
-
AlphaFold 1 (2018): 概念验证阶段。它证明了深度学习可以预测残基间的距离。虽然令人印象深刻,但当年的药化专家们多半只是抱着“有点意思,但我还是信我的晶体结构”这种怀疑态度。
-
AlphaFold 2 (2020): 地震时刻。这是蒙眼布被揭下的瞬间。它在单链蛋白上实现了“原子级精度”,基本解决了困扰人类 50 年的蛋白质折叠难题。如果你只想知道一个单体的形状,AF2 就是神。但生物学不是单体的小型派对,而是一个拥挤、嘈杂、混乱的社交场。
-
AlphaFold 3 (2024): 资料片升级。AF3 跨越了蛋白质,将 DNA、RNA 和配体(ligands)纳入版图。这对药物研发意义重大,因为坦白说,我们很少关心孤立的蛋白质——我们关心的是它如何咬住一个小分子,或者如何粘在一段 DNA 上。
-
AlphaFold 4 (2025/26):生成式 AI(Gen AI)的革命。之前的版本大多是“判别式”的——它们在寻找那个“最佳”的单一形状。而 AF4 是生成式的,它利用精炼的扩散引擎(Diffusion Engine)来建模构象多样性(Conformational Diversity)。
一个恰当的比喻:如果说 AF2 是汽车的高清照片,那么 AF4 就是汽车穿行在暴雨中、撞上水坑、弹出气囊的高清视频。在药物研发中,“水坑”就是结合事件(binding event),如果你不知道汽车在碰撞中如何变形,那你不是在设计安全系统——你只是在瞎猜。
二、 AlphaFold 4 的锋芒:活在“动态瞬间”
AlphaFold 4(以及它在 Isomorphic Labs 的商业孪生版本 IsoDDE)的核心优势在于处理零样本口袋发现(Zero-Shot Pocket Discovery)的能力。
在“古代”(比如 2023 年),如果你遇到了一个“隐性口袋”(cryptic pocket,即只有药物存在时才会露出的结合位点),那你基本上只能抓瞎。传统的 AI 无法发现训练数据中不存在的东西。然而,AlphaFold 4 并不只是寻找“已知”口袋。由于它理解原子间相互作用的底层物理逻辑,它可以基于物理法则“幻觉”出蛋白质的运动,从而揭示那些隐藏的位点。
“我们不再仅仅是在绘制山脉地图,我们正在预测山体滑坡。” —— 某行业峰会的金句。
AF4 的“生成式”本质意味着它可以输出多个有效状态。这对于变构抑制剂(allosteric inhibitors)的设计至关重要——这类药物结合在蛋白质的一个部位,却能改变另一个部位的形状。如果你只有一个静态的 AF2 结构,你只读了半本书;而 AF4 给了你完整的剧本。
三、 Isomorphic Labs:秘方与 IsoDDE 平台
当学术界还在折腾 AlphaFold 的“服务器版”时,真正的重头戏正在 Isomorphic Labs 的黑色玻璃幕墙后上演。
他们的 IsoDDE(Isomorphic Labs 药物设计引擎) 实际上是“打满补丁、加强版”的 AlphaFold 4,并集成了一个庞大的化学推理引擎。2026 年初,我们已经通过他们与 礼来(Eli Lilly)、诺华(Novartis) 和 强生(J&J) 的巨额合作看到了初步成果。
内部管线:从比特到药瓶
2026 年初最震撼的消息是:Isomorphic 不再仅仅是一个“软件供应商”。他们正推动内部设计的资产进入人体临床试验阶段。
-
肿瘤靶点: 据报道,他们正利用“分子胶”策略瞄准那些“不可成药”的转录因子。
-
TIM-3 的突破: Isomorphic 最近演示了 IsoDDE 如何在几秒钟内预测出 TIM-3(一种极其灵活且难以捉摸的癌症蛋白)的稳定结合态。传统方法在这上面已经挣扎了十年。
这种转变是深远的。DeepMind 不仅仅是在卖铲子,他们正在亲自盖房子。而且,他们的盖房速度让传统的研发流程看起来像是在泥潭里爬行。
四、 开源之冬:一颗难咽的苦药?
现在聊聊让学术界血压升高的部分。与名声大噪并完全开源的 AlphaFold 2 不同,AlphaFold 4 并没有开源。
DeepMind 已经转向了 AlphaFold 3 和 4 的“仅限服务器访问”模式,而全功能的 IsoDDE 则是严格的私有财产。对于生物技术的“下个词”来说,这是一个信号:AI 的“公共利益”时代已经与“股东价值最大化”时代迎头相撞。
这是个问题吗?如果你是一家没有数十亿美金背书的小型生物技术公司,答案是肯定的。你本质上是在向谷歌“租赁”智力。你无法下载模型权重,无法用你自己的私有数据(那些极其敏感的临床数据)去微调它,而且你必须遵守 AlphaFold Server 的种种限制。
五、 丛林法则:拥挤的竞争赛道
谷歌也许嗓门最大,但它并不是唯一的玩家。2026 年的竞争格局是一场三方混战:
-
开源反叛军(Chai & Boltz): 像 Chai-1r 和 Boltz-2 这样的模型是生物技术界的“Linux”。它们在保持开源的同时,准确率已逼近 AF3/AF4。对于想要保密数据、降低成本的初创企业来说,这些才是真正的香饽饽。
-
大语言模型巨头(EvolutionaryScale):ESM3 被誉为“生物界的 GPT-4”。它不只是关注结构,它把生物学当成语言。它不仅预测折叠,还能直接“写出”全新的蛋白质序列来实现特定功能(比如能吃掉塑料的酶)。
-
物理-机器学习混合派(Deep Origin): 这派人认为纯 GenAI 的“幻觉”太多了。他们的引擎(如 DODock)将 AI 的“想象力”与分子动力学、热力学的硬核物理规律结合在一起,试图以此校准 AI 的偏差。
|
平台 |
核心优势 |
商业策略 |
|
AlphaFold 4 / IsoDDE |
结合亲和力极高 |
私有化 / 巨头联姻 |
|
ESM3 |
从头功能设计 (De Novo) |
“可编程生物学”的基础模型 |
|
Chai-1r |
速度与多序列处理能力 |
开源权重 / 社区驱动 |
结语:短期悲观,长期乐观
如果你指望 AlphaFold 4 在下周二就能奇迹般地治愈癌症,你可能会失望。我们知道, 药物研发的瓶颈往往不在于结构,而在于转化率(translatability)。我们可以在屏幕上设计出完美的分子,但如果它进入人体后顺便把肝细胞也杀死了,或者五分钟内就被肾脏排掉了,那么 AI 的结构预测再准也无济于事。
然而,AlphaFold 4 终于给了我们更早发现这些失败的工具。通过建模分子的“社交生活”——它们如何运动、如何结合、如何失效——我们正迈向一个临床成功率(目前仅约 10%)可能终于开始缓慢回升的世界。
这不是旅程的终点。这只是我们终于拿到了一张同时显示了山脉和天气的地图。
夜雨聆风
