
该文从一个看似已经被技术突破“解决”的科学问题写起:长期以来,结构生物学家需要通过X射线晶体学、冷冻电镜等复杂实验,才能解析蛋白质的三维结构。一个蛋白质结构的获得往往需要数月甚至数年,也可能消耗高昂的实验经费。与此同时,基因测序技术的发展使人类积累了数以亿计的蛋白质序列,但真正拥有实验结构的蛋白只占极小比例。也就是说,科学家知道大量蛋白“是什么序列”,却不知道它们“折叠成什么形状”。这个落差正是蛋白质折叠问题长期重要的原因。
AlphaFold2的出现改变了这一局面。2021年,DeepMind将大量AI预测的蛋白结构开放给科研界,研究者几乎在一夜之间获得了过去难以想象的大规模结构信息。CASP创始人JohnMoult在2020年对AlphaFold2评价称:“在某种意义上,蛋白质折叠的问题被解决了。”该文正是把这一事件视为一次冲击,追问AI究竟如何改变科学研究。
AlphaFold能够快速预测结构,如果按照直觉,那么基于实验的结构生物学似乎会被削弱,甚至部分失去存在价值。但该文通过Protein Data Bank的数据发现,事实并没有这么简单。AlphaFold发布之后,通过实验解析的蛋白结构数量并没有明显下降,结构生物学论文的发表也保持稳定,甚至在顶级综合期刊中仍然持续出现。这说明科学家并没有因为AI可预测结构而停止实验工作。原因在于,AlphaFold提供的是高质量预测,但实验结构仍然能够回答很多更具体的问题,例如蛋白在特定分子结合状态下的形态、在不同化学环境中的构象变化,以及某些局部氨基酸位置的精细差异。这些信息对理解蛋白功能、疾病机制和药物设计仍然非常关键。
更值得注意的是,AlphaFold在论文中呈现出的作用主要是帮助实验科学前进。过去,研究者在解析新蛋白结构时,经常需要借助已有的相似实验结构作为模板(使用分子置换方法)。如果目标蛋白没有相似结构,实验解析就会困难得多。AlphaFold出现后,AI预测结构可以作为新的起始模板,尤其对那些缺少同源实验结构的蛋白更有帮助。研究发现,在这些较难解析的蛋白中,研究者使用AlphaFold预测结构辅助分子置换的比例显著上升。由此可见,AI并没有简单压缩传统实验流程,而是进入实验流程内部,成为降低研究难度、拓展研究对象范围的工具。
论文进一步把视角从结构生物学扩展到更广泛的蛋白质研究。该文将AlphaFold发布前已有实验结构的蛋白视为对照组,将此前没有实验结构、后来由AlphaFold提供预测结构的蛋白视为处理组,比较二者在2021年之后的研究热度变化。结果显示,过去没有结构信息的蛋白,在AlphaFold之后获得了明显更多的基础研究关注,相关论文相对增长16%–25%,样本末期增幅达到约35%–40%。这些新增研究涉及蛋白功能、基因表达、疾病关联等内容。这一发现说明,结构信息曾经限制了科学家对大量蛋白的探索;当AI把补充这部分信息后,研究注意力开始从少数已知结构蛋白扩展到更广阔的蛋白空间。因此,将AlphaFold的这种影响称为类似“探照灯”的效应:它照亮了原本处在知识阴影中的研究对象。
但是,目前尚无证据显示早期药物研发活动显著向这些“被照亮”的新蛋白质转移。
为什么会这样?该文推测是:仅有结构信息是不够的。要让一个蛋白质成为药物靶点,还需要大量关于它“在疾病中扮演什么角色”的实验证据——而这些证据需要疾病机制确认、靶点验证、小分子筛选、候选化合物优化、毒理研究和临床试验等多重环节验证,这些都还得靠人来做。某一环节被AI加速,并不意味着整个科研链条会同步加速。换句话说,AI对科学的推动并不会自动转化为应用突破,AI解决了一个瓶颈,但下一个瓶颈又会随之出现。

图 一个简化的药物发现流程
—总结—
回到最开始的问题:当 AI 自动化了某项核心研究任务,会发生什么?
该文给出的答案由三个层面组成。
该文结尾谈到,“即便人工智能能在基础科研到临床应用的全流程实现大幅优化,也无法保证在中短期内实现药物获批数量的大幅增长,或是给人类健康带来跨越式提升。”
该文基于AlphaFold的分析表明,AI可以突破知识生产中的局部瓶颈,推动基础科学向过去较少被探索的方向扩展;但科学发现最终能否转化为应用成果,仍取决于整个科研流程中多环节的持续协同。
论文信息
标题:How Artificial Intelligence ShapesScience:EvidencefromAlphaFold
作者:RyanR.Hill(Northwestern Kellogg)、Carolyn Stein(UC Berkeley)
发布:NBER Working Paper No.35143,2026年4月
链接:http://www.nber.org/papers/w35143
内容整理|陈 楠 徐明训
审核 |李赫扬
编辑 |
注:本摘译使用了Claude等AI工具辅助。
夜雨聆风