科学的第五范式:AI不再只是工具,它想当科学家

从望远镜到GPT-5：人类做科学的方式正在经历第五次革命

2024年10月，诺贝尔物理学奖和化学奖同时颁给了AI研究者。物理学奖给了Hopfield和Hinton——两位获奖者的专业分别是分子生物学和计算机科学，没有一个是物理学家。化学奖给了DeepMind的Hassabis和Jumper——因为他们用AI预测了蛋白质结构。

ACM主席Yannis Ioannidis在《Communications of the ACM》上写了一篇社论，标题直截了当：《第五范式：AI驱动的科学发现》。他说，这两个诺贝尔奖把计算和AI推到了科学发现的核心位置，甚至作为工具本身就配得上最高荣誉。

他还扔出一个挑衅性的问题：如果AI写的论文经过人类专家评审后被认为“正确、新颖、有趣”，我们有什么理由拒绝它？AI能不能最终成为人类研究者的同等伙伴？

要理解这个问题的重量，我们得先回头看看：人类到底是怎么做科学的？答案是——换过四次方式了，现在可能正在换第五次。

五次范式跃迁：从用眼睛看到让AI想

科学史上的范式演进，有一种优雅的递进逻辑：

第一范式是实验科学，靠观察和归纳——伽利略举起望远镜，回答的是“发生了什么”。人类做了几千年。

第二范式是理论科学，靠数学模型——牛顿写下F=ma，回答的是“为什么会发生”。人类做了几百年。

第三范式是计算科学，靠计算机模拟——曼哈顿计划中用数值方法模拟核反应，回答的是“如果……会发生什么”。人类做了几十年。

第四范式是数据密集型科学，靠大数据挖掘——这个概念由微软传奇科学家Jim Gray在2007年提出（他后来在一次独自出海中失踪，再未被找到）。Gray认为，科学正进入一个数据洪流的时代：实验和模拟产生的数据量已经远超人脑的处理能力，需要数据库、机器学习和数据挖掘工具来从中寻找规律。回答的是“数据告诉我们什么”。人类做了大约十五年。

然后就是现在。

第五范式：AI驱动的科学——AI不再只是帮人类处理数据的工具，而是深度融入科研全流程，自主生成假设、设计实验、分析结果、迭代发现。回答的是“AI能自主发现什么”。

把这五次跃迁摊开看，逻辑一目了然：

范式	名称	核心方法	关键工具	回答的问题	人类做了多久
第一范式	实验科学	观察、实验、归纳	感官、望远镜、显微镜	发生了什么？	几千年
第二范式	理论科学	数学建模与推导	纸、笔、数学公式	为什么会发生？	几百年
第三范式	计算科学	计算机模拟与数值计算	计算机、超算、仿真软件	如果……会怎样？	几十年
第四范式	数据密集型科学	海量数据挖掘与分析	数据库、机器学习、数据挖掘	数据里藏着什么规律？	约十五年
第五范式	AI驱动的科学	AI全流程融入：自主假设、实验、发现	深度学习、科学大模型、自动化实验室	AI能自主发现什么？	正在发生

注意最后一列的加速度：从千年到百年到十年——每次范式转型的间隔都在急剧缩短。而第五范式的关键词不是“AI帮人类发现了什么”，而是“AI自主发现了什么”。这个区别，就是它和第四范式的分界线。

第五范式到底在说什么？三个层次

“第五范式”这个概念听起来很大，但拆开来看，其实有三个递进的层次，从温和到激进：

第一层：AI作为超级加速器。这是目前已经在发生的事情。AlphaFold预测了几乎所有已知的两亿种蛋白质结构，解决了一个困扰了结构生物学家50年的老问题。全世界190个国家的200多万科学家正在使用它。这不是炒作，这是诺贝尔奖级别的实锤。

微软研究院AI4Science团队的负责人Chris Bishop给过一组震撼的数字：仅小分子药物候选空间就有10的60次方个可能——这是一个天文数字的天文数字。而稳定材料的总数大约是10的180次方，相当于已知宇宙原子数的平方。人类穷尽所有实验室、穷尽所有时间，也不可能遍历这个搜索空间。只有AI能在这种规模上工作。

第二层：AI作为研究伙伴（Agentic Science）。AI不仅加速计算，还开始参与科研的“上游”环节——提出假设、设计实验方案、决定下一步该做什么。2026年2月，OpenAI和Ginkgo Bioworks发布了一个标志性案例：他们把GPT-5连接到Ginkgo的自动化云实验室，让AI自主设计、执行和分析细胞无体系蛋白质合成（CFPS）实验。六轮迭代，超过36,000个反应条件，最终将蛋白质生产成本降低了40%——从每克698美元降到422美元。整个过程中，人类的参与基本限于试剂准备和设备监督。

这个案例的意义不在于40%这个数字本身，而在于它展示的工作模式：AI提出假设→自动实验室执行→数据返回→AI分析并修正假设→再执行。一个完整的科学发现闭环，人类退到了“目标设定者”和“质量把关者”的位置。

第三层：AI作为自主科学家。这是最激进的想象——AI不仅能在人类设定的框架内优化，还能自主提出新的研究方向和目标。2025年的一篇arXiv论文提出了"Agent for Science（Agent4S）"的概念，并给出了一个五级分类路线图：从L1（单一子任务自动化，比如文献检索）到L5（完全自主的、可协作的“AI科学家”）。论文的作者认为，只有到了Agent4S阶段，才算是“真正的第五范式”。

谁在兴奋？顶级玩家们的态度

对第五范式最兴奋的，毫不意外，是那些已经尝到甜头的人。

Demis Hassabis（DeepMind CEO，2024年诺贝尔化学奖得主）的表述最宏大。他预测在未来10到15年内，人类将进入“一个全新的发现黄金时代——一种新的文艺复兴”。他把DeepMind的使命概括成一个优雅的两步走：“第一步，解决智能问题；第二步，用它解决其他所有问题。”他称AI是描述生物学的“完美语言”，并通过旗下的Isomorphic Labs把药物发现从湿实验室搬到计算机模拟，声称这能让药物开发效率提升一千倍。

Max Welling（微软研究院AI4Science杰出科学家，师从诺贝尔物理学奖得主Gerard 't Hooft）在NeurIPS 2022的邀请报告中明确将AI4Science定义为“科学发现的第五范式”。他后来在一次问答中解释了这背后的逻辑：前四个范式——实验、理论、计算机模拟、大数据——现在可以被AI串联起来。计算机模拟生成的数据可以作为伪数据来训练机器学习模型，而训练好的模型又能反过来加速下一轮模拟。这种闭环是之前任何范式都做不到的。

2025年6月，《PLOS Biology》上的一篇观点文章用了一个绝妙的比喻来定义人机关系：

“AI就像我们雇了一个超级上进、疯狂热情的实习生——工作速度超人，永不睡觉，如饥似渴地吞噬数据。它潜力惊人，但如果没有扎根于科学知识的正确引导，它更可能把实验室烧了，而不是推动科学进步。”

这个比喻精准地捕捉了当前第五范式的核心张力：能力极强，但判断力存疑。

谁在泼冷水？来自一线的反思

如果只听兴奋的声音，你会以为科学革命已经完成了。但真实的画面要复杂得多。

最有说服力的亲历反思来自一位普林斯顿的物理学博士Nick McGreivy。2018年，他还是等离子物理方向的二年级博士生，被AI的热潮吸引，转而研究用深度学习求解偏微分方程（PDE）——这在当时被Yann LeCun称为“确实很热的方向”。

数十篇论文声称AI方法比传统数值方法快上千倍，甚至百万倍。但当McGreivy真正上手复现时，发现事情不对：很多论文的对比方法有问题——不是AI跑得快了，而是传统方法的参数没调好。他后来在Nature Machine Intelligence上发表了论文，在同等条件下对比后发现，AI相对于成熟数值方法的优势基本消失了。

他在2025年5月的长文中总结了三个系统性问题：

第一，科学家涌向AI更多是因为对自身职业有利，而非对科学有利。用AI的科学家发论文更多、引用更高、拿资助更容易——这些激励结构驱动着采用率暴增，但并不等于科学本身在加速进步。

第二，幸存者偏差严重。AI研究几乎不发表负面结果。你在期刊上看到的都是成功案例，但失败案例被系统性地隐藏了。

第三，已发表的正面结果普遍过于乐观。除了McGreivy自己发现的PDE问题，DeepMind自身也有翻车案例：2023年声称发现了220万个新晶体结构，号称“人类已知稳定材料的数量级扩展”。结果材料科学家分析后发现基本是“垃圾”——这些化合物要么不稳定，要么早已已知。学者们礼貌但坚定地指出，这篇论文“并未报告任何新材料”。

McGreivy还指出了一个容易被忽视的利益冲突：关于AI加速科学的叙事，大多来自AI公司或从中获益的研究者。NVIDIA的CEO黄仁勋声称“AI将把科学加速百万倍”——考虑到NVIDIA的GPU生意，这种说法的客观性值得打个问号。

最深刻的警告：AI让个人更强，但让科学更窄

2026年1月，清华大学电子工程系徐丰力、李勇团队联合芝加哥大学James Evans教授在Nature上发表了一项重磅研究。他们分析了横跨45年的4130万篇科研论文，发现了一个令人不安的悖论：

AI让个人科学家更强了，但让科学整体变窄了。

具体数字：使用AI的科学家平均多发3.02倍的论文，多获得4.84倍的引用，比不用AI的同行早1.37年成为课题负责人。这些个人收益是实打实的。

但集体层面呢？AI驱动的研究在所有领域都聚焦到了更窄的主题范围上，知识广度收缩了4.63%，科学家之间的跨界互动减少了22%。AI论文的引用呈现“星形结构”——几乎所有人都在引用同一批开创性的AI工作。

徐丰力用了一个生动的比喻：“如果大家都去爬同一座山，那就有很多领域无人探索。”

耶鲁大学的人类学家Lisa Messeri对此评论说，这应该给整个科学界“敲响响亮的警钟”——“科学本质上是一项集体事业。我们需要认真反思：当一个工具有利于个人却可能损害科学整体时，我们该怎么办？”

Messeri在Scientific American的一篇文章中还提出了一个更深层的认识论警告——AI可能制造“三重认知幻觉”：探索广度幻觉（把AI擅长回答的问题误认为所有值得问的问题）、客观性幻觉（假设AI没有立场或代表了所有立场）、以及解释深度幻觉（以为借助AI理解了某件事，其实只是获取了信息）。

她还从科学社会学的角度反驳了“范式必然进化”的叙事：媒体报道让人觉得AI是科学发展“不可避免的进化方向”，但事实上，科学和技术从来不会朝一个预定的方向前进。这种“必然性叙事”本身就是人类想象力的产物。

那么，第五范式到底成立吗？

梳理完英文世界的讨论，我的判断是：第五范式作为一个概念框架是有价值的，但作为对当前现实的描述是过早的。

几个正在凝聚的共识：

第一，AlphaFold是真实的里程碑，不是炒作。它解决了一个定义明确、数据丰富、评判标准清晰的50年老问题。200多万科学家在用它，它拿了诺贝尔奖。这是“AI确实能做科学”的黄金标准证据。OpenAI/Ginkgo的自主实验室案例也在同一条路上又迈了一步。

第二，从AlphaFold到“AI自主做科学”之间的鸿沟被严重低估了。 AlphaFold的成功条件非常特殊：蛋白质折叠问题有清晰的数学定义、有大量已知结构作为训练数据、有明确的正确性评判标准（CASP竞赛）。多数科学领域并不具备这些条件。把一个成功案例泛化为一个新“范式”，逻辑上需要更多审慎。

第三，清华/芝加哥大学的Nature论文揭示了一个真实的结构性风险。 AI不是在所有方向上均匀地加速科学，而是在把科学引向那些“最适合AI的领域”——数据丰富、问题定义清晰、容易量化评估的方向。那些数据匮乏、问题模糊、需要概念性突破的领域，可能反而被边缘化了。换句话说，AI可能不是在扩大科学的边疆，而是在优化已知领域的效率——这是两件非常不同的事情。

第四，“第五范式”这个命名的真正价值，可能不在于描述现实，而在于提供愿景。Jim Gray在2007年提出“第四范式”时，数据密集型科学也远未成熟。但这个命名帮助科研社区组织资源、凝聚共识、想象未来。“第五范式”正在发挥类似的功能。

一个不完美的类比，但很有用

如果非要用一句话总结大家对第五范式的态度，我觉得是这样的：

乐观派说的是天花板，悲观派说的是地板，但大多数严肃的研究者关心的是：我们现在站在哪一层？

Hassabis说我们即将进入“文艺复兴”。McGreivy说他“被AI for Science的炒作骗了”。清华团队说AI让科学家更强但让科学变窄了。PLOS Biology说AI是一个“可能烧掉实验室的实习生”。

科学史告诉我们，真正的范式转型从来不是在一片欢呼声中完成的，也不是在一片质疑声中被否定的。它总是在张力、摩擦和反复验证中逐渐成形。

第五范式可能正是这样一个进行时——不是已经到来，也不是永远不会来，而是正在来的路上，携带着巨大的潜力和同样巨大的风险。

我们能做的，是在兴奋的同时保持清醒：不要因为一把锤子很好用，就觉得全世界都是钉子。