从望远镜到GPT-5:人类做科学的方式正在经历第五次革命
2024年10月,诺贝尔物理学奖和化学奖同时颁给了AI研究者。物理学奖给了Hopfield和Hinton——两位获奖者的专业分别是分子生物学和计算机科学,没有一个是物理学家。化学奖给了DeepMind的Hassabis和Jumper——因为他们用AI预测了蛋白质结构。
ACM主席Yannis Ioannidis在《Communications of the ACM》上写了一篇社论,标题直截了当:《第五范式:AI驱动的科学发现》。他说,这两个诺贝尔奖把计算和AI推到了科学发现的核心位置,甚至作为工具本身就配得上最高荣誉。
他还扔出一个挑衅性的问题:如果AI写的论文经过人类专家评审后被认为“正确、新颖、有趣”,我们有什么理由拒绝它?AI能不能最终成为人类研究者的同等伙伴?
要理解这个问题的重量,我们得先回头看看:人类到底是怎么做科学的?答案是——换过四次方式了,现在可能正在换第五次。
五次范式跃迁:从用眼睛看到让AI想
科学史上的范式演进,有一种优雅的递进逻辑:
第一范式是实验科学,靠观察和归纳——伽利略举起望远镜,回答的是“发生了什么”。人类做了几千年。
第二范式是理论科学,靠数学模型——牛顿写下F=ma,回答的是“为什么会发生”。人类做了几百年。
第三范式是计算科学,靠计算机模拟——曼哈顿计划中用数值方法模拟核反应,回答的是“如果……会发生什么”。人类做了几十年。
第四范式是数据密集型科学,靠大数据挖掘——这个概念由微软传奇科学家Jim Gray在2007年提出(他后来在一次独自出海中失踪,再未被找到)。Gray认为,科学正进入一个数据洪流的时代:实验和模拟产生的数据量已经远超人脑的处理能力,需要数据库、机器学习和数据挖掘工具来从中寻找规律。回答的是“数据告诉我们什么”。人类做了大约十五年。
然后就是现在。
第五范式:AI驱动的科学——AI不再只是帮人类处理数据的工具,而是深度融入科研全流程,自主生成假设、设计实验、分析结果、迭代发现。回答的是“AI能自主发现什么”。
把这五次跃迁摊开看,逻辑一目了然:
范式 | 名称 | 核心方法 | 关键工具 | 回答的问题 | 人类做了多久 |
第一范式 | 实验科学 | 观察、实验、归纳 | 感官、望远镜、显微镜 | 发生了什么? | 几千年 |
第二范式 | 理论科学 | 数学建模与推导 | 纸、笔、数学公式 | 为什么会发生? | 几百年 |
第三范式 | 计算科学 | 计算机模拟与数值计算 | 计算机、超算、仿真软件 | 如果……会怎样? | 几十年 |
第四范式 | 数据密集型科学 | 海量数据挖掘与分析 | 数据库、机器学习、数据挖掘 | 数据里藏着什么规律? | 约十五年 |
第五范式 | AI驱动的科学 | AI全流程融入:自主假设、实验、发现 | 深度学习、科学大模型、自动化实验室 | AI能自主发现什么? | 正在发生 |
注意最后一列的加速度:从千年到百年到十年——每次范式转型的间隔都在急剧缩短。而第五范式的关键词不是“AI帮人类发现了什么”,而是“AI自主发现了什么”。这个区别,就是它和第四范式的分界线。
第五范式到底在说什么?三个层次
“第五范式”这个概念听起来很大,但拆开来看,其实有三个递进的层次,从温和到激进:
第一层:AI作为超级加速器。这是目前已经在发生的事情。AlphaFold预测了几乎所有已知的两亿种蛋白质结构,解决了一个困扰了结构生物学家50年的老问题。全世界190个国家的200多万科学家正在使用它。这不是炒作,这是诺贝尔奖级别的实锤。
微软研究院AI4Science团队的负责人Chris Bishop给过一组震撼的数字:仅小分子药物候选空间就有10的60次方个可能——这是一个天文数字的天文数字。而稳定材料的总数大约是10的180次方,相当于已知宇宙原子数的平方。人类穷尽所有实验室、穷尽所有时间,也不可能遍历这个搜索空间。只有AI能在这种规模上工作。
第二层:AI作为研究伙伴(Agentic Science)。AI不仅加速计算,还开始参与科研的“上游”环节——提出假设、设计实验方案、决定下一步该做什么。2026年2月,OpenAI和Ginkgo Bioworks发布了一个标志性案例:他们把GPT-5连接到Ginkgo的自动化云实验室,让AI自主设计、执行和分析细胞无体系蛋白质合成(CFPS)实验。六轮迭代,超过36,000个反应条件,最终将蛋白质生产成本降低了40%——从每克698美元降到422美元。整个过程中,人类的参与基本限于试剂准备和设备监督。
这个案例的意义不在于40%这个数字本身,而在于它展示的工作模式:AI提出假设→自动实验室执行→数据返回→AI分析并修正假设→再执行。一个完整的科学发现闭环,人类退到了“目标设定者”和“质量把关者”的位置。
第三层:AI作为自主科学家。这是最激进的想象——AI不仅能在人类设定的框架内优化,还能自主提出新的研究方向和目标。2025年的一篇arXiv论文提出了"Agent for Science(Agent4S)"的概念,并给出了一个五级分类路线图:从L1(单一子任务自动化,比如文献检索)到L5(完全自主的、可协作的“AI科学家”)。论文的作者认为,只有到了Agent4S阶段,才算是“真正的第五范式”。
谁在兴奋?顶级玩家们的态度
对第五范式最兴奋的,毫不意外,是那些已经尝到甜头的人。
Demis Hassabis(DeepMind CEO,2024年诺贝尔化学奖得主)的表述最宏大。他预测在未来10到15年内,人类将进入“一个全新的发现黄金时代——一种新的文艺复兴”。他把DeepMind的使命概括成一个优雅的两步走:“第一步,解决智能问题;第二步,用它解决其他所有问题。”他称AI是描述生物学的“完美语言”,并通过旗下的Isomorphic Labs把药物发现从湿实验室搬到计算机模拟,声称这能让药物开发效率提升一千倍。
Max Welling(微软研究院AI4Science杰出科学家,师从诺贝尔物理学奖得主Gerard 't Hooft)在NeurIPS 2022的邀请报告中明确将AI4Science定义为“科学发现的第五范式”。他后来在一次问答中解释了这背后的逻辑:前四个范式——实验、理论、计算机模拟、大数据——现在可以被AI串联起来。计算机模拟生成的数据可以作为伪数据来训练机器学习模型,而训练好的模型又能反过来加速下一轮模拟。这种闭环是之前任何范式都做不到的。
2025年6月,《PLOS Biology》上的一篇观点文章用了一个绝妙的比喻来定义人机关系:
“AI就像我们雇了一个超级上进、疯狂热情的实习生——工作速度超人,永不睡觉,如饥似渴地吞噬数据。它潜力惊人,但如果没有扎根于科学知识的正确引导,它更可能把实验室烧了,而不是推动科学进步。”
这个比喻精准地捕捉了当前第五范式的核心张力:能力极强,但判断力存疑。
谁在泼冷水?来自一线的反思
如果只听兴奋的声音,你会以为科学革命已经完成了。但真实的画面要复杂得多。
最有说服力的亲历反思来自一位普林斯顿的物理学博士Nick McGreivy。2018年,他还是等离子物理方向的二年级博士生,被AI的热潮吸引,转而研究用深度学习求解偏微分方程(PDE)——这在当时被Yann LeCun称为“确实很热的方向”。
数十篇论文声称AI方法比传统数值方法快上千倍,甚至百万倍。但当McGreivy真正上手复现时,发现事情不对:很多论文的对比方法有问题——不是AI跑得快了,而是传统方法的参数没调好。他后来在Nature Machine Intelligence上发表了论文,在同等条件下对比后发现,AI相对于成熟数值方法的优势基本消失了。
他在2025年5月的长文中总结了三个系统性问题:
第一,科学家涌向AI更多是因为对自身职业有利,而非对科学有利。用AI的科学家发论文更多、引用更高、拿资助更容易——这些激励结构驱动着采用率暴增,但并不等于科学本身在加速进步。
第二,幸存者偏差严重。AI研究几乎不发表负面结果。你在期刊上看到的都是成功案例,但失败案例被系统性地隐藏了。
第三,已发表的正面结果普遍过于乐观。除了McGreivy自己发现的PDE问题,DeepMind自身也有翻车案例:2023年声称发现了220万个新晶体结构,号称“人类已知稳定材料的数量级扩展”。结果材料科学家分析后发现基本是“垃圾”——这些化合物要么不稳定,要么早已已知。学者们礼貌但坚定地指出,这篇论文“并未报告任何新材料”。
McGreivy还指出了一个容易被忽视的利益冲突:关于AI加速科学的叙事,大多来自AI公司或从中获益的研究者。NVIDIA的CEO黄仁勋声称“AI将把科学加速百万倍”——考虑到NVIDIA的GPU生意,这种说法的客观性值得打个问号。
最深刻的警告:AI让个人更强,但让科学更窄
2026年1月,清华大学电子工程系徐丰力、李勇团队联合芝加哥大学James Evans教授在Nature上发表了一项重磅研究。他们分析了横跨45年的4130万篇科研论文,发现了一个令人不安的悖论:
AI让个人科学家更强了,但让科学整体变窄了。
具体数字:使用AI的科学家平均多发3.02倍的论文,多获得4.84倍的引用,比不用AI的同行早1.37年成为课题负责人。这些个人收益是实打实的。
但集体层面呢?AI驱动的研究在所有领域都聚焦到了更窄的主题范围上,知识广度收缩了4.63%,科学家之间的跨界互动减少了22%。AI论文的引用呈现“星形结构”——几乎所有人都在引用同一批开创性的AI工作。
徐丰力用了一个生动的比喻:“如果大家都去爬同一座山,那就有很多领域无人探索。”
耶鲁大学的人类学家Lisa Messeri对此评论说,这应该给整个科学界“敲响响亮的警钟”——“科学本质上是一项集体事业。我们需要认真反思:当一个工具有利于个人却可能损害科学整体时,我们该怎么办?”
Messeri在Scientific American的一篇文章中还提出了一个更深层的认识论警告——AI可能制造“三重认知幻觉”:探索广度幻觉(把AI擅长回答的问题误认为所有值得问的问题)、客观性幻觉(假设AI没有立场或代表了所有立场)、以及解释深度幻觉(以为借助AI理解了某件事,其实只是获取了信息)。
她还从科学社会学的角度反驳了“范式必然进化”的叙事:媒体报道让人觉得AI是科学发展“不可避免的进化方向”,但事实上,科学和技术从来不会朝一个预定的方向前进。这种“必然性叙事”本身就是人类想象力的产物。
那么,第五范式到底成立吗?
梳理完英文世界的讨论,我的判断是:第五范式作为一个概念框架是有价值的,但作为对当前现实的描述是过早的。
几个正在凝聚的共识:
第一,AlphaFold是真实的里程碑,不是炒作。它解决了一个定义明确、数据丰富、评判标准清晰的50年老问题。200多万科学家在用它,它拿了诺贝尔奖。这是“AI确实能做科学”的黄金标准证据。OpenAI/Ginkgo的自主实验室案例也在同一条路上又迈了一步。
第二,从AlphaFold到“AI自主做科学”之间的鸿沟被严重低估了。 AlphaFold的成功条件非常特殊:蛋白质折叠问题有清晰的数学定义、有大量已知结构作为训练数据、有明确的正确性评判标准(CASP竞赛)。多数科学领域并不具备这些条件。把一个成功案例泛化为一个新“范式”,逻辑上需要更多审慎。
第三,清华/芝加哥大学的Nature论文揭示了一个真实的结构性风险。 AI不是在所有方向上均匀地加速科学,而是在把科学引向那些“最适合AI的领域”——数据丰富、问题定义清晰、容易量化评估的方向。那些数据匮乏、问题模糊、需要概念性突破的领域,可能反而被边缘化了。换句话说,AI可能不是在扩大科学的边疆,而是在优化已知领域的效率——这是两件非常不同的事情。
第四,“第五范式”这个命名的真正价值,可能不在于描述现实,而在于提供愿景。Jim Gray在2007年提出“第四范式”时,数据密集型科学也远未成熟。但这个命名帮助科研社区组织资源、凝聚共识、想象未来。“第五范式”正在发挥类似的功能。
一个不完美的类比,但很有用
如果非要用一句话总结大家对第五范式的态度,我觉得是这样的:
乐观派说的是天花板,悲观派说的是地板,但大多数严肃的研究者关心的是:我们现在站在哪一层?
Hassabis说我们即将进入“文艺复兴”。McGreivy说他“被AI for Science的炒作骗了”。清华团队说AI让科学家更强但让科学变窄了。PLOS Biology说AI是一个“可能烧掉实验室的实习生”。
科学史告诉我们,真正的范式转型从来不是在一片欢呼声中完成的,也不是在一片质疑声中被否定的。它总是在张力、摩擦和反复验证中逐渐成形。
第五范式可能正是这样一个进行时——不是已经到来,也不是永远不会来,而是正在来的路上,携带着巨大的潜力和同样巨大的风险。
我们能做的,是在兴奋的同时保持清醒:不要因为一把锤子很好用,就觉得全世界都是钉子。
夜雨聆风