Nature重磅|AI颠覆数学:非科班少年用ChatGPT破解60年埃尔德什难题,菲尔兹奖将迎来合作者?

2026年5月19日，《自然》（Nature）杂志以封面专题形式发布深度报道，宣告人工智能正在数学——这门被誉为“人类理性皇冠”的学科中，掀起一场前所未有的范式革命。

一个从未接受过正规数学训练、甚至还没踏入大学校门的英国少年，仅凭一台电脑和ChatGPT，就攻克了匈牙利数学大师保罗·埃尔德什留下的60年未解经典难题。更让全球顶尖数学家震惊的是，AI给出的解法完全跳出了人类的思维定式，走出了一条所有人都未曾想到的路。

这不是AI第一次解决数学问题，但这一次，它第一次展现出了足以媲美人类顶尖数学家的原创性创造力。

一、震惊学界的突破：门外汉+AI，改写数论历史

1.1 一个业余爱好者的意外胜利

故事的主角叫利亚姆·普莱斯（Liam Price），家住英格兰西南部的一个普通小镇。没有数学学位，没有学术背景，他只是一个对数学充满热情的业余爱好者。

2026年4月，普莱斯与剑桥大学数学系本科生凯文·巴雷托（Kevin Barreto）合作，在预印本平台arXiv上传了一篇论文，宣布解决了埃尔德什问题#1196。论文一经发布，立刻在数学界引发轩然大波。

保罗·埃尔德什，20世纪最传奇的数学家之一，一生发表了超过1500篇学术论文，与500多位数学家合作过，被称为“数学界的游牧民族”。他毕生最大的遗产之一，就是留下了1000多个未解决的数学谜题——也就是著名的“埃尔德什问题”。

这些问题大多表述极其简洁，却隐藏着极深的数学内核，每一个的解决都代表着数论领域的重要进展。半个多世纪以来，无数顶尖数学家为攻克这些难题耗尽心血，却始终进展缓慢。

1.2 埃尔德什问题#1196：困住人类60年的本原集之谜

埃尔德什问题#1196提出于1966年，核心围绕“本原集”展开：

📌 本原集定义：一组正整数中，没有任何一个数能整除另一个数，这样的集合就叫本原集。最典型的本原集就是全体素数——任何两个素数都不能互相整除。

这个问题看似简单，却困扰了数学界整整60年。在此之前，所有尝试解决它的数学家，都不约而同地陷入了同一个思维定式：用概率论的语言重述问题，从概率角度寻找突破口。

几十年来，无数顶尖学者沿着这条路反复探索，却始终无法得到完整的证明。

而ChatGPT，走出了一条完全不同的路。

它没有像人类数学家那样先把问题转化为概率语言，而是直接用问题最初提出的数论语言进行推导。更神奇的是，在它的证明过程中，竟然悄无声息地建立起了数论与概率论之间的全新联系——这种跨领域的隐性连接，正是人类数学家创造力的核心体现。

斯坦福大学数学家贾里德·杜克·利希特曼在社交平台X上打了一个绝妙的比方：

“这就像AI在象棋中发现了一个人类从未想到过的开局。不是因为人类算不出来，而是因为人类的审美和思维惯性，让我们根本不会往这个方向去想。”

菲尔兹奖得主、加州大学洛杉矶分校数学家陶哲轩也对这一解法给予了高度评价，指出其最可贵之处在于突破了人类的认知盲区，展现出了真正的“原创思维”火花。

二、从“暴力计算器”到“平等合作者”：AI正在改写数学研究的规则

这并非AI在数学领域的首次胜利，但却是一个划时代的转折点。

2.1 过去：计算机只是人类的“算盘”

回顾历史，计算机在数学中的角色，长期局限于“暴力计算器”：

- 1976年，四色定理的证明，依靠的是计算机对1936种构型的逐一验证；

- 1998年，开普勒猜想的证明，同样依赖于计算机对海量几何情况的穷举计算。

在这些工作中，计算机只是执行人类制定的规则，没有任何创造性可言。人类数学家负责提出思路、设计算法，计算机只负责完成人类做不完的计算。

2.2 现在：AI正在学会“像数学家一样思考”

但现在，以GPT、Gemini、Claude为代表的通用大语言模型（Large Language Model, LLM），正在彻底打破这一边界。

它们没有经过专门的数学训练，只是通过学习海量的人类文献，就展现出了符合严格逻辑的推理能力。更重要的是，它们开始能提出人类从未有过的原创思路。

OpenAI数学家塞巴斯蒂安·布贝克感慨道：

“这太不可思议了。仅仅一年前，学界还普遍认为存在一个根本障碍——大语言模型永远无法超越它的训练数据，只能复述已有的知识。但现在，我们看到了真正的‘原创思维’的火花。”

这种进步的速度远超所有人的预期。就在几个月前，普莱斯和巴雷托用AI解决的其他几个埃尔德什问题，还只是在复述现有文献中的技巧；而现在，AI已经能提出让顶尖数学家眼前一亮的新方法。

布贝克和许多同行都相信，AI做出比肩人类最伟大数学家的贡献，只是时间问题。

三、狂欢背后的冷思考：争议、隐忧与未解之谜

并非所有人都沉浸在AI突破的狂欢中。多伦多大学数学家丹尼尔·利特就是相对冷静的观察者之一。

他直言，目前AI取得的成果“还算不上特别重大”，学界的炒作有些过头。但他同时也承认：“在未来潜力这件事上，怀疑论者肯定是错的。”

3.1 人类创造力的“黑箱”之谜

利特提出了一个最核心的问题：

“最神秘的地方在于，我们其实根本不知道是什么让人类数学家擅长数学。我们不清楚人类是否拥有某种AI永远无法复制的‘秘密配方’，能让我们产生独一无二的创造力。”

AI的知识量已经远超任何人类数学家，它能在几秒钟内检索完所有已发表的数学文献，而且永远不会疲劳、不会沮丧、不会被偏见左右。但为什么它还没有做出真正重大的数学发现？

这个问题的答案，或许将决定AI最终能在数学这条路上走多远。

3.2 两个迫在眉睫的现实挑战

除了创造力的本质之谜，AI还带来了两个已经摆在眼前的现实问题：

🌟 证明长度的瓶颈

目前，AI生成的数学证明最长只能达到3-4页。谷歌DeepMind内部测试的模型虽然能做到10页左右，但距离真正重大数学定理所需的上百页证明，还有巨大差距。

“100页的证明目前还不在它们的能力范围内，但我们正在朝着这个方向努力，而且能看到持续的进步。”谷歌DeepMind超人推理团队负责人唐·梁说。

🌟 “AI数学垃圾”的泛滥

这已经成为数学界最头疼的问题。哈佛数学家劳伦·威廉姆斯表示，现在数学期刊的审稿人已经不堪重负：

“AI能写出看起来非常有说服力的证明，逻辑环环相扣，却可能在某个不起眼的地方埋下致命错误。要找出这些漏洞，需要人类审稿人花费数倍于以往的时间和精力。”

多位数学期刊编辑都分享过类似的“噩梦经历”：一篇AI生成的论文，可能骗过初审，直到终审阶段才被发现存在根本性的逻辑错误，浪费了整个审稿团队几个月的时间。

四、2030年，AI能拿菲尔兹奖吗？

唐·梁给出了一个大胆的预测：

“我希望到2030年，AI和人类数学家能够共同获得菲尔兹奖。”

这个预测并非天方夜谭。菲尔兹奖作为数学界的最高荣誉，奖励的是40岁以下数学家做出的杰出贡献。如果未来4年内，AI能在某个重大数学问题上提出关键的原创思路，与人类合作者共同完成证明，那么联合获奖将是顺理成章的事。

4.1 AI不会取代人类，而是重构数学研究

但这并不意味着AI会取代人类数学家。恰恰相反，AI将重构数学研究的分工：

- AI将承担起繁琐的验证、推导和计算工作，把人类从重复性劳动中解放出来；

- 人类数学家将更多地专注于提出好问题、把握研究方向、建立学科之间的宏观联系，以及发挥独特的数学审美和直觉。

4.2 数学研究的“民主化时代”正在到来

更重要的是，AI正在大幅降低数学研究的门槛。

像利亚姆·普莱斯这样的非科班爱好者，只要有足够的好奇心和学习能力，借助AI工具，就能参与到前沿数学研究中来。这或许将开启数学研究的“民主化时代”，让更多隐藏在民间的智慧得以发光。

数学不再是少数精英的专属游戏，任何人都有可能在AI的帮助下，为人类理性的大厦添砖加瓦。

写在最后

千百年来，数学一直是人类智力挑战的终极舞台。从欧几里得的《几何原本》到怀尔斯证明费马大定理，每一次数学的突破，都代表着人类理性的一次胜利。

AI的出现，不是来夺走这顶“人类理性的皇冠”的，而是来帮助我们把它擦得更亮。

人类的直觉、好奇心、对美的追求，以及在漫长黑暗中独自探索的勇气，依然是数学研究中最珍贵、最不可替代的东西。而AI，将成为我们有史以来最强大、最不知疲倦的伙伴。

或许在不远的将来，我们会看到这样的场景：一位人类数学家提出一个大胆的猜想，AI在几秒钟内给出了证明的核心思路，然后人类和AI一起，共同完善这个证明，推动人类对宇宙的认知又前进了一小步。

这不是科幻，而是正在发生的现实。

参考文献

[1] Castelvecchi D. ‘It is incredible’: How AI is transforming mathematics[J]. Nature, 2026, 653: 664-665. DOI: 10.1038/d41586-026-01553-1

[2] Alexeev B, Barreto K, Price L. A solution to Erdős problem #1196[J]. arXiv preprint, 2026. DOI: 10.48550/arXiv.q6p7

免责声明

本文基于公开学术文献撰写，旨在科普人工智能在数学领域的最新进展。文中观点仅代表原作者及学界主流看法，不构成任何学术研究建议。AI在数学领域的应用仍处于快速发展阶段，相关结论可能随研究深入而更新。