
2026年5月19日,《自然》(Nature)杂志以封面专题形式发布深度报道,宣告人工智能正在数学——这门被誉为“人类理性皇冠”的学科中,掀起一场前所未有的范式革命。
一个从未接受过正规数学训练、甚至还没踏入大学校门的英国少年,仅凭一台电脑和ChatGPT,就攻克了匈牙利数学大师保罗·埃尔德什留下的60年未解经典难题。更让全球顶尖数学家震惊的是,AI给出的解法完全跳出了人类的思维定式,走出了一条所有人都未曾想到的路。
这不是AI第一次解决数学问题,但这一次,它第一次展现出了足以媲美人类顶尖数学家的原创性创造力。
一、震惊学界的突破:门外汉+AI,改写数论历史
1.1 一个业余爱好者的意外胜利
故事的主角叫利亚姆·普莱斯(Liam Price),家住英格兰西南部的一个普通小镇。没有数学学位,没有学术背景,他只是一个对数学充满热情的业余爱好者。
2026年4月,普莱斯与剑桥大学数学系本科生凯文·巴雷托(Kevin Barreto)合作,在预印本平台arXiv上传了一篇论文,宣布解决了埃尔德什问题#1196。论文一经发布,立刻在数学界引发轩然大波。
保罗·埃尔德什,20世纪最传奇的数学家之一,一生发表了超过1500篇学术论文,与500多位数学家合作过,被称为“数学界的游牧民族”。他毕生最大的遗产之一,就是留下了1000多个未解决的数学谜题——也就是著名的“埃尔德什问题”。
这些问题大多表述极其简洁,却隐藏着极深的数学内核,每一个的解决都代表着数论领域的重要进展。半个多世纪以来,无数顶尖数学家为攻克这些难题耗尽心血,却始终进展缓慢。
1.2 埃尔德什问题#1196:困住人类60年的本原集之谜
埃尔德什问题#1196提出于1966年,核心围绕“本原集”展开:
📌 本原集定义:一组正整数中,没有任何一个数能整除另一个数,这样的集合就叫本原集。最典型的本原集就是全体素数——任何两个素数都不能互相整除。
这个问题看似简单,却困扰了数学界整整60年。在此之前,所有尝试解决它的数学家,都不约而同地陷入了同一个思维定式:用概率论的语言重述问题,从概率角度寻找突破口。
几十年来,无数顶尖学者沿着这条路反复探索,却始终无法得到完整的证明。
而ChatGPT,走出了一条完全不同的路。
它没有像人类数学家那样先把问题转化为概率语言,而是直接用问题最初提出的数论语言进行推导。更神奇的是,在它的证明过程中,竟然悄无声息地建立起了数论与概率论之间的全新联系——这种跨领域的隐性连接,正是人类数学家创造力的核心体现。
斯坦福大学数学家贾里德·杜克·利希特曼在社交平台X上打了一个绝妙的比方:
“这就像AI在象棋中发现了一个人类从未想到过的开局。不是因为人类算不出来,而是因为人类的审美和思维惯性,让我们根本不会往这个方向去想。”
菲尔兹奖得主、加州大学洛杉矶分校数学家陶哲轩也对这一解法给予了高度评价,指出其最可贵之处在于突破了人类的认知盲区,展现出了真正的“原创思维”火花。
二、从“暴力计算器”到“平等合作者”:AI正在改写数学研究的规则
这并非AI在数学领域的首次胜利,但却是一个划时代的转折点。
2.1 过去:计算机只是人类的“算盘”
回顾历史,计算机在数学中的角色,长期局限于“暴力计算器”:
- 1976年,四色定理的证明,依靠的是计算机对1936种构型的逐一验证;
- 1998年,开普勒猜想的证明,同样依赖于计算机对海量几何情况的穷举计算。
在这些工作中,计算机只是执行人类制定的规则,没有任何创造性可言。人类数学家负责提出思路、设计算法,计算机只负责完成人类做不完的计算。
2.2 现在:AI正在学会“像数学家一样思考”
但现在,以GPT、Gemini、Claude为代表的通用大语言模型(Large Language Model, LLM),正在彻底打破这一边界。
它们没有经过专门的数学训练,只是通过学习海量的人类文献,就展现出了符合严格逻辑的推理能力。更重要的是,它们开始能提出人类从未有过的原创思路。
OpenAI数学家塞巴斯蒂安·布贝克感慨道:
“这太不可思议了。仅仅一年前,学界还普遍认为存在一个根本障碍——大语言模型永远无法超越它的训练数据,只能复述已有的知识。但现在,我们看到了真正的‘原创思维’的火花。”
这种进步的速度远超所有人的预期。就在几个月前,普莱斯和巴雷托用AI解决的其他几个埃尔德什问题,还只是在复述现有文献中的技巧;而现在,AI已经能提出让顶尖数学家眼前一亮的新方法。
布贝克和许多同行都相信,AI做出比肩人类最伟大数学家的贡献,只是时间问题。
三、狂欢背后的冷思考:争议、隐忧与未解之谜
并非所有人都沉浸在AI突破的狂欢中。多伦多大学数学家丹尼尔·利特就是相对冷静的观察者之一。
他直言,目前AI取得的成果“还算不上特别重大”,学界的炒作有些过头。但他同时也承认:“在未来潜力这件事上,怀疑论者肯定是错的。”
3.1 人类创造力的“黑箱”之谜
利特提出了一个最核心的问题:
“最神秘的地方在于,我们其实根本不知道是什么让人类数学家擅长数学。我们不清楚人类是否拥有某种AI永远无法复制的‘秘密配方’,能让我们产生独一无二的创造力。”
AI的知识量已经远超任何人类数学家,它能在几秒钟内检索完所有已发表的数学文献,而且永远不会疲劳、不会沮丧、不会被偏见左右。但为什么它还没有做出真正重大的数学发现?
这个问题的答案,或许将决定AI最终能在数学这条路上走多远。
3.2 两个迫在眉睫的现实挑战
除了创造力的本质之谜,AI还带来了两个已经摆在眼前的现实问题:
🌟 证明长度的瓶颈
目前,AI生成的数学证明最长只能达到3-4页。谷歌DeepMind内部测试的模型虽然能做到10页左右,但距离真正重大数学定理所需的上百页证明,还有巨大差距。
“100页的证明目前还不在它们的能力范围内,但我们正在朝着这个方向努力,而且能看到持续的进步。”谷歌DeepMind超人推理团队负责人唐·梁说。
🌟 “AI数学垃圾”的泛滥
这已经成为数学界最头疼的问题。哈佛数学家劳伦·威廉姆斯表示,现在数学期刊的审稿人已经不堪重负:
“AI能写出看起来非常有说服力的证明,逻辑环环相扣,却可能在某个不起眼的地方埋下致命错误。要找出这些漏洞,需要人类审稿人花费数倍于以往的时间和精力。”
多位数学期刊编辑都分享过类似的“噩梦经历”:一篇AI生成的论文,可能骗过初审,直到终审阶段才被发现存在根本性的逻辑错误,浪费了整个审稿团队几个月的时间。
四、2030年,AI能拿菲尔兹奖吗?
唐·梁给出了一个大胆的预测:
“我希望到2030年,AI和人类数学家能够共同获得菲尔兹奖。”
这个预测并非天方夜谭。菲尔兹奖作为数学界的最高荣誉,奖励的是40岁以下数学家做出的杰出贡献。如果未来4年内,AI能在某个重大数学问题上提出关键的原创思路,与人类合作者共同完成证明,那么联合获奖将是顺理成章的事。
4.1 AI不会取代人类,而是重构数学研究
但这并不意味着AI会取代人类数学家。恰恰相反,AI将重构数学研究的分工:
- AI将承担起繁琐的验证、推导和计算工作,把人类从重复性劳动中解放出来;
- 人类数学家将更多地专注于提出好问题、把握研究方向、建立学科之间的宏观联系,以及发挥独特的数学审美和直觉。
4.2 数学研究的“民主化时代”正在到来
更重要的是,AI正在大幅降低数学研究的门槛。
像利亚姆·普莱斯这样的非科班爱好者,只要有足够的好奇心和学习能力,借助AI工具,就能参与到前沿数学研究中来。这或许将开启数学研究的“民主化时代”,让更多隐藏在民间的智慧得以发光。
数学不再是少数精英的专属游戏,任何人都有可能在AI的帮助下,为人类理性的大厦添砖加瓦。
写在最后
千百年来,数学一直是人类智力挑战的终极舞台。从欧几里得的《几何原本》到怀尔斯证明费马大定理,每一次数学的突破,都代表着人类理性的一次胜利。
AI的出现,不是来夺走这顶“人类理性的皇冠”的,而是来帮助我们把它擦得更亮。
人类的直觉、好奇心、对美的追求,以及在漫长黑暗中独自探索的勇气,依然是数学研究中最珍贵、最不可替代的东西。而AI,将成为我们有史以来最强大、最不知疲倦的伙伴。
或许在不远的将来,我们会看到这样的场景:一位人类数学家提出一个大胆的猜想,AI在几秒钟内给出了证明的核心思路,然后人类和AI一起,共同完善这个证明,推动人类对宇宙的认知又前进了一小步。
这不是科幻,而是正在发生的现实。
参考文献
[1] Castelvecchi D. ‘It is incredible’: How AI is transforming mathematics[J]. Nature, 2026, 653: 664-665. DOI: 10.1038/d41586-026-01553-1
[2] Alexeev B, Barreto K, Price L. A solution to Erdős problem #1196[J]. arXiv preprint, 2026. DOI: 10.48550/arXiv.q6p7
免责声明
本文基于公开学术文献撰写,旨在科普人工智能在数学领域的最新进展。文中观点仅代表原作者及学界主流看法,不构成任何学术研究建议。AI在数学领域的应用仍处于快速发展阶段,相关结论可能随研究深入而更新。
夜雨聆风