AI 为什么能推翻一个困扰数学家 80 年的猜想?

作者：Kai Williams 译者：WWK_Math

上周，OpenAI 宣布其内部的一个 AI 模型推翻了著名的“埃尔德什单位距离猜想（Erdős unit distance conjecture）”。这一离散几何领域的著名难题，过去 80 年来一直困扰着人类数学家。

OpenAI 提前向多位数学家开放了这一结果，并公开了他们的反馈。菲尔兹奖（数学界最高荣誉）得主蒂莫西·高尔斯（Tim Gowers）表示：“毫无疑问，单位距离问题的解决是 AI 数学发展史上的一个里程碑。”

多伦多大学教授丹尼尔·利特（Daniel Litt）则表示：“这是第一个真正让我本人感到兴奋的，由 AI 自主产出的研究成果，而不仅仅是某种前兆。”

这可以说是 AI 系统第一次给出一个重大未解猜想的证明。这确实令人印象深刻，但我并不认为 AI 在数学领域的发展轨迹发生了根本性的转折。

就在三年前，大语言模型连算术题都做不好。直到去年，大语言模型才开始在高中数学竞赛中表现出色。

今年 1 月，我参加了联合数学会议——全球规模最大的年度数学会议。我了解到 AI 系统已经开始为数学研究做出贡献，但仅仅局限于特定的场景。要把 AI 的输出转化为可以发表的定理，还需耗费大量的人力进行解读。

OpenAI 的最新成果则是这一发展进程的下一步。该 AI 模型巧妙地融合了几个数学分支中的既有思想，最终构造出一个完整的证明。然而，它并没有开创任何真正的新方法。此后，人类数学家对这一结果进行了梳理和推广。

这指明了一个中期趋势，即人类数学家和 AI 模型相互补充：AI 对过往研究成果的了解，远超任何在世的人类，也更愿意费力尝试那些极为繁琐、不太可能成功的证明策略。而人类依旧能够深入思考任何一个问题，并提出更有意思的问题。

但这种局面可能维持不了多久。AI 在数学领域的进步速度如此之快，以至于我们很难说，十年后人类数学家还将扮演什么样的角色（如果有的话）。

单位距离问题

保罗·埃尔德什（Paul Erdős）是历史上最高产的数学家之一。他一生发表了 1500 多篇论文，为历史之最。他最擅长的事情之一，就是提出那些表述简单，却蕴含深刻数学思想的问题。

1946 年，他提出了“单位距离问题”。假设二维平面上有若干个点，我们逐一测量每两个点之间的距离：

在这个图中，有 5 个点，共 10 对点。其中 3 对点之间的距离恰好等于 1 个单位，分别是 AD、BE 和 CE。

我们能否重新排列这些点，使得更多对点之间的距离恰好为 1 个单位呢？

答案是肯定的。例如，我们可以把点 A 和 D 移到更靠近 B、C、E 的地方。再经过进一步调整，我们就能让其中 7 对点的距离恰好为 1 个单位。不过，这已经是能够达到的最大值了。

我们可以对 6 个点、7个点做同样的分析。但随着点数增加，问题很快就会变得过于复杂，以至于无法找到精确答案。

5 到 9 个点的排法

因此，埃尔德什不再试图回答对于给定数量的点，究竟有多少对距离为 1，而是试图计算出在点数 n 很大的前提下，距离为 1 的点对数量的上界和下界。

为了算出下界，埃尔德什假设这些点以网格形式排列。这或许不是最优的排法，但如果能证明网格中存在一定数量距离为 1的点对，那么最优排法只会更多。

缩小网格间距后，单位圆会经过更多网格点，因此有更多距离为 1 的点对。

最简单的排法，是让每个点和它上下左右相邻的点的距离都是 1。但埃尔德什发现，如果把对角线方向也考虑进去，还可以做得更好。只要把网格缩得更小，与每个点距离为 1 的点就会更多。每个点就能和更多的近邻点的距离为1。如上图所示，如果网格间距是 1，则每个点和 4 个点的距离为 1（如左图）；如果网格间距是 1/5（如右图），则每个点和 12 个点的距离为 1。

OpenAI 在介绍这项新成果时，附带了一张让人有些摸不着头脑的示意图：网格中的点被许多线段连接在一起。如果在图上叠加一个圆，就容易理解多了：

OpenAI 在宣布 AI 推翻单位距离猜想时所用的示意图。这里的网格间距是 1/√65。单位圆可以穿过网格上的 16 个点（如果网格足够大的话）。

这个做法的依据是勾股定理。假设一个点在另一个点的右边 a 个单位、上方 b 个单位，那么这两个点之间的距离 c 就满足。这里的诀窍在于选取一个合适的，使得满足的整数对 (a,b) 尽可能多。接着，只要把网格缩小，让相邻网格点之间的距离变成 1/c，就会出现大量距离为 1 的点对。

举个例子，如果取，那么勾股定理可以写成或者。这正对应前面展示的那个经过 12 个网格点的圆。这些点包括 (0,5)、(3,4)、(4,3)、(5,0)、(-4,3)、(-3,4) 等位置。（严格来说，这些坐标都应该除以 5，例如 (3/5, 4/5)，但为了看着更清楚，我省去了分母。）

OpenAI 图中的例子则取的是。它可以写成或者。这意味着，如果网格间距为，每个点都会与另外 16 个点距离为 1，例如、、、、、等等。的取值越大——只要选取得当——就能得到更多满足条件的整数对，从而得到更多距离为 1 的点对。

然而，如果相对于网格中的总点数而言，选得太大了，那么许多潜在的距离为 1 的点就会落到网格之外。

简而言之，我们想找一个足够大，但又不能太大的。借助数论中的相关结果（包括雅可比二平方和定理），埃尔德什证明了，对于恰当大小的圆而言，距离为 1 的点对数量确实会增长得比点的数量更快，但也仅仅是快一点。

接下来的问题就变成了：还能做得更好吗？为了算出上界，埃尔德什借用了图论——一个截然不同的数学领域——中的论证方法，证明了距离为 1 的点对数量只有那么多。但他得到的这个上界，增长速度远比他构造出的最好的下界要快得多。

埃尔德什猜测，实际的最优值更接近下界，而不是上界。他预测，距离为 1 的点对的最大数量增长得只比点数稍微快一点，但他无法给出证明。他的这一猜想后来被称为“单位距离问题”。在此后的 80 年里，大家一直觉得埃尔德什是对的。

直到 OpenAI 的模型证明他错了。

AI 的解题思路

埃尔德什的猜想基于一个假设：至少在点数很多时，正方形网格所能产生的距离为 1 的点对数量，与其他任何排法大致相当。而 OpenAI 的 AI 证明，这个假设是错的。它证明，只要用另一种更复杂的方式排列这 n 个点，就能得到更多距离为 1 的点对。

这种新排法更加复杂，很难用几句话解释清楚。不过，你可以把它理解为埃尔德什网格的一种巧妙改造。

AI 首先在高维空间中构造了一个网格，然后将这个更复杂的结构投影到二维平面上。此外，AI 并没有使用由 (1,3)、(−3,6) 构成的整数网格，而是利用了一种被称为“代数整数（algebraic integers）”的东西来构造这个更复杂的网格。事实证明，这种高维网格具有更丰富的结构，从而让 AI 在相同数量的点中塞进更多距离为 1 的点对。

这种新排法很难用图表直接展示，因为只有当点数非常庞大时，它的优势才会显现出来。不过，这里有一个通过类似方法构造出的简化版本。

它包含 1345 个点，一共只有 5916 对距离为 1 的点，甚至少于埃尔德什的方法——1296 个点的正方形网格中能产生 7632 对。但我认为，它能帮助我们直观理解，一种并非网格的结构如何比正方形网格产生更多距离为 1 的点对。

AI 模型排法的简化示意图。从中心向外延伸的 12 条红线长度均为 1。

这种更复杂的结构最终带来了回报。虽然 OpenAI 模型的证明并没有明确指出，对于 n 个点，究竟有多少对距离为 1 的点，但人类数学家威尔·萨温（Will Sawin）在此基础上证明了，这个数量的增长速度至少能达到。这个指数看起来可能很小，但当 n 变得足够大时，这个数字将远超埃尔德什方法所得到的结果。

话虽如此，AI 并没有彻底解决这个难题。目前已知最好的上界大约为。要缩小这一差距，还需要进一步的研究。

这一成果在 AI 数学研究中处于什么位置？

如果上周之前你问我，大语言模型对数学最新颖的贡献是什么，我大概会指向 Google DeepMind 的 AlphaEvolve 系统。

AlphaEvolve 将大语言模型作为优化过程的核心引擎。如果你能把一个数学问题转化为一段待优化的代码（这通常是可以做到的），大语言模型就能针对某些特定类型的问题，找到比人类更好的解法。去年 11 月，四位数学家（其中包括陶哲轩）发表了一篇论文，分析了 AlphaEvolve 在数学文献中 67 个优化问题上的表现。他们发现，AlphaEvolve 在某些情况下确实改进了此前文献中的结果。

与此前大语言模型所作的贡献（比如文献综述）相比，这在自主性上迈出了一大步。但它仍然需要人类将其转化为优化问题，并把 AI 的输出转化成可用的数学成果。而且，这种方法只适用于特定类型的问题。对于那些更偏重概念的、没有明确优化目标的问题，AlphaEvolve 就无能为力了。

因此，各大 AI 公司一直在努力开发能够直接给出正确数学解答的大语言模型系统。OpenAI 的成果正是朝着这个方向迈出的重要一步。不过，它也符合之前 AI 辅助数学研究的模式。

一方面，其他公司也一直在尝试解决埃尔德什问题。埃尔德什一生提出了数百个问题，而数学家托马斯·布鲁姆（Thomas Bloom）发起了一项整理工作，并在 erdosproblems.com 网站来汇总这些难题。许多 AI 公司都把这些问题当作评估 AI 系统的试金石。

今年 1 月，剑桥大学本科生凯文·巴雷托（Kevin Barreto）和朋友合作，让 GPT-5.2 和 Harmonic 公司的 Aristotle 给出了首个由 AI 自主完成的埃尔德什问题解答。就在上周五，也就是 OpenAI 宣布成果的两天后，Google 也宣布其 AI 系统解决了 9 个未解的埃尔德什问题，其中两个已经搁置了 50 多年。

需要说明的是，OpenAI 解决的这个问题远比我刚刚提到的这些成果更令人印象深刻。但 OpenAI 的方案，其实比新闻头条所暗示的更贴合以往的 AI 研究路径。

尽管单位距离问题广为人知，却在过去 80 年里一直悬而未决，原因之一是大多数人都认为埃尔德什的猜想是对的。但以现有的数学工具来看，我们距离证明埃尔德什给出的界限还差得很远。因此数学家普遍认为，如果要证明这一猜想，必须引入重大的新思想或新方法。

然而正如我们所看到的，AI 通过推广埃尔德什最初的构造推翻了该猜想。这是一个巧妙且并不显然的解法，但它与 AlphaEvolve 这类系统所做的优化工作也有几分相似。

这一点也在部分数学家的反馈中有所体现。数学家蒂莫西·高尔斯写道，当他第一次听说 AI 的成果时，他以为 AI 证明了埃尔德什猜想。“我花了整个晚上调整我的世界观：如果 AI 连这样的证明都能想出来，那么数学家的时代可能很快就要结束了。”

但到了第二天早上，高尔斯和其他外部评审收到了一封介绍该成果的邮件。他这才意识到，大语言模型“是推翻了猜想而不是证明了它，这让我大松了一口气。”

OpenAI 的解法还有两个特点，恰好体现了 AI 相对于人类的优势。

首先，最终的解法依赖于一个看似毫不相关的数学领域——代数数论——的复杂技巧。AI 系统通过大量的数学文献进行训练——而现存的数学知识极其庞大——因此它们对既有数学成果的了解，远超世界上任何一个人。人类要解决这个问题，既需要掌握相关的代数数论知识，又要对单位距离问题感兴趣——这是一个罕见的组合。

其次，整个推导过程极其繁琐，而且看起来不太可能成功，大多数人都会觉得不值得一试。多伦多大学教授雅各布·齐默曼（Jacob Tsimerman）在 OpenAI 的文档中提到，他曾短暂考虑过用类似的方法来推翻这个猜想。但这种方法“极其耗时，而且往往无功而返”，于是他放弃了这个项目。

相反，AI 在找到可行的策略之前，可以不断尝试各种失败的证明策略。OpenAI 完全可以让模型反复尝试同一个问题，直到得到正确的解法。事实上，OpenAI 公布的一张图表显示，即使在最大的词元预算下，内部模型也只有大约一半的概率能够解决该问题。

当然，AI 系统所做的事情依然令人惊叹。齐默曼在评述中写道：“人们总是倾向于在看到一个完整的证明后，才宣称它显而易见，”但正如我前面所指出的，它确实发挥了 AI 系统的长处。

在短期到中期内，这预示着一个 AI 模型与人类互补而非取代人类的世界。AI 系统会去攻克那些由数学家整理出来的问题清单，也会帮助人类从看似毫无关联的数学领域中寻找相关方法。但在选择研究什么问题，以及创造全新的方法上，人类的角色短期内不会被取代。

甚至这一次的成果，本质上也是一次非常典型的人机协作。虽然 AI 系统独立找到了证明，但结果是由人类数学家验证的。随后，其他数学家又写出了更完善的证明，扩展了 AI 最初的想法。例如我前面提到的威尔·萨温找到了一个明确的下界。

然而，这种互补状态会持续多久还很难说。在评论的其余部分，高尔斯探讨了这样一个问题：他听到 AI 推翻猜想时松了一口气，这种反应是否合理。他最终的结论大体上是肯定的。但在一条脚注中，他写道，他猜测“AI 很快就会在建立理论、给出定义以及提出有趣问题等方面达到很高的水平。”

过去一年里，AI 系统从还无法在高中数学竞赛中胜出，发展到了能够以有趣的方式推动数学研究。可以预见，AI 系统在处理数学问题时会变得越来越自主。

与此同时，我们尚未完全摸清当前模型在数学上能做到什么程度。OpenAI 宣布这一消息后不久，密歇根大学博士后马骁发现，只要给一点小提示，GPT-5.5 也能证明埃尔德什是错的。如果一个公开可用的模型就能推翻这个著名的猜想，而此前没人注意到，那么在今天，还有哪些发现其实已经近在咫尺，只是还没人想到去尝试呢？