作者:Kai Williams 译者:WWK_Math
上周,OpenAI 宣布其内部的一个 AI 模型推翻了著名的“埃尔德什单位距离猜想(Erdős unit distance conjecture)”。这一离散几何领域的著名难题,过去 80 年来一直困扰着人类数学家。
OpenAI 提前向多位数学家开放了这一结果,并公开了他们的反馈。菲尔兹奖(数学界最高荣誉)得主蒂莫西·高尔斯(Tim Gowers)表示:“毫无疑问,单位距离问题的解决是 AI 数学发展史上的一个里程碑。”
多伦多大学教授丹尼尔·利特(Daniel Litt)则表示:“这是第一个真正让我本人感到兴奋的,由 AI 自主产出的研究成果,而不仅仅是某种前兆。”
这可以说是 AI 系统第一次给出一个重大未解猜想的证明。这确实令人印象深刻,但我并不认为 AI 在数学领域的发展轨迹发生了根本性的转折。
就在三年前,大语言模型连算术题都做不好。直到去年,大语言模型才开始在高中数学竞赛中表现出色。
今年 1 月,我参加了联合数学会议——全球规模最大的年度数学会议。我了解到 AI 系统已经开始为数学研究做出贡献,但仅仅局限于特定的场景。要把 AI 的输出转化为可以发表的定理,还需耗费大量的人力进行解读。
OpenAI 的最新成果则是这一发展进程的下一步。该 AI 模型巧妙地融合了几个数学分支中的既有思想,最终构造出一个完整的证明。然而,它并没有开创任何真正的新方法。此后,人类数学家对这一结果进行了梳理和推广。
这指明了一个中期趋势,即人类数学家和 AI 模型相互补充:AI 对过往研究成果的了解,远超任何在世的人类,也更愿意费力尝试那些极为繁琐、不太可能成功的证明策略。而人类依旧能够深入思考任何一个问题,并提出更有意思的问题。
但这种局面可能维持不了多久。AI 在数学领域的进步速度如此之快,以至于我们很难说,十年后人类数学家还将扮演什么样的角色(如果有的话)。
单位距离问题
保罗·埃尔德什(Paul Erdős)是历史上最高产的数学家之一。他一生发表了 1500 多篇论文,为历史之最。他最擅长的事情之一,就是提出那些表述简单,却蕴含深刻数学思想的问题。
1946 年,他提出了“单位距离问题”。假设二维平面上有若干个点,我们逐一测量每两个点之间的距离:

在这个图中,有 5 个点,共 10 对点。其中 3 对点之间的距离恰好等于 1 个单位,分别是 AD、BE 和 CE。
我们能否重新排列这些点,使得更多对点之间的距离恰好为 1 个单位呢?
答案是肯定的。例如,我们可以把点 A 和 D 移到更靠近 B、C、E 的地方。再经过进一步调整,我们就能让其中 7 对点的距离恰好为 1 个单位。不过,这已经是能够达到的最大值了。
我们可以对 6 个点、7个点做同样的分析。但随着点数增加,问题很快就会变得过于复杂,以至于无法找到精确答案。

5 到 9 个点的排法
因此,埃尔德什不再试图回答对于给定数量的点,究竟有多少对距离为 1,而是试图计算出在点数 n 很大的前提下,距离为 1 的点对数量的上界和下界。
为了算出下界,埃尔德什假设这些点以网格形式排列。这或许不是最优的排法,但如果能证明网格中存在一定数量距离为 1的点对,那么最优排法只会更多。

最简单的排法,是让每个点和它上下左右相邻的点的距离都是 1。但埃尔德什发现,如果把对角线方向也考虑进去,还可以做得更好。只要把网格缩得更小,与每个点距离为 1 的点就会更多。每个点就能和更多的近邻点的距离为1。如上图所示,如果网格间距是 1,则每个点和 4 个点的距离为 1(如左图);如果网格间距是 1/5(如右图),则每个点和 12 个点的距离为 1。
OpenAI 在介绍这项新成果时,附带了一张让人有些摸不着头脑的示意图:网格中的点被许多线段连接在一起。如果在图上叠加一个圆,就容易理解多了:

OpenAI 在宣布 AI 推翻单位距离猜想时所用的示意图。这里的网格间距是 1/√65。单位圆可以穿过网格上的 16 个点(如果网格足够大的话)。
这个做法的依据是勾股定理。假设一个点在另一个点的右边 a 个单位、上方 b 个单位,那么这两个点之间的距离 c 就满足 。这里的诀窍在于选取一个合适的 ,使得满足 的整数对 (a,b) 尽可能多。接着,只要把网格缩小,让相邻网格点之间的距离变成 1/c,就会出现大量距离为 1 的点对。
举个例子,如果取 ,那么勾股定理可以写成 或者 。这正对应前面展示的那个经过 12 个网格点的圆。这些点包括 (0,5)、(3,4)、(4,3)、(5,0)、(-4,3)、(-3,4) 等位置。(严格来说,这些坐标都应该除以 5,例如 (3/5, 4/5),但为了看着更清楚,我省去了分母。)
OpenAI 图中的例子则取的是 。它可以写成 或者 。这意味着,如果网格间距为 ,每个点都会与另外 16 个点距离为 1,例如 、、、、、 等等。 的取值越大——只要选取得当——就能得到更多满足条件的整数对,从而得到更多距离为 1 的点对。
然而,如果相对于网格中的总点数而言, 选得太大了,那么许多潜在的距离为 1 的点就会落到网格之外。
简而言之,我们想找一个足够大,但又不能太大的 。借助数论中的相关结果(包括雅可比二平方和定理),埃尔德什证明了,对于恰当大小的圆而言,距离为 1 的点对数量确实会增长得比点的数量更快,但也仅仅是快一点。
接下来的问题就变成了:还能做得更好吗?为了算出上界,埃尔德什借用了图论——一个截然不同的数学领域——中的论证方法,证明了距离为 1 的点对数量只有那么多。但他得到的这个上界,增长速度远比他构造出的最好的下界要快得多。
埃尔德什猜测,实际的最优值更接近下界,而不是上界。他预测,距离为 1 的点对的最大数量增长得只比点数稍微快一点,但他无法给出证明。他的这一猜想后来被称为“单位距离问题”。在此后的 80 年里,大家一直觉得埃尔德什是对的。
直到 OpenAI 的模型证明他错了。
AI 的解题思路
埃尔德什的猜想基于一个假设:至少在点数很多时,正方形网格所能产生的距离为 1 的点对数量,与其他任何排法大致相当。而 OpenAI 的 AI 证明,这个假设是错的。它证明,只要用另一种更复杂的方式排列这 n 个点,就能得到更多距离为 1 的点对。
这种新排法更加复杂,很难用几句话解释清楚。不过,你可以把它理解为埃尔德什网格的一种巧妙改造。
AI 首先在高维空间中构造了一个网格,然后将这个更复杂的结构投影到二维平面上。此外,AI 并没有使用由 (1,3)、(−3,6) 构成的整数网格,而是利用了一种被称为“代数整数(algebraic integers)”的东西来构造这个更复杂的网格。事实证明,这种高维网格具有更丰富的结构,从而让 AI 在相同数量的点中塞进更多距离为 1 的点对。
这种新排法很难用图表直接展示,因为只有当点数非常庞大时,它的优势才会显现出来。不过,这里有一个通过类似方法构造出的简化版本。
它包含 1345 个点,一共只有 5916 对距离为 1 的点,甚至少于埃尔德什的方法——1296 个点的正方形网格中能产生 7632 对。但我认为,它能帮助我们直观理解,一种并非网格的结构如何比正方形网格产生更多距离为 1 的点对。

AI 模型排法的简化示意图。从中心向外延伸的 12 条红线长度均为 1。
这种更复杂的结构最终带来了回报。虽然 OpenAI 模型的证明并没有明确指出,对于 n 个点,究竟有多少对距离为 1 的点,但人类数学家威尔·萨温(Will Sawin)在此基础上证明了,这个数量的增长速度至少能达到 。这个指数看起来可能很小,但当 n 变得足够大时,这个数字将远超埃尔德什方法所得到的结果。
话虽如此,AI 并没有彻底解决这个难题。目前已知最好的上界大约为 。要缩小这一差距,还需要进一步的研究。
这一成果在 AI 数学研究中处于什么位置?
如果上周之前你问我,大语言模型对数学最新颖的贡献是什么,我大概会指向 Google DeepMind 的 AlphaEvolve 系统。
AlphaEvolve 将大语言模型作为优化过程的核心引擎。如果你能把一个数学问题转化为一段待优化的代码(这通常是可以做到的),大语言模型就能针对某些特定类型的问题,找到比人类更好的解法。去年 11 月,四位数学家(其中包括陶哲轩)发表了一篇论文,分析了 AlphaEvolve 在数学文献中 67 个优化问题上的表现。他们发现,AlphaEvolve 在某些情况下确实改进了此前文献中的结果。
与此前大语言模型所作的贡献(比如文献综述)相比,这在自主性上迈出了一大步。但它仍然需要人类将其转化为优化问题,并把 AI 的输出转化成可用的数学成果。而且,这种方法只适用于特定类型的问题。对于那些更偏重概念的、没有明确优化目标的问题,AlphaEvolve 就无能为力了。
因此,各大 AI 公司一直在努力开发能够直接给出正确数学解答的大语言模型系统。OpenAI 的成果正是朝着这个方向迈出的重要一步。不过,它也符合之前 AI 辅助数学研究的模式。
一方面,其他公司也一直在尝试解决埃尔德什问题。埃尔德什一生提出了数百个问题,而数学家托马斯·布鲁姆(Thomas Bloom)发起了一项整理工作,并在 erdosproblems.com 网站来汇总这些难题。许多 AI 公司都把这些问题当作评估 AI 系统的试金石。
今年 1 月,剑桥大学本科生凯文·巴雷托(Kevin Barreto)和朋友合作,让 GPT-5.2 和 Harmonic 公司的 Aristotle 给出了首个由 AI 自主完成的埃尔德什问题解答。就在上周五,也就是 OpenAI 宣布成果的两天后,Google 也宣布其 AI 系统解决了 9 个未解的埃尔德什问题,其中两个已经搁置了 50 多年。
需要说明的是,OpenAI 解决的这个问题远比我刚刚提到的这些成果更令人印象深刻。但 OpenAI 的方案,其实比新闻头条所暗示的更贴合以往的 AI 研究路径。
尽管单位距离问题广为人知,却在过去 80 年里一直悬而未决,原因之一是大多数人都认为埃尔德什的猜想是对的。但以现有的数学工具来看,我们距离证明埃尔德什给出的界限还差得很远。因此数学家普遍认为,如果要证明这一猜想,必须引入重大的新思想或新方法。
然而正如我们所看到的,AI 通过推广埃尔德什最初的构造推翻了该猜想。这是一个巧妙且并不显然的解法,但它与 AlphaEvolve 这类系统所做的优化工作也有几分相似。
这一点也在部分数学家的反馈中有所体现。数学家蒂莫西·高尔斯写道,当他第一次听说 AI 的成果时,他以为 AI 证明了埃尔德什猜想。“我花了整个晚上调整我的世界观:如果 AI 连这样的证明都能想出来,那么数学家的时代可能很快就要结束了。”
但到了第二天早上,高尔斯和其他外部评审收到了一封介绍该成果的邮件。他这才意识到,大语言模型“是推翻了猜想而不是证明了它,这让我大松了一口气。”
OpenAI 的解法还有两个特点,恰好体现了 AI 相对于人类的优势。
首先,最终的解法依赖于一个看似毫不相关的数学领域——代数数论——的复杂技巧。AI 系统通过大量的数学文献进行训练——而现存的数学知识极其庞大——因此它们对既有数学成果的了解,远超世界上任何一个人。人类要解决这个问题,既需要掌握相关的代数数论知识,又要对单位距离问题感兴趣——这是一个罕见的组合。
其次,整个推导过程极其繁琐,而且看起来不太可能成功,大多数人都会觉得不值得一试。多伦多大学教授雅各布·齐默曼(Jacob Tsimerman)在 OpenAI 的文档中提到,他曾短暂考虑过用类似的方法来推翻这个猜想。但这种方法“极其耗时,而且往往无功而返”,于是他放弃了这个项目。
相反,AI 在找到可行的策略之前,可以不断尝试各种失败的证明策略。OpenAI 完全可以让模型反复尝试同一个问题,直到得到正确的解法。事实上,OpenAI 公布的一张图表显示,即使在最大的词元预算下,内部模型也只有大约一半的概率能够解决该问题。
当然,AI 系统所做的事情依然令人惊叹。齐默曼在评述中写道:“人们总是倾向于在看到一个完整的证明后,才宣称它显而易见,”但正如我前面所指出的,它确实发挥了 AI 系统的长处。
在短期到中期内,这预示着一个 AI 模型与人类互补而非取代人类的世界。AI 系统会去攻克那些由数学家整理出来的问题清单,也会帮助人类从看似毫无关联的数学领域中寻找相关方法。但在选择研究什么问题,以及创造全新的方法上,人类的角色短期内不会被取代。
甚至这一次的成果,本质上也是一次非常典型的人机协作。虽然 AI 系统独立找到了证明,但结果是由人类数学家验证的。随后,其他数学家又写出了更完善的证明,扩展了 AI 最初的想法。例如我前面提到的威尔·萨温找到了一个明确的下界。
然而,这种互补状态会持续多久还很难说。在评论的其余部分,高尔斯探讨了这样一个问题:他听到 AI 推翻猜想时松了一口气,这种反应是否合理。他最终的结论大体上是肯定的。但在一条脚注中,他写道,他猜测“AI 很快就会在建立理论、给出定义以及提出有趣问题等方面达到很高的水平。”
过去一年里,AI 系统从还无法在高中数学竞赛中胜出,发展到了能够以有趣的方式推动数学研究。可以预见,AI 系统在处理数学问题时会变得越来越自主。
与此同时,我们尚未完全摸清当前模型在数学上能做到什么程度。OpenAI 宣布这一消息后不久,密歇根大学博士后马骁发现,只要给一点小提示,GPT-5.5 也能证明埃尔德什是错的。如果一个公开可用的模型就能推翻这个著名的猜想,而此前没人注意到,那么在今天,还有哪些发现其实已经近在咫尺,只是还没人想到去尝试呢?
夜雨聆风