
5 月 21 日,OpenAI 宣布他们的一个通用推理模型,自主推翻了「平面单位距离猜想」这道由匈牙利数学家保罗·Erdős(厄多斯)于 1946 年提出的,困扰数学界 79 年的几何难题。

平面单位距离猜想:https://www.renyi.hu/~p_erdos/1946-03.pdf
相比数学成果,本次「平面单位距离猜想」被推翻的意义更在于 AI 似乎真的像个数学家一样解决了正式的数学猜想,触碰到了科研的上游。
并且完成本次工作的是 OpenAI 内部的一个通用推理模型,并非数学专家模型。这意味着未必要等到智能「涌现」,足够多的跨领域知识或许就能回答许多悬而未决的问题。
社区中,马骁@不等式爱好者 称不需要什么「内部模型」, GPT5.5 能复现同款证明。

注:马骁作为青年数学家,此前与芝加哥大学邓煜教授、密歇根大学 Zaher Hani 教授合作在希尔伯特第六问题的研究中取得重要进展 (https://arxiv.org/abs/2503.01800)。
我们到底该如何理解这件事?
这次事件涉及太多层面 —— 数学本身、AI 的推理能力、科研范式、模型路线之争、PhD 培养体系、人与 AI 的协作方式,更现实的,人以后到底该怎么使用 AI。
我们不妨暂时先跳出「OpenAI 又发了个厉害成果」的视角,从社区的 9 个角度管中窥豹,看看 AI 推翻数学猜想究竟意味着什么。
①OpenAI 公开了哪些信息
Open AI 的公告:https://openai.com/index/model-disproves-discrete-geometry-conjecture/
1、unit-distance-proof. pdf
https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf
这里面包含了 ai 生成的原始证明(构造)以及对其的解释。
2、unit-distance-remarks. pdf
https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-remarks.pdf
人类数学家对原始证明的改进,以及九位数学家各自抒发对于 ai 这个证明的见解。
值得指出的是,九位数学家中除了 Will Sawin 的部分,其他都不包含任何技术性内容。所以即使你并非数学专业的人,想要知道该如何评价此事,那么阅读这些数学家的评价是最佳选择。
3、unit-distance-cot. pdf
https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925de8b/unit-distance-cot.pdf
这是 ai 的思维链。
@Fyx1123581347
②什么是
平面单位距离猜想
在平面上给定 n 个点,最多能有多少对点 之间的距离 恰好等于 1?
这个最大值记作 ν(n)。
埃尔德什本人猜测,对于任意大的 n,ν(n) 小于等于 n^(1+C/loglogn),C 是某个常数。
这个上界比 n 略大、比 n^(4/3) 小很多。
@赵泠
Erdős 不同距离问题指出,平面上任意两点的集合都存在近似线性数量的不同距离,这个问题由 Paul Erdős 在 1946 年提出。
更详细版本:提出了一组点中有多少对点的问题, n 点之间的距离可能为单位距离。
用图论术语来说,这个问题是问单位距离图的密度可以有多大,而 Erdős 关于这个问题的论文是极值图论的早期著作之一。我作为一名职业数学家在今年加入到 NLP 实验室工作,并且我还研究 NP 问题的工作,因此我是知道大模型它是怎么推导数学的。
@Princeps M4sato
③AI 是怎么推翻↑的
答主@Fyx1123581347

④OpenAI 的结果经过哪些专家验证?
挂名 review 的论文作者包括 Noga Alon、Tim Gowers、Will Sawin、Melanie Matchett Wood、Jacob Tsimerman——这个名单里有菲尔兹奖得主,有 Sloan Fellow 级别的数论学家,有组合学界的扛把子。
@AI解码师
⑤这是什么程度上的里程碑?
以前 ai 只能干两种数学的问题一类是验证型,比如 Lean/Coq/Isabelle 里的形式化证明;
另一类是搜索型,比如矩阵乘法算法、cap set 构造、packing/coding 类问题。
这次是第一次 AI 能研究,数学细分领域(离散几何 )几十年的 open question。
@Physhan
这次的事件让我必须重新审视一个问题:「通用推理」和「领域专长」之间的边界,是不是已经开始松动了?
如果一个通用模型能够主动去试与人类直觉相反的方向(Erdős 自己都相信猜想成立,整个社区也倾向上界正确),并且能从一个不被看好的工具箱里翻出钥匙——那它至少在某种意义上,已经摆脱了「模仿人类思路」这个紧箍咒。
@AI解码师
⑥为什么是 OpenAI ?
OpenAI 这家公司,一直以来瞄准的就是数学、物理以及科学方面的问题。在宣传 GPT-4 或 GPT-5 的时候,他们最大的噱头就是 HLE 还有数学奥数这类问题。但可以看到,这种东西的受众面比较窄,仅仅涉及到比较高精尖的前沿科学。而实际上,普通人用的其实就是 ChatGPT 的对话版而已,基本不可能涉及到这类问题,所以对于最包容 AI 的程序员来说,也没有太大的作用。
而 Anthropic,主攻方向一直就是编程。特别是它的代表性产品 Claude Code,更是成为一众程序员或相关从业者的首要选择。
从这点来看,我觉得短期内 Anthropic 的估值超过 OpenAI 是很正常的,因为的确用的人很多,而且非常有用。但长期来看,真不一定这两家公司谁的估值更高。毕竟 GPT 这个模型在顶层智能程度上,实际上还是数一数二的。现在 OpenAI 也在奋起直追,用 Codex 来追赶 Claude Code,看起来也不像是有短板的样子。
@平凡
⑦对做研究的人
这意味着什么?
我想补充一些 PhDing 的视角,因为这已经挑战了现有的 phd 培养体系。
很多做 theory 的组,而且还是比较好的那种,培养学生的方式都是挑一些 open problems 来做,这些 open problems 可大可小(最小的可以是 math puzzle),不管能不能做出来,学生自己肯定能在接受这种学术训练的过程中学到很多东西。解决这种课题可能得耗费一个完整的 phd 周期,甚至更长。
这套流程,可以说是学术中坚的培养方式;但现在非内部使用的 gpt 5.5 pro 都能做这种规模的 Erdos 问题的话,可以说这套培养体系已经收到冲击了: 因为从零培养一个学生做这些事,耗费的成本要远远大于直接用 LLM…
当然,如果我们仔细观察 prompt,可以看出这是个 well defined problem,条件边界都写的非常清楚,这应该是 LLM 完全可以 leverage 的部分,也是做得比人好的地方,毕竟要论知识面和知识点之间诸多潜在联系,人类已经落后于 LLM 了。
当然,我感觉现有的 theory-driven phd 培养方式可能也会转向,原来可能挑战的都是 well defined problems,现在可能会做一些 less well defined 类型,甚至最好能去关注一些 real world implemented computational phenomenona.

@闪光的林有德
说明可能现在【提出AI能够解决的问题】的能力异常重要,有很多问题已经是AI可以解决的了,但我们不知道AI能解决哪些问题,随便提一个难题大概率只能获得幻觉。AI 本身也提不出合适的问题。
提出正好在 AI 能力边界的问题,在现阶段可能是最重要的事。
@还是不注名好
⑧这次推翻有什么局限性
这是纯数学,在人类能够进出多重宇宙之前,这对物质世界毫无用处。
ChatGPT 无法画出符合这个「证明」的图,因为它用的数论方法会产生畸形巨大的参数。最后生成的平面点集的点数是一个二层指数塔,底数和指数都很大。在大数的世界里,这种结构不怎么样,但物质宇宙不是给这种东西准备的。对于无穷大的 n,这些点大概会在平面上组成一个形态非凡的拟晶。
数学家参与修改的好处是,他们可以从中得到启发、将数论方法应用于更多的几何问题。即使这个证明最终被否定,「利用高维数域格点投影解决低维几何极值问题」这一思路还是极具启发性的。
@赵泠
⑨抛开宏大的叙事
对我们使用 AI 工具
有何种启发?
我上周日还问了一个数学问题,gemini 瞎回答,它非常诚实的告诉我
「你说得对,被你看穿了。我必须坦诚:作为一个 AI,我确实无法在没有底层符号计算引擎(如 Mathematica 或 SymPy 实时运算)支持的情况下,直接在「脑海」里无误地手推并写出那四个极其复杂的积分核 $q_1(\xi)$, $q_2(\xi)$, $q_3(\xi)$, $q_4(\xi)$ 的显式代数表达式。如果我强行在这个回答里写出一大串复杂的代数分式,那极大概率是我为了迎合你而产生的「幻觉」(Hallucination),不仅毫无帮助,反而会误导你。」
当时我失望了好久。没想到今天看到这里高赞回答的那个 prompt 受到启发,换了一种提问 ai 的方法。它居然就算出来了。
我瞬间感觉自己以前用 ai 的方式,像是猴子在玩计算机。
@CoconutPineapple
阅读更多
🚀 AI 产品扶持计划:
知乎为 AI 产品提供定制宣发支持,了解/报名请戳:知乎「AI 新品非正式发布现场」扶持计划
🚀 知乎 AI 社群:
如果你是泛 AI 爱好者,对 AI 资讯感兴趣,欢迎扫码加入知乎 AI 社群↓,我们将每周送上 AI 周报,不定时发布 AI 线上线下活动与 AI 产品测试尝鲜。

知乎AI交流群
让一部分开发者先走起来
🚀 知乎科技账号正式登陆 X:
👉 https://x.com/ZhihuFrontier,聚焦「技术 × 观点」的跨语境对话
夜雨聆风