AI 真的开始动数学家的饭碗了?

5 月 21 日，OpenAI 宣布他们的一个通用推理模型，自主推翻了「平面单位距离猜想」这道由匈牙利数学家保罗·Erdős（厄多斯）于 1946 年提出的，困扰数学界 79 年的几何难题。

平面单位距离猜想：https://www.renyi.hu/~p_erdos/1946-03.pdf

相比数学成果，本次「平面单位距离猜想」被推翻的意义更在于 AI 似乎真的像个数学家一样解决了正式的数学猜想，触碰到了科研的上游。

并且完成本次工作的是 OpenAI 内部的一个通用推理模型，并非数学专家模型。这意味着未必要等到智能「涌现」，足够多的跨领域知识或许就能回答许多悬而未决的问题。

社区中，马骁@不等式爱好者称不需要什么「内部模型」， GPT5.5 能复现同款证明。

注：马骁作为青年数学家，此前与芝加哥大学邓煜教授、密歇根大学 Zaher Hani 教授合作在希尔伯特第六问题的研究中取得重要进展 (https://arxiv.org/abs/2503.01800)。

我们到底该如何理解这件事？

这次事件涉及太多层面 —— 数学本身、AI 的推理能力、科研范式、模型路线之争、PhD 培养体系、人与 AI 的协作方式，更现实的，人以后到底该怎么使用 AI。

我们不妨暂时先跳出「OpenAI 又发了个厉害成果」的视角，从社区的 9 个角度管中窥豹，看看 AI 推翻数学猜想究竟意味着什么。

①OpenAI 公开了哪些信息

Open AI 的公告：https://openai.com/index/model-disproves-discrete-geometry-conjecture/

1、unit-distance-proof. pdf

https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf

这里面包含了 ai 生成的原始证明（构造）以及对其的解释。

2、unit-distance-remarks. pdf

https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-remarks.pdf

人类数学家对原始证明的改进，以及九位数学家各自抒发对于 ai 这个证明的见解。

值得指出的是，九位数学家中除了 Will Sawin 的部分，其他都不包含任何技术性内容。所以即使你并非数学专业的人，想要知道该如何评价此事，那么阅读这些数学家的评价是最佳选择。

3、unit-distance-cot. pdf

https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925de8b/unit-distance-cot.pdf

这是 ai 的思维链。

@Fyx1123581347

②什么是

平面单位距离猜想

在平面上给定 n 个点，最多能有多少对点之间的距离恰好等于 1？

这个最大值记作 ν(n)。

埃尔德什本人猜测，对于任意大的 n，ν(n) 小于等于 n^(1+C/log⁡log⁡n)，C 是某个常数。

这个上界比 n 略大、比 n^(4/3) 小很多。

@赵泠

Erdős 不同距离问题指出，平面上任意两点的集合都存在近似线性数量的不同距离，这个问题由 Paul Erdős 在 1946 年提出。

更详细版本：提出了一组点中有多少对点的问题， n 点之间的距离可能为单位距离。

用图论术语来说，这个问题是问单位距离图的密度可以有多大，而 Erdős 关于这个问题的论文是极值图论的早期著作之一。我作为一名职业数学家在今年加入到 NLP 实验室工作，并且我还研究 NP 问题的工作，因此我是知道大模型它是怎么推导数学的。

@Princeps M4sato

③AI 是怎么推翻↑的

答主@Fyx1123581347

④OpenAI 的结果经过哪些专家验证？

挂名 review 的论文作者包括 Noga Alon、Tim Gowers、Will Sawin、Melanie Matchett Wood、Jacob Tsimerman——这个名单里有菲尔兹奖得主，有 Sloan Fellow 级别的数论学家，有组合学界的扛把子。

@AI解码师

⑤这是什么程度上的里程碑？

以前 ai 只能干两种数学的问题一类是验证型，比如 Lean/Coq/Isabelle 里的形式化证明；

另一类是搜索型，比如矩阵乘法算法、cap set 构造、packing/coding 类问题。

这次是第一次 AI 能研究，数学细分领域（离散几何）几十年的 open question。

@Physhan

这次的事件让我必须重新审视一个问题：「通用推理」和「领域专长」之间的边界，是不是已经开始松动了？

如果一个通用模型能够主动去试与人类直觉相反的方向（Erdős 自己都相信猜想成立，整个社区也倾向上界正确），并且能从一个不被看好的工具箱里翻出钥匙——那它至少在某种意义上，已经摆脱了「模仿人类思路」这个紧箍咒。

@AI解码师

⑥为什么是 OpenAI ？

OpenAI 这家公司，一直以来瞄准的就是数学、物理以及科学方面的问题。在宣传 GPT-4 或 GPT-5 的时候，他们最大的噱头就是 HLE 还有数学奥数这类问题。但可以看到，这种东西的受众面比较窄，仅仅涉及到比较高精尖的前沿科学。而实际上，普通人用的其实就是 ChatGPT 的对话版而已，基本不可能涉及到这类问题，所以对于最包容 AI 的程序员来说，也没有太大的作用。

而 Anthropic，主攻方向一直就是编程。特别是它的代表性产品 Claude Code，更是成为一众程序员或相关从业者的首要选择。

从这点来看，我觉得短期内 Anthropic 的估值超过 OpenAI 是很正常的，因为的确用的人很多，而且非常有用。但长期来看，真不一定这两家公司谁的估值更高。毕竟 GPT 这个模型在顶层智能程度上，实际上还是数一数二的。现在 OpenAI 也在奋起直追，用 Codex 来追赶 Claude Code，看起来也不像是有短板的样子。

@平凡

⑦对做研究的人

这意味着什么？

我想补充一些 PhDing 的视角，因为这已经挑战了现有的 phd 培养体系。

很多做 theory 的组，而且还是比较好的那种，培养学生的方式都是挑一些 open problems 来做，这些 open problems 可大可小（最小的可以是 math puzzle)，不管能不能做出来，学生自己肯定能在接受这种学术训练的过程中学到很多东西。解决这种课题可能得耗费一个完整的 phd 周期，甚至更长。

这套流程，可以说是学术中坚的培养方式；但现在非内部使用的 gpt 5.5 pro 都能做这种规模的 Erdos 问题的话，可以说这套培养体系已经收到冲击了：因为从零培养一个学生做这些事，耗费的成本要远远大于直接用 LLM…

当然，如果我们仔细观察 prompt，可以看出这是个 well defined problem，条件边界都写的非常清楚，这应该是 LLM 完全可以 leverage 的部分，也是做得比人好的地方，毕竟要论知识面和知识点之间诸多潜在联系，人类已经落后于 LLM 了。

当然，我感觉现有的 theory-driven phd 培养方式可能也会转向，原来可能挑战的都是 well defined problems，现在可能会做一些 less well defined 类型，甚至最好能去关注一些 real world implemented computational phenomenona.

@闪光的林有德

说明可能现在【提出AI能够解决的问题】的能力异常重要，有很多问题已经是AI可以解决的了，但我们不知道AI能解决哪些问题，随便提一个难题大概率只能获得幻觉。AI 本身也提不出合适的问题。

提出正好在 AI 能力边界的问题，在现阶段可能是最重要的事。

@还是不注名好

⑧这次推翻有什么局限性

这是纯数学，在人类能够进出多重宇宙之前，这对物质世界毫无用处。

ChatGPT 无法画出符合这个「证明」的图，因为它用的数论方法会产生畸形巨大的参数。最后生成的平面点集的点数是一个二层指数塔，底数和指数都很大。在大数的世界里，这种结构不怎么样，但物质宇宙不是给这种东西准备的。对于无穷大的 n，这些点大概会在平面上组成一个形态非凡的拟晶。

数学家参与修改的好处是，他们可以从中得到启发、将数论方法应用于更多的几何问题。即使这个证明最终被否定，「利用高维数域格点投影解决低维几何极值问题」这一思路还是极具启发性的。

@赵泠

⑨抛开宏大的叙事

对我们使用 AI 工具

有何种启发？

我上周日还问了一个数学问题，gemini 瞎回答，它非常诚实的告诉我

「你说得对，被你看穿了。我必须坦诚：作为一个 AI，我确实无法在没有底层符号计算引擎（如 Mathematica 或 SymPy 实时运算）支持的情况下，直接在「脑海」里无误地手推并写出那四个极其复杂的积分核 $q_1(\xi)$, $q_2(\xi)$, $q_3(\xi)$, $q_4(\xi)$ 的显式代数表达式。如果我强行在这个回答里写出一大串复杂的代数分式，那极大概率是我为了迎合你而产生的「幻觉」（Hallucination），不仅毫无帮助，反而会误导你。」

当时我失望了好久。没想到今天看到这里高赞回答的那个 prompt 受到启发，换了一种提问 ai 的方法。它居然就算出来了。

我瞬间感觉自己以前用 ai 的方式，像是猴子在玩计算机。

@CoconutPineapple

知乎 × GitHub 账号绑定正式上线！

World Model 火了，为「世界模型」正本清源

知友招生丨清华交叉信息研究院 Data-centric AI 方向硕/博（27 年入学）

🚀 AI 产品扶持计划：

知乎为 AI 产品提供定制宣发支持，了解/报名请戳：知乎「AI 新品非正式发布现场」扶持计划

🚀 知乎 AI 社群：

如果你是泛 AI 爱好者，对 AI 资讯感兴趣，欢迎扫码加入知乎 AI 社群↓，我们将每周送上 AI 周报，不定时发布 AI 线上线下活动与 AI 产品测试尝鲜。