AI自主推翻80年数学猜想,菲尔兹奖得主称里程碑

一场颠覆认知的实验

2026年5月20日，OpenAI发布了一项震惊数学界和AI界的研究成果：其内部的一个通用推理模型，自主证明并推翻了一个存在近80年的组合几何核心猜想——平面单位距离问题（Planar Unit Distance Problem）。

这不是AI在棋类游戏上赢过人类，也不是AI辅助数学家做计算。这是AI第一次独立解决一个公开的、属于数学核心领域的未解决问题。普林斯顿大学著名组合数学家Noga Alon在评价中写道："这是Erdős最喜欢的数学问题之一，每一位从事组合几何研究的数学家都思考过它。"而如今，破解它的不是人类，是AI。

菲尔兹奖得主Tim Gowers在联合评论论文中称这一结果为"AI数学的里程碑"（a milestone in AI mathematics）。数论学家Arul Shankar更是直言："在我看来，这篇论文证明，当前的AI模型已经超越了人类数学助手的角色——它们能够提出独创性的想法，并将其完整地执行到底。"

一个存在80年的"简单"问题

要理解这个突破的分量，需要先了解这个困扰了数学家近80年的问题本身。

平面单位距离问题由20世纪最伟大的数学家之一Paul Erdős于1946年提出。问题本身极其朴素：如果你在平面上放置n个点，其中有多少对点之间的距离恰好等于1？

乍一看，这似乎是一个简单的问题。比如放3个点，你最多可以得到几对单位距离？答案是3——一个等边三角形，每条边长度都为1。4个点呢？一个菱形可以给你4对。5个点呢？6对。

但问题是：当n趋近于无穷大时，单位距离对数的增长速度是多少？长期以来，数学界的主流猜想是：最优解大致为n^(1+o(1))——也就是说，单位距离对数的数量与点数大致呈线性关系。这个猜想的依据是"方格构造"（square grid）：将点排列在正方形网格上，通过对网格进行适当缩放来获得尽可能多的单位距离。

2005年由Brass、Moser和Pach编著的权威著作《离散几何中的研究问题》将这个问题称为"组合几何中可能最著名（也最容易解释）的问题"。Erdős本人甚至为这个问题设立了奖金，足见其在他心中的分量。

AI如何"思考"出证明？

最令人惊讶的不仅是结果本身，更是它被发现的方式。

OpenAI在公告中明确强调：这个证明来自一个新的通用推理模型（new general-purpose reasoning model），而不是一个专门针对数学训练的模型，也不是一个通过搜索大量证明策略来找到答案的系统，更不是专门为这个单位距离问题设计的。

这意味着，这个模型在其他领域的推理能力同样强大。它之所以解决了几何问题，是因为它"碰巧"被用来测试一系列Erdős问题时，在这道题上做出了突破性发现。

模型的具体推理过程相当精彩。数学家在验证论文时发现，AI引入了一个人类此前未曾想到的切入点：代数数论（algebraic number theory）。原本这是一个纯粹的组合几何问题——点和距离的关系——但AI却从代数数论中借用了工具，用一种极其巧妙的方式构造了反例。

Noga Alon在评论中写道："正确的答案并非n^(1+o(1))，这一点本身就令人惊讶。而构造及其分析以一种优雅而巧妙的方式应用了代数数论中相当复杂的工具。"

OpenAI提到了证明中运用的几个核心概念和关键思路，包括：

代数数论中的单位群理论
（Unit groups in algebraic number theory）：模型利用代数扩张中的单位群结构来生成大量满足特定距离约束的点对
复数域中的格点构造
（Lattice construction in complex plane）：通过复平面中特定代数整数环的格点布局，突破了传统方格构造的极限
数域中的范数约束
（Norm constraints in number fields）：利用范数理论确保构造出的点对之间的距离精确为1

更具体地说，模型构造了一个无限族的新构造，使得单位距离对的数量增长超出了n^(1+o(1))，达到了多项式级别的改进。这个构造的证明已经经过了外部数学家团队的独立验证——由普林斯顿大学的Noga Alon、剑桥大学的Tim Gowers（菲尔兹奖得主）、多伦多大学的Jacob Tsimerman以及数论学家Arul Shankar组成的评审团队逐行检查了证明逻辑。

他们专门撰写了一篇配套评论论文，详细解释了证明的核心思想、历史背景以及这一结果的重要性。数学家们甚至不满足于仅仅"验证正确"，他们还用自己的语言重新阐述了证明，确保数学界的每个人都能理解。

为什么这是AI推理的"GPT时刻"？

在AI发展的历史上，有几个标志性节点：

2016年
：AlphaGo击败李世石，AI在围棋领域超越人类
2020年
：AlphaFold预测蛋白质结构，AI在科学领域取得重大突破
2023年
：GPT-4通过律师资格考试，AI在语言理解上达到人类水平
2026年5月20日
：OpenAI通用推理模型自主推翻组合几何核心猜想

这件事的独特之处在于：它证明AI不仅能在封闭规则（如围棋）或数据密集（如蛋白质结构预测）的领域超越人类，还能在开放探索的纯数学推理领域做出开创性贡献。

维度	之前的AI数学成就	本次突破
问题类型	竞赛题、已有解题模板的题目	近80年未决的学科核心猜想
验证方式	人类出题已知答案	AI独立发现，数学家验证
工具使用	符号计算、定理证明器	通用推理模型自主思考
创新性	在已有框架内求解	引入代数数论，开创新构造
可迁移性	专用系统，仅限数学	通用模型，可跨领域

另一位验证数学家Jacob Tsimerman评价道："问题本身很难，但更难得的是，AI找到了一个每个人都能理解的优美构造。这正是伟大数学的特征。"

OpenAI方面表示，这个结果是在更广泛的测试中意外获得的——他们原本只是想测试模型在一系列Erdős问题上的表现，没想到它直接解决了一个核心问题。这进一步证明了：当AI推理能力提升到一定水平时，会产生意想不到的、跨越边界的成果。

对数学界和AI界的深远影响

这一突破产生的连锁反应正在多个层面展开。

对数学界而言，这意味着AI不再是"计算器"或"验证器"，而是真正的研究伙伴。传统上，数学猜想需要数学家花费数月甚至数年的思考才能取得突破，而AI可以在更短时间内探索更多可能性。当然，这并不意味着数学家会被取代——事实上，AI提出的构造仍然需要人类数学家来理解、解释和推广。但AI可以极大地加速数学发现的过程。

对AI界而言，这一成果打破了一个重要的心理障碍。在此之前，很多人认为"创造性数学推理"是人类智能的最后堡垒之一。现在，这个堡垒也被攻破了。这不仅意味着AI的推理能力已经达到了一个新的水平，也意味着在科学研究的其他领域——物理学、生物学、化学——AI可能同样能够做出原创性贡献。

OpenAI官方声明中提到，这项成果是模型在多任务测试中的"意外收获"。当一个通用的推理能力模型在日常工作中被推向极限时，它表现出了跨领域的创新能力。这暗示着：通用人工智能（AGI）的某些关键能力可能比我们预期的更近。

全球AI竞赛的加速信号

这次突破并非孤立事件。2026年5月的第三周，AI行业几乎每天都有重磅消息：

5月19日
：Google I/O上，Google搜索框25年来首次改版，Gemini 3.5 Flash发布，AI搜索月活用户突破10亿，覆盖全球180多个国家和地区
5月20日
：阿里巴巴发布Qwen3.7-Max，可自主运行35小时，执行超过1000次工具调用，Apex Math Reasoning得分44.5，超越Claude Opus-4.6 Max（34.5）和DeepSeek V4-Pro Max（38.3）；同日发布自研AI芯片Zhenwu M890，已出货超56万颗
5月21日
：NVIDIA Q1财报营收816亿美元超预期（预期788.6亿美元），Vera芯片宣布开辟2000亿美元新市场，供应链承诺从952亿美元增至1190亿美元
5月22日
：OpenAI在新加坡开设首个海外应用AI实验室，承诺投资超3亿新加坡元；同时新加坡更新了Agentic AI治理框架，已有60多个组织参与

这些事件叠加在一起，勾勒出一幅清晰的图景：2026年5月，AI竞争已经从"谁能训练出更大的模型"，全面转向"谁能做出更聪明的推理"和"谁能真正用好AI"。OpenAI用一个纯粹的推理实验证明了，在拼"聪明"这件事上，AI还有巨大的潜力尚未释放。

一个更深远的问题：AI学会"思考"了吗？

这次突破也引发了一个更根本的追问：AI是真的"理解"了数学，还是只是碰巧找到了一个正确答案？

持谨慎态度的观察者指出，AI推理模型的内部机制仍然是一个黑箱。我们能看到输入和输出，但很难确定它在"推理"过程中究竟经历了什么——是真正像人类数学家一样构建了概念框架，还是仅仅在大规模模式匹配中"撞"上了一个正确路径？

但支持者的反论同样有力：数学本身就是关于逻辑链条的，只要AI产出的证明能够被独立验证，并且展现出了人类意料之外的创造性（比如引入代数数论的工具），那么无论其内部机制如何，结果本身就已经足够有价值。

Tim Gowers在评论中表达了一种折中的看法："无论这个发现是如何产生的，它都拓展了我们对于数学发现边界的认知。如果AI能做到这一点，那么还有多少等待发现的数学定理藏在我们想象力之外？"

这个问题短期内不会有答案，但它至少说明了一件事：AI与人类的关系正在从"工具-使用者"向"协作者-协作者"转变。数学家不再需要独自面对难题，他们有了一个不知疲倦、富于创造力的"数字同事"。

在这个大背景下，OpenAI的几何猜想突破显得尤为关键——它证明AI的能力天花板远未触及。当全球科技巨头在大模型竞赛中比拼参数规模和benchmark分数时，一家AI实验室却用推理能力击穿了数学前沿。

这或许才是2026年5月真正的分水岭时刻：AI从"好用"进入了"能发现"的阶段。不再是人类告诉AI怎么做，而是AI告诉人类"这个问题可以这样做"。

正如Arul Shankar所说："AI不仅能当助手了，它已经能做主角了。"

参考资料：

OpenAI官方公告：An OpenAI model has disproved a central conjecture in discrete geometryhttps://openai.com/index/model-disproves-discrete-geometry-conjecture/
完整证明PDF（OpenAI）https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-proof.pdf
数学家验证评论论文（Tim Gowers、Noga Alon、Arul Shankar、Jacob Tsimerman）https://cdn.openai.com/pdf/74c24085-19b0-4534-9c90-465b8e29ad73/unit-distance-remarks.pdf
模型推理链摘要https://cdn.openai.com/pdf/1625eff6-5ac1-40d8-b1db-5d5cf925de8b/unit-distance-cot.pdf
VentureBeat AI频道报道https://venturebeat.com/ai/
2005年著作《Research Problems in Discrete Geometry》（Brass, Moser, Pach）- 参考文献中引用的权威数学著作