AI推翻数学猜想

80年的信念，被一个"非人类"的思路推翻了

2026年5月20日，OpenAI做了一件让整个数学界集体失语的事：它的推理模型推翻了保罗·埃尔德什（Paul Erdős）1946年提出的"单位距离猜想"。

这个猜想困扰了人类近80年。不是没人试过——无数顶尖头脑尝试证明它，全都铩羽而归。但所有人都默认一个前提：Erdős猜的大方向应该是对的，只是证明太难了。

然后AI说：方向就是错的。

它不是在人类的赛道上跑赢了人类。它是在人类压根没看到的方向上，开了一条新路。

这和"AI算力碾压人类"的故事完全不同。 这是一个关于"认知盲区"的故事。

三个事件，一条暗线

过去几个月，AI在数学领域搞出了三件大事。单独看每一件都够上头条，但放在一起看，你才会发现一条更深的暗线。

事件一：OpenAI推翻Erdős单位距离猜想（2026年5月）

Erdős的单位距离猜想问的是：平面上放n个点，距离恰好为1的点对最多有多少？80年来，数学家们的直觉是"方形网格差不多就是最优解"。所有人沿着这个方向证明——没有成功，但也没人怀疑方向本身。

OpenAI的模型用代数数域构造出了一种全新的点集排列方式，单位距离对数超出了此前公认的最优上限。这意味着什么？意味着80年来数学家们坚信的"最优解大概是方形网格"这个信念，从一开始就是错的。

Tim Gowers——菲尔兹奖得主——说了一句话让人后背发凉："如果这篇论文是人类写的并投给《数学年鉴》，我会毫不犹豫地推荐录用。"

更戏剧性的是，7个月前曾痛批OpenAI数学能力声明是"严重误述"的Thomas Bloom，这次亲自署名背书。他的比喻几乎带着诗意："AI正在帮助我们更充分地探索几个世纪以来我们建造的数学大教堂，还有哪些看不见的奇迹在等待着？"

事件二：谷歌Aletheia独立破解6道博士级难题（2026年3月）

谷歌DeepMind的数学智能体Aletheia——名字来自古希腊语"真理"——在一个叫FirstProof的挑战中，无人工干预地独立破解了10道博士级开放性难题中的6道。这些题不是题库里的已知考题，有些"全球只有几十个人能读懂题意"。

但真正让人震撼的不是正确率，而是它的跨域直觉。

面对一道离散组合数学问题，Aletheia没有用组合数学的任何工具，而是调用了连续数学领域的基尔斯布劳恩定理、测度论和斯通-魏尔斯特拉斯定理——用连续性定理降维打击离散空间。

这种操作，没有任何人类数学家尝试过。不是因为能力不够，而是没有人会想到去这个方向找工具。你的专业是代数，你不会想到去拓扑学里翻答案。但AI没有专业边界，它只看"逻辑上是否可行"。

事件三：牛津教授+AI协作破解群论悬案（2026年5月）

Kourovka Notebook是群论领域的"悬案簿"，第21.10号问题几十年没人解开。牛津大学的Marc Lackenby借助谷歌的AI系统发起冲击。

AI第一次给出的证明是错的。

但系统里有个审查Agent，专门负责挑错。它精准定位了漏洞所在。Lackenby看到审查结果后突然说了一句："等一下，我知道该怎么填补这个漏洞。"

AI犯错，反而成了人类突破的跳板。

这不是偶然。这个系统会追踪所有失败的假说和被否定的假设，因为"在数学研究里，知道什么行不通往往和知道什么行得通同等重要"。这些"负空间"不会被丢弃，而是成为后续探索的上下文。

最终，基于AI的不完美初稿+审查Agent的漏洞定位+人类数学家的直觉，论文诞生了。

深度思考：为什么这三件事放在一起很重要？

1. 证伪比证明更致命

人类做数学有一个根深蒂固的习惯：先猜结论，再找证明。 猜想之所以叫猜想，就是因为我们先相信它是对的，再去验证。

但Erdős单位距离猜想的推翻暴露了一个问题——如果猜想本身就是错的呢？

80年。几十位顶尖数学家。无数个不眠之夜。全花在证明一个方向就错了的命题上。

AI的价值不是"算得更快"，而是它不受"这看起来应该是对的"这种直觉的束缚。人类会把"方形网格看起来很优"当成信仰，AI不会。它只是在所有逻辑可能的空间里搜索，找到了人类没看到的那扇门。

数学史上最致命的浪费，不是证明太难，而是在错误的方向上证明太久。

2. 跨域直觉是AI的超能力，也是人类的盲区

Aletheia用连续数学打离散问题，这在人类数学界几乎不可能自发出现。这不是贬低人类——恰恰相反，人类的专业化是深度思考的前提。你不可能在精通代数的同时还精通微分拓扑，人的认知带宽是有限的。

但AI没有这个限制。

它的知识库是全视域的。当它面对一道组合数学题时，它不会像人类那样"先翻组合数学的工具箱"，而是直接在所有数学分支的交叉地带搜索。这种能力用陶哲轩的话说，让AI成了他"不可或缺的初级合作者"——但Aletheia已经把这个角色从"初级"推进了一整个时代。

专业化让人类深，全视域让AI广。真正的突破，往往在深和广的交汇处。

3. 出错不是Bug，是Feature

牛津案例里最值得深思的不是AI最终帮人类解了题，而是AI犯错的方式恰恰帮人类找到了突破点。

传统的"AI必须全对才有用"的认知在这里被彻底颠覆。审查Agent揪出漏洞的过程，本质上是在做一件人类很难做的事——精确定位一个长链条推理中"哪一步出了问题"。人读自己的证明容易"顺过去"，但审查Agent不会"顺"，它只认逻辑。

而Lackenby的"等一下"时刻——看到AI的漏洞位置后突然知道怎么补——恰恰说明人类直觉和AI的系统性搜索是互补的。AI提供了广度和穷举，人类提供了灵感和"这一步应该往哪走"的判断。

未来的数学研究不会是"AI替代人类"，而是"AI试错+AI纠错+人类直觉"的三角协作。

一个更大的问题

如果把视角拉远一点，这三件事暗示的问题比数学本身更深远：

数学证明，还是人类唯一能确认"绝对正确"的认知方式吗？

几百步的逻辑推导，AI完成了。审查Agent验证了。人类数学家审阅了。但——我们真的理解AI是怎么想到那条路的吗？

Gowers说他会"毫不犹豫地推荐录用"那篇论文。但推荐录用和理解是两件事。AI的证明在逻辑上无懈可击，但它的思考过程——为什么它会尝试代数数域？为什么它想到了连续数学？——这些"为什么"我们目前无法回答。

我们得到了答案，但不一定理解路径。

这让人想起1976年四色定理的计算机辅助证明——数学界争论了几十年：一个人类无法完整阅读和理解的证明，算不算"证明"？

50年后，这个问题不但没有消失，反而变得更加尖锐。

写在最后

Thomas Bloom说AI在帮我们"探索数学大教堂里看不见的奇迹"。

但我更想说的是：AI不是在帮我们探索已有的教堂。它在告诉我们，教堂之外还有建筑。

80年来，数学家们在Erdős猜想这座"教堂"里反复修缮——加固梁柱、打磨细节、寻找更好的证明路径。AI做的事情是：走到外面，回过头说——你们盖错地方了。

这不是终结，是开始。

数学的下一个黄金时代，可能不是人类独占的了。但没关系——真理不在乎是谁找到的，只在乎它是否为真。