80年的信念,被一个"非人类"的思路推翻了
2026年5月20日,OpenAI做了一件让整个数学界集体失语的事:它的推理模型推翻了保罗·埃尔德什(Paul Erdős)1946年提出的"单位距离猜想"。
这个猜想困扰了人类近80年。不是没人试过——无数顶尖头脑尝试证明它,全都铩羽而归。但所有人都默认一个前提:Erdős猜的大方向应该是对的,只是证明太难了。
然后AI说:方向就是错的。
它不是在人类的赛道上跑赢了人类。它是在人类压根没看到的方向上,开了一条新路。
这和"AI算力碾压人类"的故事完全不同。 这是一个关于"认知盲区"的故事。
三个事件,一条暗线
过去几个月,AI在数学领域搞出了三件大事。单独看每一件都够上头条,但放在一起看,你才会发现一条更深的暗线。
事件一:OpenAI推翻Erdős单位距离猜想(2026年5月)
Erdős的单位距离猜想问的是:平面上放n个点,距离恰好为1的点对最多有多少?80年来,数学家们的直觉是"方形网格差不多就是最优解"。所有人沿着这个方向证明——没有成功,但也没人怀疑方向本身。
OpenAI的模型用代数数域构造出了一种全新的点集排列方式,单位距离对数超出了此前公认的最优上限。这意味着什么?意味着80年来数学家们坚信的"最优解大概是方形网格"这个信念,从一开始就是错的。
Tim Gowers——菲尔兹奖得主——说了一句话让人后背发凉:"如果这篇论文是人类写的并投给《数学年鉴》,我会毫不犹豫地推荐录用。"
更戏剧性的是,7个月前曾痛批OpenAI数学能力声明是"严重误述"的Thomas Bloom,这次亲自署名背书。他的比喻几乎带着诗意:"AI正在帮助我们更充分地探索几个世纪以来我们建造的数学大教堂,还有哪些看不见的奇迹在等待着?"
事件二:谷歌Aletheia独立破解6道博士级难题(2026年3月)
谷歌DeepMind的数学智能体Aletheia——名字来自古希腊语"真理"——在一个叫FirstProof的挑战中,无人工干预地独立破解了10道博士级开放性难题中的6道。这些题不是题库里的已知考题,有些"全球只有几十个人能读懂题意"。
但真正让人震撼的不是正确率,而是它的跨域直觉。
面对一道离散组合数学问题,Aletheia没有用组合数学的任何工具,而是调用了连续数学领域的基尔斯布劳恩定理、测度论和斯通-魏尔斯特拉斯定理——用连续性定理降维打击离散空间。
这种操作,没有任何人类数学家尝试过。不是因为能力不够,而是没有人会想到去这个方向找工具。你的专业是代数,你不会想到去拓扑学里翻答案。但AI没有专业边界,它只看"逻辑上是否可行"。
事件三:牛津教授+AI协作破解群论悬案(2026年5月)
Kourovka Notebook是群论领域的"悬案簿",第21.10号问题几十年没人解开。牛津大学的Marc Lackenby借助谷歌的AI系统发起冲击。
AI第一次给出的证明是错的。
但系统里有个审查Agent,专门负责挑错。它精准定位了漏洞所在。Lackenby看到审查结果后突然说了一句:"等一下,我知道该怎么填补这个漏洞。"
AI犯错,反而成了人类突破的跳板。
这不是偶然。这个系统会追踪所有失败的假说和被否定的假设,因为"在数学研究里,知道什么行不通往往和知道什么行得通同等重要"。这些"负空间"不会被丢弃,而是成为后续探索的上下文。
最终,基于AI的不完美初稿+审查Agent的漏洞定位+人类数学家的直觉,论文诞生了。
深度思考:为什么这三件事放在一起很重要?
1. 证伪比证明更致命
人类做数学有一个根深蒂固的习惯:先猜结论,再找证明。 猜想之所以叫猜想,就是因为我们先相信它是对的,再去验证。
但Erdős单位距离猜想的推翻暴露了一个问题——如果猜想本身就是错的呢?
80年。几十位顶尖数学家。无数个不眠之夜。全花在证明一个方向就错了的命题上。
AI的价值不是"算得更快",而是它不受"这看起来应该是对的"这种直觉的束缚。人类会把"方形网格看起来很优"当成信仰,AI不会。它只是在所有逻辑可能的空间里搜索,找到了人类没看到的那扇门。
数学史上最致命的浪费,不是证明太难,而是在错误的方向上证明太久。
2. 跨域直觉是AI的超能力,也是人类的盲区
Aletheia用连续数学打离散问题,这在人类数学界几乎不可能自发出现。这不是贬低人类——恰恰相反,人类的专业化是深度思考的前提。你不可能在精通代数的同时还精通微分拓扑,人的认知带宽是有限的。
但AI没有这个限制。
它的知识库是全视域的。当它面对一道组合数学题时,它不会像人类那样"先翻组合数学的工具箱",而是直接在所有数学分支的交叉地带搜索。这种能力用陶哲轩的话说,让AI成了他"不可或缺的初级合作者"——但Aletheia已经把这个角色从"初级"推进了一整个时代。
专业化让人类深,全视域让AI广。真正的突破,往往在深和广的交汇处。
3. 出错不是Bug,是Feature
牛津案例里最值得深思的不是AI最终帮人类解了题,而是AI犯错的方式恰恰帮人类找到了突破点。
传统的"AI必须全对才有用"的认知在这里被彻底颠覆。审查Agent揪出漏洞的过程,本质上是在做一件人类很难做的事——精确定位一个长链条推理中"哪一步出了问题"。人读自己的证明容易"顺过去",但审查Agent不会"顺",它只认逻辑。
而Lackenby的"等一下"时刻——看到AI的漏洞位置后突然知道怎么补——恰恰说明人类直觉和AI的系统性搜索是互补的。AI提供了广度和穷举,人类提供了灵感和"这一步应该往哪走"的判断。
未来的数学研究不会是"AI替代人类",而是"AI试错+AI纠错+人类直觉"的三角协作。
一个更大的问题
如果把视角拉远一点,这三件事暗示的问题比数学本身更深远:
数学证明,还是人类唯一能确认"绝对正确"的认知方式吗?
几百步的逻辑推导,AI完成了。审查Agent验证了。人类数学家审阅了。但——我们真的理解AI是怎么想到那条路的吗?
Gowers说他会"毫不犹豫地推荐录用"那篇论文。但推荐录用和理解是两件事。AI的证明在逻辑上无懈可击,但它的思考过程——为什么它会尝试代数数域?为什么它想到了连续数学?——这些"为什么"我们目前无法回答。
我们得到了答案,但不一定理解路径。
这让人想起1976年四色定理的计算机辅助证明——数学界争论了几十年:一个人类无法完整阅读和理解的证明,算不算"证明"?
50年后,这个问题不但没有消失,反而变得更加尖锐。
写在最后
Thomas Bloom说AI在帮我们"探索数学大教堂里看不见的奇迹"。
但我更想说的是:AI不是在帮我们探索已有的教堂。它在告诉我们,教堂之外还有建筑。
80年来,数学家们在Erdős猜想这座"教堂"里反复修缮——加固梁柱、打磨细节、寻找更好的证明路径。AI做的事情是:走到外面,回过头说——你们盖错地方了。
这不是终结,是开始。
数学的下一个黄金时代,可能不是人类独占的了。但没关系——真理不在乎是谁找到的,只在乎它是否为真。
夜雨聆风