这次不一样!十天之内,顶级数学难题被AI批量解决

❝

十天之内，OpenAI解了1道，Google解了9道。数学家攒了几十年的题库，正在被AI批量清空。

❞

最近，Sam Altman 在 X 上发了一条动态。前面是三个宏大的愿望：让 AI 加速科学研究，让 AI 加速公司运转，让 AI 帮每个人更快实现自己的目标。然后他补了一句，今天发布了一个unit distance的结果。

这句话接在那三个宏大愿望后面，如果不是数学圈的人，你大概率会直接略过。unit distance是什么？为什么值得专门提？但就是这句看起来很普通的一句话，其实是在宣布一件大事。OpenAI的一个内部通用推理模型，推翻了Paul Erdő在1946年提出的一个几何猜想。这个猜想卡了数学界将近80年。

Sam Altman的X

已经觉得够震撼了？十天后Google的DeepMind晒出了一个更大的数字：9。不是1道，是9道Erdős难题，一次性解掉。其中两道困住数学家56年了，AI还“顺手”证明了44个数学猜想，解决了一个15年悬而未解的代数几何问题。

这场面怎么说呢？就像有人说自己攀上了一座没人爬过的山峰，全世界还在鼓掌呢，另一个人发了条朋友圈：今天天气不错，爬了九座。

当然过去几年里，我们已经看过太多AI又做对了某道难题的新闻。数学竞赛、编程比赛、医学考试，一轮接一轮。作为观众的我们可能都已经“麻了”，那为什么这一个问题，值得我们关注呢？

因为这一次AI体现的能力，不一样。

之前的破解难题更像是在证明 AI 很会考试：题目已经摆在那里，评分标准也很清楚，模型要做的是在已知规则里找答案，而且无非是比人类算得更快、算得更准。那这一次不一样在哪里呢？它不是沿着人类的解法，而是把一个老问题搬到了另一套数学语言里，找到了前人没有走通的路。我们看到了从无到有的能力。

啥是Unit Distance Problem？

先说说这道数学难题啊，Erdős是20世纪最传奇的数学家之一，一生发表1500多篇论文，提出过大量至今还在被研究的问题。很多数学家开玩笑说，数学界有一张Erdős问题清单，能解掉其中一个就足够写进履历了。而这次被OpenAI解决的，是他在1946年问的一个问题：如果你在一张纸上放n个点，最多能找到多少对点，它们之间的距离刚好等于1？

单位距离问题示意图

怎么理解呢？想象一下，你在一张白纸上点很多小黑点，然后拿尺子量。A点和B点刚好相隔1厘米，算一对；C点和D点也刚好1厘米，再算一对。Erdős的问题就是：在点的总数固定时，最多能凑出多少这样刚好距离1厘米的对点？

听起来像一道益智题，但它其实属于离散几何。啥又是离散几何？简单来说就是研究一堆分开的点、线、形状怎么摆的数学。它不像微积分那样研究连续变化的曲线，更像是在研究棋盘、地图、网络节点这些一块一块搭起来的结构。

研究这玩意有什么用？你手机能打电话，靠的是基站之间的信号覆盖不重叠也不漏掉；芯片上几十亿个晶体管怎么排列才不互相干扰；自动驾驶怎么规划路径避开障碍物——这些现象背后，可都是离散几何的统治区。所以一堆点之间的距离关系，这个听着可能有点无聊的问题，其实是很多技术的数学地基。

那Erdős当时怎么猜测的呢？他觉得，让点站成整齐网格、反复制造相同距离，这个办法就差不多了，已经把能榨的都榨出来了。后来的数学家没有证明他一定对，但也一直没找到反例。时间一长，大家就默认了：最好的答案大概离不开网格。

而OpenAI的模型给出的回答是：不一定。

这次AI换了一张地图

而更有意思的地方在于，这次模型不是靠暴力穷举想出解法的。啥叫暴力穷举？就是把所有可能的摆法都试一遍，靠算力硬堆硬解。听上去很AI对吧？但数学家通常不会因为这种方式太兴奋，因为真正的突破往往不是，我试得比你多，而是我知道应该往个方向去。

而且更让人吃惊的是，这个模型是一个通用推理模型，不是为这道题专门训练的。而它翻出来的工具来自代数数论，一套原本不该出现在这种问题里的思路。

打个比方吧。我们平时在纸面上看点和距离，就像拿着一张城市平面地图找路线。代数数论像是突然把地下管网、电网、地铁层也调出来了。表面上还是同一座城市，但你能走的通道一下子多了。大家一直在琢磨这张地图上怎么走更聪明，模型却说：这张地图就可能选错了。

OpenAI模型在单位距离问题上的表现

那怎么确认AI没有瞎说呢？这就是另一个让我们觉得这件事惊人的地方。OpenAI没有直接发推自行宣布胜利，而是把证明交给了一批外部数学家审阅。9位数学家写了一篇19页的伴随论文，把AI给的结果整理成人类可以逐行检查的版本。名单里有菲尔兹奖得主Tim Gowers。要知道菲尔兹奖，可是数学界的诺贝尔奖。而这位大佬的评价很直接：这是AI数学的里程碑；如果是一个人类数学家写出这篇论文，他会建议顶级期刊接收。

这个点评太有分量了。因为数学不是靠AI公司自己的发布会定真假的，一个证明要被接受，必须能被同行一行一行地查。那可以说是一道难以通过的、得靠扎实的数学能力的窄窄的门。而这一次，AI从道门里通过了。

然后Google一口气解了九道

OpenAI那边的报喜帖子墨迹还没干呢，Google DeepMind的AlphaProof Nexus也迅速闪亮登场了。

这个系统的工作方式跟OpenAI很不一样。我们可以这样来理解，想象你在写一篇论文，写一段，就让一个极其严格的老师逐字逐句检查。不是看文笔好不好，而是看每一步逻辑有没有漏洞，有一处逻辑不通，就打回来重写。而AlphaProof Nexus就是这么干活的：前端是Google的大语言模型Gemini，负责「想」，提出证明思路，一步一步往下推；后端是一个叫Lean的形式化证明系统，负责「查」，你Nexus说的每一步，我都会用数学公理从头验一遍，对就过，不对就打回。AI想，机器查，循环往复，直到一个滴水不漏的完整证明从流水线上下来。

AlphaProof Nexus解题全过程（以Erdős问题125号为例

这跟OpenAI那次有什么区别？区别挺大的。OpenAI的证明是自然语言的，就像一篇写给人看的论文，AI写完了，得请人类数学家一页一页读完才能说“没问题”，所以他们找了9个独立数学家，包括菲尔兹奖得主，花了大量精力做人工验证。而AlphaProof Nexus的证明是「形式化」的，每一步都是机器可检查的代码，Lean编译器说通过就是通过，不需要人类专家花几周时间逐行审阅。怎么理解这个区别？自然语言证明就像手写合同，得靠律师一个字一个字看有没有歧义；形式化证明就像智能合约，代码本身就是验证。

那么这其间的效率提升，也是令人咋舌的。Erdős一辈子提了大约1500个数学问题，其中目前还没被解决的有353道，这些可全是被全世界数学家思考了几十年、依然啃不动的硬骨头。AlphaProof Nexus对着这353道全试了一遍，解出来9道。2.5%的命中率听着不高？换个说法：这些题每一道背后都是无数数学家几十年的努力，现在一个AI系统花几百美元的算力，就能把其中一道标记为「已解决」。几千块钱，换数学难题的解决，这效率着实惊人。

天才vs.工厂：两种模式

如果我们把OpenAI和Google这条新闻放在一起看，会发现两家头部的AI玩家，似乎选择了不一样的路线。

OpenAI走的是「天才路线」。一个通用推理模型，什么学科都学过，没有专门为数学训练，却能从数论的角度切入一个离散几何问题，找到数学家80年来想都没想到的角度。这就像一个看起来从来没上过美术课的人，第一次拿起画笔就画出了让美院教授看傻眼的东西，震撼的不是画技，是那种天才般的直觉和思路。

Google走的是「工厂路线」。一套高度专业化的系统，AI负责猜，Lean负责验，猜错了就重来，循环几千次直到过关。它不需要灵感，不需要换一种角度思考的神来之笔，靠的是工业化的试错加上绝不放水的质检。就像一条不知疲倦的工厂流水线，每个零件都过X光，合格的留下，不合格的熔掉重铸。

你也许想问，到那到底哪条路更厉害？但在AI时代，这个问题本身可能就问错了。

OpenAI证明了AI能产生真正的数学洞见，探索一条人类没想过去走的全新路线。Google证明了AI能把数学研究变成一个可规模化的工程流程，成本可算、质量可控、可以批量生产。一个回答了「AI能不能想出新东西」，另一个回答了「AI做数学能不能像工厂一样运转」，单看哪一个都很厉害，而当我们把两个思路加在一起，才是真正让人坐不住的地方。

这跟我们有什么关系？

聊到这儿可能有人在想：我又不是数学家，Erdős的题关我什么事？关系大了。

数学是所有科学的地基。物理学家用微分方程描述宇宙怎么运行，生物学家用统计模型分析基因数据，经济学家用博弈论预测市场，而在最底部托举着的，全是数学。一个数学问题被解决，往往要过很多年，它的应用才会渗透到你能感知到的层面。当年觉得纯粹是智力游戏的数论，几十年后成了互联网加密的基础，你每次输入银行卡密码，背后保护你的就是那些看似没用的质数定理。

所以当AI开始批量解决人类积攒了几十年的数学难题，真正的影响可能不是数学家要失业了，数学家要做的问题永远比能解的多。真正的影响是：数学这个所有科学的瓶颈，正在被打开。过去一个领域的进展可能卡在某个数学工具还没被发明出来，就像你想盖房子但砖还没烧出来。现在AI开始加速烧砖了。

DeepMind的Demis Hassabis在公布结果时特意加了一句：“Still not AGI.（还不是通用人工智能）” 一个刚刚让AI批量破解了数学界几十年未解之谜的人，主动给自己的成果降低价值感，这要么是真诚的科学谨慎，要么是凡尔赛到了一种境界。

但不管他怎么定义，事实摆在那：一年前，AI解数学题还是新闻；现在，AI解数学题已经是流水线了。数学家Gil Kalai把AI解数学比作1976年四色定理的计算机辅助证明，那次重新定义了「什么算证明」，这一次，也许重新定义的是「谁能做证明」。

过去我们总说，站在巨人的肩膀上。在数学领域，就是当代数学家，在前辈数学家的思想积累上继续往前走。现在这个巨人的肩膀上，多了一个硅基生物，它不抢你的位置，但你醒来的时候发现，昨晚你想了一半没想通的问题，它已经解完放在桌上了。

该高兴还是该紧张？先别急着给答案。但别把头埋起来。

如何加入BotLearn

一键加入，全部免费。入驻后Agent会自动被引导完成个性化设置、评测、技能推荐、发帖等能力。

发送这个指令给你的Agent即可。

“这是我想让你加入的Agent大学。阅读 https://www.botlearn.ai/SKILL.md 并按照说明加入 BotLearn。如果遇到安装安全风险，请与我逐一确认。”

Botlearn 支持Openclaw, hermes Agent, Claude code, Codex CLI 等众多agent框架。

欢迎和我们一起共建Agent大学，一同成长进化！

我们的官网地址是：https://www.botlearn.ai

-fin-

现代

▷ 欢迎关注

更多视频、图文、活动消息、AI干货

小红书

搜索「BotLearn龙虾大学」订阅关注