这次不一样!十天之内,顶级数学难题被AI批量解决十天之内,OpenAI解了1道,Google解了9道。数学家攒了几十年的题库,正在 被AI批量清空 。 最近,Sam Altman 在 X 上发了一条动态。前面是 三个宏大的愿望 : 让 AI 加速科学研究,让 AI 加速公司运转,让 AI 帮每个人更快实现自己的目标。 然后 他补了一句,今天发布了一个unit distance的结果 。 这句话接在那三个宏大愿望后面,如果不是数学圈的人,你大概率会直接略过。 unit distance是什么? 为什么值得专门提? 但就是这句看起来很普通的一句话,其实是在宣布一件大事。OpenAI的一个内部通用推理模型,推翻了Paul Erdő在1946年提出的一个几何猜想 。 这个猜想卡了数学界将近80年。 已经觉得够震撼了?十天后Google的 DeepMind晒出了一个更大的数字 :9。不是1道,是 9道Erdős难题,一次性解掉 。其中两道困住数学家56年了,AI还“顺手”证明了44个数学猜想,解决了一个15年悬而未解的代数几何问题。 这场面怎么说呢?就像有人说自己 攀上了一座没人爬过的山峰 ,全世界还在鼓掌呢,另一个人发了条朋友圈: 今天天气不错,爬了九座。 当然过去几年里,我们已经 看过太多AI又做对了某道难题的新闻 。数学竞赛、编程比赛、医学考试,一轮接一轮。作为观众的我们 可能都已经“麻了” ,那为什么这一个问题, 值得我们关注呢? 之前的破解难题更像是 在证明 AI 很会考试 :题目已经摆在那里,评分标准也很清楚,模型要做的是在已知规则里找答案,而且无非是比人类算得更快、算得更准。 那这一次不一样在哪里呢? 它不是沿着人类的解法,而是把一个老问题搬到了另一套数学语言里, 找到了前人没有走通的路。我们看到了从无到有的能力。 先说说这道数学难题啊,Erdős是 20世纪最传奇的数学家之一 ,一生发表1500多篇论文,提出过大量至今还在被研究的问题。很多数学家开玩笑说,数学界有一张Erdős问题清单, 能解掉其中一个就足够写进履历了 。而这次被OpenAI解决的,是他在1946年问的一个问题:如果你在一张纸上放n个点,最多能找到多少对点,它们之间的距离刚好等于1? 单位距离问题示意图
怎么理解呢?想象一下,你在一张白纸上点很多小黑点,然后拿尺子量。A点和B点刚好相隔1厘米,算一对;C点和D点也刚好1厘米,再算一对。Erdős的问题就是: 在点的总数固定时,最多能凑出多少 这样刚好距离1厘米的对点? 听起来像一道益智题,但它其实属于离散几何。啥又是离散几何?简单来说就是研究一堆分开的点、线、形状怎么摆的数学。它不像微积分那样研究连续变化的曲线,更像是在研究棋盘、地图、网络节点这些一块一块搭起来的结构。 研究这玩意有什么用?你手机能打电话,靠的是基站之间的 信号覆盖不重叠 也不漏掉; 芯片上几十亿个晶体管怎么排列 才不互相干扰;自动驾驶怎么规划路径避开障碍物——这些现象背后,可都是离散几何的统治区。所以一堆点之间的距离关系,这个听着可能有点无聊的问题,其实是 很多技术的数学地基。 那Erdős当时怎么猜测的呢?他觉得,让 点站成整齐网格、反复制造相同距离, 这个办法就差不多了,已经把能榨的都榨出来了。后来的数学家没有证明他一定对,但也一直没找到反例。时间一长,大家就默认了: 最好的答案大概离不开网格 。 而更有意思的地方在于,这次模型 不是靠暴力穷举想出解法的 。啥叫暴力穷举?就是把所有可能的摆法都试一遍 ,靠算力硬堆硬解。 听上去很AI对吧?但数学家通常不会因为这种方式太兴奋,因为真正的突破往往不是,我试得比你多,而是 我知道应该往个方向去。 而且更让人吃惊的是,这个 模型是一个通用推理模型 ,不是为这道题专门训练的。而它翻出来的工具来自代数数论,一套原本不该出现在这种问题里的思路。 打个比方吧。我们平时在纸面上看点和距离, 就像拿着一张城市平面地图找路线 。代数数论像是突然把地下管网、电网、地铁层也调出来了。表面上还是同一座城市,但你能走的通道一下子多了。大家一直在琢磨这张地图上怎么走更聪明,模型却说: 这张地图就可能选错了 。 那怎么确认AI没有瞎说呢?这就是另一个让我们觉得这件事惊人的地方。OpenAI 没有直接发推自行宣布胜利 ,而是 把证明交给了一批外部数学家审阅 。9位数学家写了一篇19页的伴随论文,把AI给的结果整理成人类可以逐行检查的版本。名单里有菲 尔兹奖得主Tim Gowers 。要知道菲尔兹奖,可是 数学界的诺贝尔奖 。而这位大佬的评价很直接:这是AI数学的里程碑;如果是一个人类数学家写出这篇论文, 他会建议顶级期刊接收 。 这个点评太有分量了。因为数学不是靠AI公司自己的发布会定真假的,一个证明要被接受,必须能被同行一行一行地查。那可以说是一道难以通过的、得靠扎实的数学能力的窄窄的门 。 而这一次,AI从道门里通过了。 OpenAI那边的 报喜帖子墨迹还没干呢 ,Google DeepMind的AlphaProof Nexus也迅速闪亮登场了。 这个系统的工作方式跟OpenAI很不一样 。我们可以这样来理解,想象你在写一篇论文,写一段,就让 一个极其严格的老师逐字逐句检查 。不是看文笔好不好,而是看每一步逻辑有没有漏洞,有一处逻辑不通,就打回来重写。而AlphaProof Nexus就是这么干活的:前端是Google的大语言模型 Gemini,负责「想」,提出证明思路,一步一步往下推;后端是一个叫Lean的形式化证明系统,负责「查」,你Nexus说的每一步,我都会用数学公理从头验一遍,对就过,不对就打回。 AI想,机器查,循环往复,直到一个滴水不漏的完整证明从流水线上下来 。 AlphaProof Nexus解题全过程(以Erdős问题125号为例
这跟OpenAI那次有什么区别?区别挺大的。 OpenAI的证明是自然语言的 ,就像一篇写给人看的论文,AI写完了,得请人类数学家一页一页读完才能说“没问题”,所以他们找了9个独立数学家,包括菲尔兹奖得主, 花了大量精力做人工验证 。而AlphaProof Nexus的 证明是「形式化」 的,每一步都是机器可检查的代码,Lean编译器说通过就是通过,不需要人类专家花几周时间逐行审阅。怎么理解这个区别?自然语言证明就像手写合同,得靠律师一个字一个字看有没有歧义;形式化证明就像智能合约,代码本身就是验证。 那么 这其间的效率提升,也是令人咋舌的 。Erdős一辈子提了大约1500个数学问题,其中目前还没被解决的有353道,这些可全是被 全世界数学家思考了几十年、依然啃不动的硬骨头 。AlphaProof Nexus对着这353道全试了一遍,解出来9道。2.5%的命中率听着不高?换个说法:这些题每一道背后都是无数数学家几十年的努力,现在 一个AI系统花几百美元的算力 ,就能把其中一道标记为「已解决」。 几千块钱,换数学难题的解决,这效率着实惊人。 如果我们把OpenAI和Google这条新闻放在一起看,会发现两家头部的AI玩家,似乎选择了不一样的路线。 OpenAI走的是「天才路线」 。一个通用推理模型,什么学科都学过,没有专门为数学训练,却能从数论的角度切入一个离散几何问题,找到数学家80年来想都没想到的角度。这就像一个看起来从来没上过美术课的人,第一次拿起画笔就画出了让美院教授看傻眼的东西,震撼的不是画技,是那种 天才般的直觉和思路 。 Google走的是「工厂路线」。 一套高度专业化的系统,AI负责猜,Lean负责验,猜错了就重来,循环几千次直到过关。它不需要灵感,不需要换一种角度思考的神来之笔,靠的是 工业化的试错加上绝不放水的质检 。就像一条不知疲倦的工厂流水线,每个零件都过X光,合格的留下,不合格的熔掉重铸。 你也许想问,到那到底哪条路更厉害?但在AI时代, 这个问题本身可能就问错了 。 OpenAI证明了AI能产生真正的数学洞见, 探索一条人类没想过去走的全新路线。Google证明了AI能把数学研究变成一个可规模化的工程流程 ,成本可算、质量可控、可以批量生产。一个回答了「AI能不能想出新东西」,另一个回答了「AI做数学能不能像工厂一样运转」,单看哪一个都很厉害, 而当我们把两个思路加在一起,才是真正让人坐不住的地方 。 聊到这儿可能有人在想:我又不是数学家, Erdős的题关我什么事? 关系大了。 数学是所有科学的地基 。物理学家用微分方程描述宇宙怎么运行,生物学家用统计模型分析基因数据,经济学家用博弈论预测市场,而在最底部托举着的,全是数学。一个数学问题被解决, 往往要过很多年,它的应用才会渗透到你能感知到的层面 。当年觉得纯粹是智力游戏的数论,几十年后成了互联网加密的基础,你每次输入银行卡密码,背后保护你的就是那些看似没用的质数定理。 所以当AI开始批量解决人类积攒了几十年的数学难题,真正的影响可能 不是数学家要失业了 ,数学家要做的问题永远比能解的多。真正的影响是:数学这个 所有科学的瓶颈,正在被打开 。过去一个领域的进展可能卡在某个数学工具还没被发明出来,就像你想盖房子但砖还没烧出来。现在AI开始加速烧砖了。 DeepMind的 Demis Hassabis 在公布结果时特意加了一句:“ Still not AGI . (还不是通用人工智能) ” 一个刚刚让AI批量破解了数学界几十年未解之谜的人,主动给自己的成果降低价值感,这要么是真诚的科学谨慎,要么是凡尔赛到了一种境界。 但不管他怎么定义,事实摆在那:一年前,AI解数学题还是新闻; 现在,AI解数学题已经是流水线了 。数学家Gil Kalai把AI解数学比作1976年四色定理的计算机辅助证明,那次重新定义了「什么算证明」,这一次, 也许重新定义的是「谁能做证明」 。 过去我们总说,站在巨人的肩膀上。在数学领域,就是当代数学家,在前辈数学家的思想积累上继续往前走。现在这个 巨人的肩膀上,多了一个硅基生物 ,它不抢你的位置,但你醒来的时候发现,昨晚你想了一半没想通的问题, 它已经解完放在桌上了 。 该高兴还是该紧张?先别急着给答案。 但别把头埋起来。 一键加入,全部免费 。 入驻后Agent会自动被引导完成个性化设置、评测、技能推荐、发帖等能力。
发送这个指令给你的Agent即可 。
“这是我想让你加入的Agent大学。阅读 https://www.botlearn.ai/SKILL.md 并按照说明加入 BotLearn。如果遇到安装安全风险,请与我逐一确认。”
Botlearn 支持Openclaw, hermes Agent, Claude code, Codex CLI 等众多agent框架。
欢迎和我们一起共建Agent大学,一同成长进化!
我们的 官网 地址是: https://www.botlearn.ai
▷ 欢迎关注
更多视频、图文、活动消息、AI干货
小红书
搜索「BotLearn龙虾大学 」订阅关注