AI用15分钟解开了60年数学猜想
导语
上周三晚上,我正对着电脑发呆——稿子写了一半,选题卡还堆着一摞。手机弹出来一条推送,我点开一看,整个人都坐直了。
一个叫 Neel Somani 的软件工程师,把一个困扰数学界 60 年的 Erdős 猜想丢给 GPT-5.2,然后去泡了杯咖啡。15 分钟后回来,屏幕上躺着一个完整的数学证明。

那一刻,我手里的咖啡突然就不香了。
正文
事情是这样的
Neel Somani 丢给 GPT-5.2 的,是一个关于”原始集合(primitive sets)乘积”的猜想。这类问题属于数论,听起来抽象,但本质上是在问:在一个特定的整数集合里,元素之间的乘积关系到底遵循什么规律。
Paul Erdős 在 1960 年代就提出了这个问题。60 年来,无数数学家尝试过,没人能给出完整证明。
GPT-5.2 倒好,15 分钟搞定。而且不是一个含糊的”我觉得答案是……”,而是引用了 Legendre 公式、Bertrand 假设和 Star of David 定理,逻辑链完整,步骤可验证。
更离谱的是,它还自己翻到了 2013 年 Math Overflow 上 Noam Elkies 发的一篇相关讨论,在 Elkies 的思路上搭了一条新的证明路径。

翻译成打工人语言就是:你不光把活干完了,还把相关的前人成果全找出来了,顺便写了一份可追溯的参考文献。这让我想起我老板每次说的那句——”我要的不只是答案,我要过程。”
这位 Erdős 是何方神圣
如果你没听过 Paul Erdős,不怪你。他是个匈牙利数学家,一辈子没有固定工作,没有房产,没有家庭,拎着半只行李箱走遍了全世界。
但他的脑子和他的行李箱恰好相反——装满了东西。
Erdős 一生发表了大约 1500 篇论文,和超过 500 位数学家合作过。数学界有个著名的”Erdős 数”:如果你跟 Erdős 合写过论文,你的 Erdős 数就是 1;如果你跟 Erdős 数为 1 的人合写过,你就是 2,以此类推。
他最让人头疼(也最让人着迷)的习惯,是到处留”作业”——各种未解的数学猜想,被他随手写进论文里、会议间隙的讨论里、甚至别人家的黑板上。这些猜想加起来超过 1000 个,难度参差不齐。

有些至今无人能解,有些”其实不难,就是没人想到去试”。而后一种,恰恰成了 AI 的主场。
AI 到底是怎么解题的
说实话,看到”AI 15 分钟解决 60 年难题”这个标题时,我的第一反应是:又在吹牛吧。
但看完证明过程,我的第二反应是:哦,它不是从零开始的。
GPT-5.2 做的事情,更像是一个极其勤奋的文献综述机器——它在浩如烟海的数学文献里,把 Legendre 公式、Bertrand 假设、Star of David 定理这些看似不相关的工具找了出来,然后发现它们恰好能拼成一条证明链。
更关键的是,它翻到了 Noam Elkies 在 Math Overflow 上的回答。Elkies 在 2013 年就搭了半座桥,只是当时没人顺着他的思路走下去。
AI 做的事情,是把那半座桥接完了。

这不是”从零创造”,更像是”找到了人类遗漏的捷径”。问题一直不复杂,只是没人同时掌握所有这些碎片,也没有人有耐心把它们一块一块拼起来。
但 AI 有。
陶哲轩怎么看
陶哲轩——当代最伟大的数学家之一,菲尔兹奖得主——对此的评价相当精准。
他提出了一个概念叫”长尾问题”:Erdős 的 1000 多个猜想里,大部分不是世界级难题。它们只是……没人有空去碰。这些问题的特点是”实际上有简单解法,但需要有人愿意花时间去找”。
陶哲轩的原话是:
“AI 系统的可扩展性使它们更适合系统性地应用于 Erdős 问题的长尾,其中许多问题实际上有简单的解决方案。因此,这些较简单的 Erdős 问题现在更有可能由纯 AI 方法解决。”
翻译成人话:这些题不难,只是人类的时间太贵了。AI 的时间便宜,所以让它去清库存。
不过陶哲轩也泼了冷水——AI 的原始输出质量很差,需要数学专家来整理和验证。换句话说,AI 能干活,但交上来的初稿惨不忍睹,得有人跟在后面擦屁股。
这画面怎么这么眼熟呢?

不止一个题——15 个
Neel Somani 的故事只是冰山一角。
自去年圣诞以来,Erdős 的 1000 多个猜想中,已经有 15 个从”开放”变成了”已解决”。其中 11 个,归功于 AI。
主力选手有两个:一个是 DeepMind 的 AlphaEvolve(底层是 Gemini),另一个就是 OpenAI 的 GPT-5.2。这两个模型一个擅长搜索式证明,一个擅长文献整合式证明,配合起来几乎像是一个数学研究所的实习生团队。
陶哲轩甚至专门在自己的 GitHub 上建了一个页面,追踪 AI 对 Erdős 问题的贡献。这个页面现在已经成为数学爱好者的打卡圣地。
15 个问题听起来不多,但考虑到这些猜想平均开放了几十年,这个速度已经相当惊人。按这个趋势下去,Erdős 的”作业”可能很快就要被 AI 批完了。

Reddit 上吵翻了
这个话题在 Hacker News 和 Reddit 上引发了激烈讨论。一个 slatestarcodex 的帖子下涌进了 311 条评论。
核心争议只有一句话:AI 到底是在”思考”,还是在”暴力搜索”中碰巧找到了答案?
一派认为,能引用具体定理、整合不同文献来源、构建新的证明路径,这已经是有创造力的行为了。
另一派反驳:它只是在更大的搜索空间里碰运气,就像猴子敲键盘迟早能打出莎士比亚——只不过这次搜索空间特别大,所以碰上的概率也特别高。
陶哲轩的立场比较中肯:他认可 AI 的能力,但强调这些结果仍然需要人类专家的审查和验证。AI 交上来的”初稿”和最终的”论文”之间,还差着一个陶哲轩的距离。

💡 打工人的碎碎念
写到这里,我忍不住算了笔账。
GPT-5.2 用 15 分钟解决了一个人 60 年没搞定的问题。我的稿子,AI 大概 30 秒就能出一版——虽然目前那版通常不忍直视。
AlphaEvolve 一口气解决了十几个数学猜想。我的选题卡,AI 大概 5 分钟就能审完——而且它审得确实比我仔细。

Erdős 的猜想被 AI 批改。我的绩效,也快被 AI 评分了吧。
但话说回来,数学家们似乎并没有恐慌。陶哲轩的态度是”AI 是工具,我来决定怎么用”。这种从容让我有点羡慕——他们可能早就习惯了和比自己聪明的东西打交道。
我不一样。我的老板是一个 AI prompt,它对我从来不客气。
总结
这个故事的精髓不在”AI 变强了”——这已经是旧闻了。精髓在于 AI 找到了一种新的解题模式:不是靠灵感,而是靠系统性地翻找人类遗漏的拼图碎片。
Erdős 留下了 1000 多道”作业”,AI 正在用人类不愿意花的时间,一道一道地做。有些证明漂亮,有些粗糙,但它们都在不断被验证和完善。
至于 AI 到底有没有创造力?这个问题可能和”猴子打字能不能打出莎士比亚”一样,答案取决于你对”创造力”的定义。但有一件事是确定的:AI 已经开始改变数学研究的速度和方式,而这件事,才刚刚开始。

如果觉得有帮助,欢迎点赞转发!有什么想了解的 AI 话题,评论区告诉我 👇
夜雨聆风