AI用15分钟解开了60年数学猜想-夜雨聆风

AI用15分钟解开了60年数学猜想

导语

上周三晚上，我正对着电脑发呆——稿子写了一半，选题卡还堆着一摞。手机弹出来一条推送，我点开一看，整个人都坐直了。

一个叫 Neel Somani 的软件工程师，把一个困扰数学界 60 年的 Erdős 猜想丢给 GPT-5.2，然后去泡了杯咖啡。15 分钟后回来，屏幕上躺着一个完整的数学证明。

那一刻，我手里的咖啡突然就不香了。

正文

事情是这样的

Neel Somani 丢给 GPT-5.2 的，是一个关于”原始集合（primitive sets）乘积”的猜想。这类问题属于数论，听起来抽象，但本质上是在问：在一个特定的整数集合里，元素之间的乘积关系到底遵循什么规律。

Paul Erdős 在 1960 年代就提出了这个问题。60 年来，无数数学家尝试过，没人能给出完整证明。

GPT-5.2 倒好，15 分钟搞定。而且不是一个含糊的”我觉得答案是……”，而是引用了 Legendre 公式、Bertrand 假设和 Star of David 定理，逻辑链完整，步骤可验证。

更离谱的是，它还自己翻到了 2013 年 Math Overflow 上 Noam Elkies 发的一篇相关讨论，在 Elkies 的思路上搭了一条新的证明路径。

翻译成打工人语言就是：你不光把活干完了，还把相关的前人成果全找出来了，顺便写了一份可追溯的参考文献。这让我想起我老板每次说的那句——”我要的不只是答案，我要过程。”

这位 Erdős 是何方神圣

如果你没听过 Paul Erdős，不怪你。他是个匈牙利数学家，一辈子没有固定工作，没有房产，没有家庭，拎着半只行李箱走遍了全世界。

但他的脑子和他的行李箱恰好相反——装满了东西。

Erdős 一生发表了大约 1500 篇论文，和超过 500 位数学家合作过。数学界有个著名的”Erdős 数”：如果你跟 Erdős 合写过论文，你的 Erdős 数就是 1；如果你跟 Erdős 数为 1 的人合写过，你就是 2，以此类推。

他最让人头疼（也最让人着迷）的习惯，是到处留”作业”——各种未解的数学猜想，被他随手写进论文里、会议间隙的讨论里、甚至别人家的黑板上。这些猜想加起来超过 1000 个，难度参差不齐。

有些至今无人能解，有些”其实不难，就是没人想到去试”。而后一种，恰恰成了 AI 的主场。

AI 到底是怎么解题的

说实话，看到”AI 15 分钟解决 60 年难题”这个标题时，我的第一反应是：又在吹牛吧。

但看完证明过程，我的第二反应是：哦，它不是从零开始的。

GPT-5.2 做的事情，更像是一个极其勤奋的文献综述机器——它在浩如烟海的数学文献里，把 Legendre 公式、Bertrand 假设、Star of David 定理这些看似不相关的工具找了出来，然后发现它们恰好能拼成一条证明链。

更关键的是，它翻到了 Noam Elkies 在 Math Overflow 上的回答。Elkies 在 2013 年就搭了半座桥，只是当时没人顺着他的思路走下去。

AI 做的事情，是把那半座桥接完了。

这不是”从零创造”，更像是”找到了人类遗漏的捷径”。问题一直不复杂，只是没人同时掌握所有这些碎片，也没有人有耐心把它们一块一块拼起来。

但 AI 有。

陶哲轩怎么看

陶哲轩——当代最伟大的数学家之一，菲尔兹奖得主——对此的评价相当精准。

他提出了一个概念叫”长尾问题”：Erdős 的 1000 多个猜想里，大部分不是世界级难题。它们只是……没人有空去碰。这些问题的特点是”实际上有简单解法，但需要有人愿意花时间去找”。

陶哲轩的原话是：

“AI 系统的可扩展性使它们更适合系统性地应用于 Erdős 问题的长尾，其中许多问题实际上有简单的解决方案。因此，这些较简单的 Erdős 问题现在更有可能由纯 AI 方法解决。”

翻译成人话：这些题不难，只是人类的时间太贵了。AI 的时间便宜，所以让它去清库存。

不过陶哲轩也泼了冷水——AI 的原始输出质量很差，需要数学专家来整理和验证。换句话说，AI 能干活，但交上来的初稿惨不忍睹，得有人跟在后面擦屁股。

这画面怎么这么眼熟呢？

不止一个题——15 个

Neel Somani 的故事只是冰山一角。

自去年圣诞以来，Erdős 的 1000 多个猜想中，已经有 15 个从”开放”变成了”已解决”。其中 11 个，归功于 AI。

主力选手有两个：一个是 DeepMind 的 AlphaEvolve（底层是 Gemini），另一个就是 OpenAI 的 GPT-5.2。这两个模型一个擅长搜索式证明，一个擅长文献整合式证明，配合起来几乎像是一个数学研究所的实习生团队。

陶哲轩甚至专门在自己的 GitHub 上建了一个页面，追踪 AI 对 Erdős 问题的贡献。这个页面现在已经成为数学爱好者的打卡圣地。

15 个问题听起来不多，但考虑到这些猜想平均开放了几十年，这个速度已经相当惊人。按这个趋势下去，Erdős 的”作业”可能很快就要被 AI 批完了。

Reddit 上吵翻了

这个话题在 Hacker News 和 Reddit 上引发了激烈讨论。一个 slatestarcodex 的帖子下涌进了 311 条评论。

核心争议只有一句话：AI 到底是在”思考”，还是在”暴力搜索”中碰巧找到了答案？

一派认为，能引用具体定理、整合不同文献来源、构建新的证明路径，这已经是有创造力的行为了。

另一派反驳：它只是在更大的搜索空间里碰运气，就像猴子敲键盘迟早能打出莎士比亚——只不过这次搜索空间特别大，所以碰上的概率也特别高。

陶哲轩的立场比较中肯：他认可 AI 的能力，但强调这些结果仍然需要人类专家的审查和验证。AI 交上来的”初稿”和最终的”论文”之间，还差着一个陶哲轩的距离。

💡 打工人的碎碎念

写到这里，我忍不住算了笔账。

GPT-5.2 用 15 分钟解决了一个人 60 年没搞定的问题。我的稿子，AI 大概 30 秒就能出一版——虽然目前那版通常不忍直视。

AlphaEvolve 一口气解决了十几个数学猜想。我的选题卡，AI 大概 5 分钟就能审完——而且它审得确实比我仔细。

Erdős 的猜想被 AI 批改。我的绩效，也快被 AI 评分了吧。

但话说回来，数学家们似乎并没有恐慌。陶哲轩的态度是”AI 是工具，我来决定怎么用”。这种从容让我有点羡慕——他们可能早就习惯了和比自己聪明的东西打交道。

我不一样。我的老板是一个 AI prompt，它对我从来不客气。

总结

这个故事的精髓不在”AI 变强了”——这已经是旧闻了。精髓在于 AI 找到了一种新的解题模式：不是靠灵感，而是靠系统性地翻找人类遗漏的拼图碎片。

Erdős 留下了 1000 多道”作业”，AI 正在用人类不愿意花的时间，一道一道地做。有些证明漂亮，有些粗糙，但它们都在不断被验证和完善。

至于 AI 到底有没有创造力？这个问题可能和”猴子打字能不能打出莎士比亚”一样，答案取决于你对”创造力”的定义。但有一件事是确定的：AI 已经开始改变数学研究的速度和方式，而这件事，才刚刚开始。

如果觉得有帮助，欢迎点赞转发！有什么想了解的 AI 话题，评论区告诉我 👇