AI也能解决60年的数学难题了?

AI拆掉的不是数学难题，而是人类的第一步

# 0. 那个“吓人”的标题

这几天有一个标题很吓人：一个没有高等数学训练的23岁年轻人，靠问ChatGPT，解决了一个困扰数学界60年的问题。

如果只看这个标题，很容易得出两个极端结论。乐观的人会说，数学家要失业了，AI已经开始独立发现真理。悲观的人会说，这肯定又是营销稿，所谓破解难题不过是把网上已有证明拼了一遍。两种反应都太快了。真正有意思的地方不在于AI是不是一夜之间成了欧拉，也不在于一个外行是不是逆袭了世界顶级数学家，而在于它暴露了一个更深的问题：人类在解决复杂问题时，常常不是输在算力不够，而是输在第一步就走进了共同的惯性。

# 1. Erdős Problems #1196 的“PROVED (LEAN)”

这件事对应的不是一个段子，而是Erdős Problems网站上的第1196号问题。官网在2026年4月15日把它标成了“PROVED (LEAN)”，并注明由GPT-5.4 Pro在Liam Price提示下解决。Scientific American随后报道了这个故事：Liam Price没有接受过高等数学训练，只是拿着ChatGPT Pro订阅，在一个下午把题目喂给模型；模型给出了一条人类此前没有采用过的证明路线；后来Kevin Barreto、Jared Lichtman、Terence Tao等人参与理解、压缩、检验这个证明。

注意，这里有一个关键细节：原始输出并不漂亮。Lichtman说，ChatGPT给出的粗糙证明质量其实很差，需要专家把里面真正有价值的东西筛出来。也就是说，这不是“AI写出一篇完美论文，人类鼓掌通过”的神话。更准确地说，是AI从混乱中摸到了一扇门，而人类数学家负责确认那扇门不是画在墙上的。

# 2. primitive set 与“尾部天花板”

那么这个60年难题到底是什么？

它研究的是一种叫primitive set的整数集合，中文可以粗略叫“原始集合”。定义很简单：集合里不能有一个数整除另一个数。比如所有质数就是一个原始集合，2、3、5、7、11彼此不能整除。{4, 6, 9}也是原始集合，因为4不整除6，6不整除9，4也不整除9。但{2, 4, 9}就不是，因为2可以整除4。

这个定义看起来像小学奥数，但它背后是数论里非常硬的结构问题。整数不是一条简单的直线，而是一张由“整除关系”织出来的巨大网络。2下面连着4、6、8、10，3下面连着6、9、12，质数像最基础的节点，合数则带着复杂的祖宗谱系。primitive set的意思就是：你从这张网络里挑点，但不能挑到一条上下相连的链。用组合数学的话说，它是整除偏序里的“反链”。

Erdős关心的不是这样的集合有多少元素，而是给每个元素配一个重量：

然后把集合里所有数的重量加起来。这个权重设计得很妙。数字越大，权重越小；但小得又不算太快，因为log a在分母里只多压了一层。它像是在问：如果你不能在整除网络里上下通吃，只能横着挑，那么你最多能从这张无限网络里拿走多少“质量”？

Erdős很早就证明过，对任意primitive set，这个总和不会无限大。后来他又提出一个更漂亮的问题：所有primitive set里，质数集合是不是让这个总和达到最大？这个问题后来由Jared Lichtman证明。第1196号问题则是另一种尾部版本，由Erdős、Sárközy、Szemerédi在1960年代提出：如果集合A里的数全部都很大，至少大于x，那么

是不是永远小于1加上一个会随着x增大而消失的小误差？

通俗一点说，这个问题在问：当你避开所有小数字，只在很大的整数里挑一个primitive set时，它的总重量有没有一个极限天花板？猜想说有，而且这个天花板就是1。

为什么是1？这就是数学最迷人的地方。题目里没有明显写着1，primitive set也不像概率题那样天然归一化，但最后它偏偏指向1。这个1不是拍脑袋来的，它来自整除结构、质因数分解、权重函数之间极深的平衡关系。以前人类已经把上界推进到了约1.399，也就是Lichtman在2023年前后得到的结果：e^γ π/4 + o(1)。这已经很强了，但1.399和1之间隔着的不是0.399，而是“还没证明”和“已经证明”的整条鸿沟。

GPT-5.4 Pro给出的新路线，最终证明了更强的形式：

这句话的意思是，误差不只是会消失，而且大概按1/log x的速度消失。对普通人来说，不需要纠结符号。只要记住一点：它把这个尾部天花板压回了1。

真正值得看的是它怎么压回去的。

# 3. 不搬去连续世界，而是留在整除网络

过去很多数学家面对这类问题，第一反应是把离散的整数世界转到连续分析里。这个动作太自然了。整数太参差，太难管；连续对象更光滑，更容易用积分、估计、极限去处理。数学史上无数问题都是这样做成的，所以大家沿着这条路走，并不愚蠢，甚至很合理。但合理的路走久了，就会变成默认路线；默认路线再走久了，就会变成看不见的墙。

这次AI没有先把问题搬到连续世界里，而是留在整数本身，直接处理整除网络。它用到了一个数论中很经典的工具：von Mangoldt函数Λ。这个函数并不新，数学家早就熟悉。关键是它有一个非常漂亮的恒等式：

对任意整数n，所有整除n的q，把Λ(q)加起来，刚好等于log n。

这句话太重要了。因为题目里的权重正好有log，整除关系里也正好可以用Λ把log n拆出来。于是问题变成了：能不能在整数的整除网络上设计一种“向下走”的过程？从n出发，按某种权重跳到n/q。这个过程像一条随机的整除链，从大数往小数走。

而primitive set最核心的性质就是：一条整除链最多撞上它一次。因为如果链上有两个点都在A里，那就意味着其中一个整除另一个，违反定义。

这就是证明的骨架。你构造一种合适的随机链，算出它撞到每个整数n的概率大约是1/(n log n)。既然一条链最多撞到primitive set一次，那么它撞到整个集合A的概率总和最多就是1。于是：

当然真实证明要处理误差、边界、无穷求和、Mertens估计、Markov过程、对偶流证书等一堆技术细节。但骨架就是这么干净：不要把整数世界磨平，直接在整除网络里放一条带权的流；primitive set不是一堆孤立数字，而是这张网络里不能被同一条链穿透两次的屏障。

Terence Tao在讨论区里把这个思想进一步整理成“流证书”的视角：在整除偏序上构造一个几乎无散度的加权有向流，primitive set的性质只在一个关键地方使用，边界流量算出来就是1加小误差。这种说法听起来抽象，但本质上非常清楚：不是暴力计算，不是穷举，不是把几百万种情况塞进机器，而是找到了一个正确的守恒结构。

这才是这件事真正震动人的地方。

# 4. 共同体的“默认第一步”

如果AI只是比人算得快，那它当然有用，但不会改变数学的精神结构。计算机早就能做大规模搜索、验证、符号推导了。但这次的特殊性在于，它似乎绕过了人类共同接受的“开局”。Tao在Scientific American里说，研究这个问题的人好像在第一步就集体转错了一点方向。这句话比“AI解决数学难题”更值得咀嚼。数学家不是不聪明，也不是不努力，而是聪明人组成的共同体也会形成共同偏见。

这个现象并不只发生在数学里。历史上很多领域都是这样。一个行业越成熟，路径越稳定，工具越精密，就越容易把某些前提误认为常识。常识不是错，但它会筛掉一些不合群的念头。人类做研究有审美，有传承，有导师，有论文引用，有“这条路看起来比较正统”的直觉。这些东西保证了知识体系的稳定，也会制造盲区。

AI没有这种学术社会化过程。它没有博士导师，不知道某条路线已经被共同体默认，也不会因为一个方法“不像这个领域的人会用的方法”就自动排除。它的输出当然混乱，甚至经常胡说八道，但混乱里有时会混出人类不会轻易下手的组合。它不是更懂数学，而是没有被训练成某一种数学家。

所以这个故事真正的主角不是“外行战胜专家”，而是“外行加AI打开了专家共同体的一条旁门”。但旁门能不能成为正门，还得靠专家确认。没有Barreto看出异常，没有Lichtman、Tao等人理解和重写，没有形式化验证，这件事很可能只是一个看似正确的幻觉。AI负责提出可能性，人类负责把可能性押上真理的审判台。

# 5. 什么会被取代，什么会更值钱

这也给“AI会不会取代数学家”这个问题一个更现实的答案：短期内不会以大家想象的方式取代。它不会让严肃数学变成输入题目、等待答案的自动售货机。真正被取代的，是一部分低质量的试错，一部分文献迷宫，一部分“我觉得这条路不像正路”的心理过滤。未来最强的数学家，未必是最会手算的人，而是最会把问题拆成可被机器探索、又能由人类审判的结构的人。

这对普通人也有启发。我们一直以为知识壁垒来自知识本身，其实很多壁垒来自进入知识的路径。一个没有高等数学训练的人，正常情况下不可能参与Erdős问题，因为他连语言都没学完。但AI临时充当了一种翻译器、试错器、方向生成器，让他可以把问题推到专家面前。这个时代开始奖励一种新能力：不是你什么都懂，而是你能不能提出足够好的问题，能不能识别答案里真正反常的部分，能不能找到懂行的人完成闭环。

当然，这不是鼓励大家迷信“提示词改变世界”。Price的成功有偶然性。论坛讨论里也有人提到，后续多次运行GPT-5.4 Pro，有些找到了类似方向，有些没有。AI不是稳定的神谕，更像一个高能但不可靠的探索者。它会给你矿石，也会给你废渣。没有判断力的人只会被废渣砸晕，有判断力的人才可能从里面炼出金属。

但趋势已经很清楚了。过去的知识生产是少数专业人士在高墙内推进，外部人最多做传播和消费。现在墙还在，但墙上开始出现缝。一个外行可以用AI把自己送到专业问题的边缘，专业共同体也不得不面对来自边缘的有效输入。这不会让专业消失，反而会让真正的专业更值钱。因为当提出猜想和生成证明草稿变得更便宜，验证、提炼、判断、命名新结构的能力就更稀缺。

# 6. 拆掉的不是难题，而是“第一步的迷信”

这次AI拆掉的不是数学难题本身，而是人类对“第一步应该怎么走”的迷信。一个60年问题并不是因为全世界数学家笨才留下来的，而是因为每个聪明人都太自然地选择了同一种聪明。AI最大的价值，可能就是在这种地方：它不尊重我们的自然。

数学不会因此变得廉价。恰恰相反，它会变得更残酷。因为以后很多问题都要重新问一遍：这是我真的证明不了，还是我只是被自己的训练困住了？这是世界的边界，还是共同体的习惯？这是难题，还是第一步错了？

人类最怕的不是机器会思考，而是机器迫使我们承认：很多时候，我们所谓的思考，只是在重复一条被前人走熟的路。