AI也能解决60年的数学难题了?
AI拆掉的不是数学难题,而是人类的第一步
# 0. 那个“吓人”的标题
这几天有一个标题很吓人:一个没有高等数学训练的23岁年轻人,靠问ChatGPT,解决了一个困扰数学界60年的问题。
如果只看这个标题,很容易得出两个极端结论。乐观的人会说,数学家要失业了,AI已经开始独立发现真理。悲观的人会说,这肯定又是营销稿,所谓破解难题不过是把网上已有证明拼了一遍。两种反应都太快了。真正有意思的地方不在于AI是不是一夜之间成了欧拉,也不在于一个外行是不是逆袭了世界顶级数学家,而在于它暴露了一个更深的问题:人类在解决复杂问题时,常常不是输在算力不够,而是输在第一步就走进了共同的惯性。

# 1. Erdős Problems #1196 的“PROVED (LEAN)”
这件事对应的不是一个段子,而是Erdős Problems网站上的第1196号问题。官网在2026年4月15日把它标成了“PROVED (LEAN)”,并注明由GPT-5.4 Pro在Liam Price提示下解决。Scientific American随后报道了这个故事:Liam Price没有接受过高等数学训练,只是拿着ChatGPT Pro订阅,在一个下午把题目喂给模型;模型给出了一条人类此前没有采用过的证明路线;后来Kevin Barreto、Jared Lichtman、Terence Tao等人参与理解、压缩、检验这个证明。
注意,这里有一个关键细节:原始输出并不漂亮。Lichtman说,ChatGPT给出的粗糙证明质量其实很差,需要专家把里面真正有价值的东西筛出来。也就是说,这不是“AI写出一篇完美论文,人类鼓掌通过”的神话。更准确地说,是AI从混乱中摸到了一扇门,而人类数学家负责确认那扇门不是画在墙上的。
# 2. primitive set 与“尾部天花板”
那么这个60年难题到底是什么?
它研究的是一种叫primitive set的整数集合,中文可以粗略叫“原始集合”。定义很简单:集合里不能有一个数整除另一个数。比如所有质数就是一个原始集合,2、3、5、7、11彼此不能整除。{4, 6, 9}也是原始集合,因为4不整除6,6不整除9,4也不整除9。但{2, 4, 9}就不是,因为2可以整除4。

这个定义看起来像小学奥数,但它背后是数论里非常硬的结构问题。整数不是一条简单的直线,而是一张由“整除关系”织出来的巨大网络。2下面连着4、6、8、10,3下面连着6、9、12,质数像最基础的节点,合数则带着复杂的祖宗谱系。primitive set的意思就是:你从这张网络里挑点,但不能挑到一条上下相连的链。用组合数学的话说,它是整除偏序里的“反链”。
Erdős关心的不是这样的集合有多少元素,而是给每个元素配一个重量:
然后把集合里所有数的重量加起来。这个权重设计得很妙。数字越大,权重越小;但小得又不算太快,因为log a在分母里只多压了一层。它像是在问:如果你不能在整除网络里上下通吃,只能横着挑,那么你最多能从这张无限网络里拿走多少“质量”?
Erdős很早就证明过,对任意primitive set,这个总和不会无限大。后来他又提出一个更漂亮的问题:所有primitive set里,质数集合是不是让这个总和达到最大?这个问题后来由Jared Lichtman证明。第1196号问题则是另一种尾部版本,由Erdős、Sárközy、Szemerédi在1960年代提出:如果集合A里的数全部都很大,至少大于x,那么
是不是永远小于1加上一个会随着x增大而消失的小误差?
通俗一点说,这个问题在问:当你避开所有小数字,只在很大的整数里挑一个primitive set时,它的总重量有没有一个极限天花板?猜想说有,而且这个天花板就是1。
为什么是1?这就是数学最迷人的地方。题目里没有明显写着1,primitive set也不像概率题那样天然归一化,但最后它偏偏指向1。这个1不是拍脑袋来的,它来自整除结构、质因数分解、权重函数之间极深的平衡关系。以前人类已经把上界推进到了约1.399,也就是Lichtman在2023年前后得到的结果:e^γ π/4 + o(1)。这已经很强了,但1.399和1之间隔着的不是0.399,而是“还没证明”和“已经证明”的整条鸿沟。
GPT-5.4 Pro给出的新路线,最终证明了更强的形式:
这句话的意思是,误差不只是会消失,而且大概按1/log x的速度消失。对普通人来说,不需要纠结符号。只要记住一点:它把这个尾部天花板压回了1。
真正值得看的是它怎么压回去的。
# 3. 不搬去连续世界,而是留在整除网络

过去很多数学家面对这类问题,第一反应是把离散的整数世界转到连续分析里。这个动作太自然了。整数太参差,太难管;连续对象更光滑,更容易用积分、估计、极限去处理。数学史上无数问题都是这样做成的,所以大家沿着这条路走,并不愚蠢,甚至很合理。但合理的路走久了,就会变成默认路线;默认路线再走久了,就会变成看不见的墙。
这次AI没有先把问题搬到连续世界里,而是留在整数本身,直接处理整除网络。它用到了一个数论中很经典的工具:von Mangoldt函数Λ。这个函数并不新,数学家早就熟悉。关键是它有一个非常漂亮的恒等式:
对任意整数n,所有整除n的q,把Λ(q)加起来,刚好等于log n。
这句话太重要了。因为题目里的权重正好有log,整除关系里也正好可以用Λ把log n拆出来。于是问题变成了:能不能在整数的整除网络上设计一种“向下走”的过程?从n出发,按某种权重跳到n/q。这个过程像一条随机的整除链,从大数往小数走。
而primitive set最核心的性质就是:一条整除链最多撞上它一次。因为如果链上有两个点都在A里,那就意味着其中一个整除另一个,违反定义。
这就是证明的骨架。你构造一种合适的随机链,算出它撞到每个整数n的概率大约是1/(n log n)。既然一条链最多撞到primitive set一次,那么它撞到整个集合A的概率总和最多就是1。于是:
当然真实证明要处理误差、边界、无穷求和、Mertens估计、Markov过程、对偶流证书等一堆技术细节。但骨架就是这么干净:不要把整数世界磨平,直接在整除网络里放一条带权的流;primitive set不是一堆孤立数字,而是这张网络里不能被同一条链穿透两次的屏障。
Terence Tao在讨论区里把这个思想进一步整理成“流证书”的视角:在整除偏序上构造一个几乎无散度的加权有向流,primitive set的性质只在一个关键地方使用,边界流量算出来就是1加小误差。这种说法听起来抽象,但本质上非常清楚:不是暴力计算,不是穷举,不是把几百万种情况塞进机器,而是找到了一个正确的守恒结构。
这才是这件事真正震动人的地方。

# 4. 共同体的“默认第一步”
如果AI只是比人算得快,那它当然有用,但不会改变数学的精神结构。计算机早就能做大规模搜索、验证、符号推导了。但这次的特殊性在于,它似乎绕过了人类共同接受的“开局”。Tao在Scientific American里说,研究这个问题的人好像在第一步就集体转错了一点方向。这句话比“AI解决数学难题”更值得咀嚼。数学家不是不聪明,也不是不努力,而是聪明人组成的共同体也会形成共同偏见。
这个现象并不只发生在数学里。历史上很多领域都是这样。一个行业越成熟,路径越稳定,工具越精密,就越容易把某些前提误认为常识。常识不是错,但它会筛掉一些不合群的念头。人类做研究有审美,有传承,有导师,有论文引用,有“这条路看起来比较正统”的直觉。这些东西保证了知识体系的稳定,也会制造盲区。
AI没有这种学术社会化过程。它没有博士导师,不知道某条路线已经被共同体默认,也不会因为一个方法“不像这个领域的人会用的方法”就自动排除。它的输出当然混乱,甚至经常胡说八道,但混乱里有时会混出人类不会轻易下手的组合。它不是更懂数学,而是没有被训练成某一种数学家。
所以这个故事真正的主角不是“外行战胜专家”,而是“外行加AI打开了专家共同体的一条旁门”。但旁门能不能成为正门,还得靠专家确认。没有Barreto看出异常,没有Lichtman、Tao等人理解和重写,没有形式化验证,这件事很可能只是一个看似正确的幻觉。AI负责提出可能性,人类负责把可能性押上真理的审判台。
# 5. 什么会被取代,什么会更值钱
这也给“AI会不会取代数学家”这个问题一个更现实的答案:短期内不会以大家想象的方式取代。它不会让严肃数学变成输入题目、等待答案的自动售货机。真正被取代的,是一部分低质量的试错,一部分文献迷宫,一部分“我觉得这条路不像正路”的心理过滤。未来最强的数学家,未必是最会手算的人,而是最会把问题拆成可被机器探索、又能由人类审判的结构的人。
这对普通人也有启发。我们一直以为知识壁垒来自知识本身,其实很多壁垒来自进入知识的路径。一个没有高等数学训练的人,正常情况下不可能参与Erdős问题,因为他连语言都没学完。但AI临时充当了一种翻译器、试错器、方向生成器,让他可以把问题推到专家面前。这个时代开始奖励一种新能力:不是你什么都懂,而是你能不能提出足够好的问题,能不能识别答案里真正反常的部分,能不能找到懂行的人完成闭环。
当然,这不是鼓励大家迷信“提示词改变世界”。Price的成功有偶然性。论坛讨论里也有人提到,后续多次运行GPT-5.4 Pro,有些找到了类似方向,有些没有。AI不是稳定的神谕,更像一个高能但不可靠的探索者。它会给你矿石,也会给你废渣。没有判断力的人只会被废渣砸晕,有判断力的人才可能从里面炼出金属。
但趋势已经很清楚了。过去的知识生产是少数专业人士在高墙内推进,外部人最多做传播和消费。现在墙还在,但墙上开始出现缝。一个外行可以用AI把自己送到专业问题的边缘,专业共同体也不得不面对来自边缘的有效输入。这不会让专业消失,反而会让真正的专业更值钱。因为当提出猜想和生成证明草稿变得更便宜,验证、提炼、判断、命名新结构的能力就更稀缺。
# 6. 拆掉的不是难题,而是“第一步的迷信”

这次AI拆掉的不是数学难题本身,而是人类对“第一步应该怎么走”的迷信。一个60年问题并不是因为全世界数学家笨才留下来的,而是因为每个聪明人都太自然地选择了同一种聪明。AI最大的价值,可能就是在这种地方:它不尊重我们的自然。
数学不会因此变得廉价。恰恰相反,它会变得更残酷。因为以后很多问题都要重新问一遍:这是我真的证明不了,还是我只是被自己的训练困住了?这是世界的边界,还是共同体的习惯?这是难题,还是第一步错了?
人类最怕的不是机器会思考,而是机器迫使我们承认:很多时候,我们所谓的思考,只是在重复一条被前人走熟的路。
夜雨聆风