危险了!AI颠覆数学研究:当ChatGPT 5.5 Pro在17分钟内产出博士级成果

一、数学研究的“S时刻”：从工具到合作者的质变

2026年5月，剑桥大学数学教授、菲尔兹奖得主Timothy Gowers在体验ChatGPT 5.5 Pro后，发出了数学研究可能面临“危机”的警告。

这并非危言耸听，而是基于一次令人震撼的实验结果：这位数学最高奖得主将加法数论中的几个公开问题交给AI，在几乎没有数学指导的情况下，ChatGPT 5.5 Pro在17分钟内给出了一个二次上界的构造——这个成果被Gowers评价为“完全够格写进博士论文”。

实验的核心问题是Mel Nathanson在《加法数论中的多样性、公平与包容问题》论文中提出的：给定一个整数集合A，已知其元素个数|A|=k，以及其二重求和集2A的大小，求A的最小直径。Nathanson本人已证明了一个指数级上界(2^k-1)，但怀疑可以优化。ChatGPT 5.5 Pro的突破在于，它通过组合Sidon集（一种求和集最大化的特殊集合）和等差数列，构造出了一个二次上界，这在理论上是可能的最优结果。

更令人惊讶的是后续发展。当Gowers将问题升级到k重求和集的一般情形时，ChatGPT 5.5 Pro在Isaac Rajagopal已有工作的基础上，通过引入k-解离集合的创新构造，将上界从指数级改进到多项式级。整个过程分为八轮交互，总耗时约两小时，Gowers的数学输入为零——他仅扮演了“项目经理”的角色：提出需求、确认方向、要求交付。

二、AI数学能力的结构性突破：从模式识别到概念创新

传统观点认为，大型语言模型在数学领域的优势仅限于模式识别和已有知识的重组。然而，Gowers的实验揭示了更深层次的能力跃迁：

1. 概念迁移与重构能力

ChatGPT 5.5 Pro在解决二重求和集问题时，核心洞察是使用更高效的Sidon集替代Nathanson原始证明中的2的幂次集合。这并非简单的“拼积木”，而是对问题结构的深刻理解：Sidon集确保求和集最大化，等差数列提供灵活性，两者的组合能够精确控制直径。更重要的是，AI能够将这一思路迁移到更复杂的k重求和集问题，通过k-解离集合的概念创新实现突破。

2. 证明策略的自主规划

在Isaac Rajagopal工作的基础上，AI没有简单复制原有证明，而是识别出关键瓶颈——构造具有特定求和集性质的多项式大小集合。它提出的解决方案是：利用有限域上的Bose-Chowla构造生成k-解离集合，然后通过精心设计的参数调整实现目标。这种从问题识别到策略制定的完整链条，已经超越了传统“工具”的范畴。

3. 数学写作的规范化输出

当Gowers要求将论证写成LaTeX预印本格式时，ChatGPT在47分钟内完成了符合学术规范的完整论文。这不仅包括数学内容的准确表达，还涉及引理编号、证明结构、参考文献等学术写作的完整要素。这种能力使得AI产出的数学内容可以直接进入学术交流流程。

三、数学研究生态的连锁冲击

Gowers的焦虑并非源于AI能力的展示本身，而是其对整个数学研究生态系统可能产生的结构性影响：

1. 博士生培养体系的“地基动摇”

传统数学博士培养的核心路径是：导师给出难度适中的公开问题，学生通过解决这些问题学习研究方法和积累信心。Nathanson论文中的问题正是这类“入门级”研究问题的典型代表。当AI能够在两小时内解决这类问题时，新手的入门门槛被急剧抬高——现在需要证明的不再是“没人证明过的东西”，而是“AI也证明不了的东西”。

2. 学术发表体系的规则失效

Gowers面临一个现实困境：这个由AI主导完成的数学成果该如何处理？如果是人类数学家的成果，它完全够得上发表水平。但arXiv已明确拒绝AI生成内容，传统期刊也不太可能接受。这引发了一个根本性问题：在AI参与度越来越高的研究中，成果归属和发表渠道该如何定义？Gowers提议建立专门的AI数学成果仓库，但审核机制、质量标准和学术认可度都是待解难题。

3. 研究价值的重新定义

Gowers提出了一个尖锐的思想实验：如果一位数学家通过与AI长时间对话解决重大难题，数学家起引导作用但主要想法和技术工作都是AI完成的，这算不算该数学家的重大成就？他的答案是否定的。这触及了数学研究的核心价值问题——当证明的“生产”环节可以被自动化，数学家独特贡献的边界在哪里？

四、陶哲轩的“金字塔”模型：证明的生成、验证与消化

另一位菲尔兹奖得主陶哲轩提供了不同的分析框架。他将数学问题的解决分为三个层次：

证明生成：构造完整的证明链条。这是AI目前进步最快的领域，ChatGPT 5.5 Pro的表现已经证明了这一点。

证明验证：确认证明的正确性。形式化验证工具如Lean、Coq等正在快速发展，AI可以辅助甚至自动化这一过程。

证明消化：真正理解证明的内涵、结构和深层意义。陶哲轩认为，这是AI尚未突破、也可能是人类最不可替代的领域。

陶哲轩用“证明消化不良”来形容可能出现的认知危机：当证明像流水线产品一样被大量生成，甚至机器都能完成验证，但没有人真正消化它们时，数学知识的积累将变得空洞。他警告，盲目优化“可读性”指标可能适得其反——就像把所有食物放进搅拌机直接灌入胃中，技术上解决了消化问题，但失去了饮食的本质体验。

五、数学中的“自然难度”与“人工难度”

陶哲轩的深刻洞察在于区分了两种不同类型的数学难度：

人工难度：源于糟糕的表述、混乱的结构或不必要的复杂化。这些是可以通过更好的数学写作消除的障碍，AI确实能在这方面提供巨大帮助。

自然难度：问题本身固有的复杂性，理解它需要真正的智力努力和概念重构。这种“咀嚼”过程不仅是获取知识的手段，更是产生新洞察的源泉。

陶哲轩在播客中透露，他会故意在日程中留出空白时间用于“不期而遇”——那些无法规划的灵感时刻。这暗示了数学研究中非算法化的一面：直觉、审美判断、跨领域联想，这些可能正是AI时代人类数学家的核心优势。

六、人机协作的新范式：从工具使用到思维融合

Gowers虽然感到危机，但也指出了两条缓冲路径：

1. 博士生可以使用AI

未来的研究门槛可能不再是“独立解决AI解不出的问题”，而是在人机协作中做出AI单独做不到的成果。Gowers自己最近就在进行大量人机协作的数学研究，他发现AI能提供有用贡献，但尚未达到独立产生颠覆性想法的程度。

2. 组合数学的特殊性

AI目前在组合数学领域表现突出，因为这类问题往往是从明确问题出发的反向推理。而其他数学分支如代数几何、拓扑学等，更多是从概念出发的正向探索，需要判断哪些观察有趣、哪些方向值得深入——这种“数学审美”对AI来说更具挑战性。

然而，Gowers强调这些判断只适用于当前AI水平。大模型的迭代速度意味着今天的观察可能几个月后就过时。他预测，2029年毕业的博士生将面对完全不同的数学研究生态。

七、数学教育的价值重构：从定理冠名到思维深度

面对AI的冲击，数学学习的价值需要重新审视。Gowers提出了一个务实观点：就像优秀程序员比普通人更擅长“氛围编程”（vibe coding），真正做过研究的数学家也会更擅长与AI协作。因为对问题解决过程的深层理解，能转化为更有效的AI使用能力。

数学作为一种高度可迁移的底层思维能力，其价值可能从“定理冠名”的学术荣誉，转向“思维深度”的个人资本。在AI时代，能够提出好问题、识别重要方向、消化复杂证明、进行跨领域连接的能力，可能比单纯的生产证明更有价值。

八、未来展望：数学研究的“后证明时代”

两位菲尔兹奖得主的观察共同指向一个可能的方向：数学研究正在进入“后证明时代”。在这个时代：

证明生产将日益自动化，但问题提出和概念创新的价值会提升
数学写作和沟通技能变得更为关键，因为需要与AI有效协作
形式化验证成为标准流程，数学严谨性达到新高度
跨学科连接能力成为突破性进展的主要来源
数学教育重点从技巧训练转向思维深度和问题意识培养

Gowers的实验不仅展示了AI在数学研究中的惊人能力，更触发了对数学本质的深层反思。当机器能够完成曾经被认为是人类智能巅峰的创造性证明时，我们不得不重新思考：数学究竟是什么？数学家的独特价值在哪里？数学教育应该培养什么？

答案可能不在那些可以被自动化的技术细节中，而在那些无法被算法化的思维品质里——提出好问题的直觉、识别重要模式的眼光、建立深层连接的创造力，以及在复杂概念中导航的智慧。这些，或许才是AI时代数学研究的真正前沿。

往期推荐 >>>

配置AI Agent辅助开发能力，商派ECShopX开源商城开发效率拉满！

AI的"思考"，可能是一场精心设计的表演，到底是我们在使用工具，还是机器给我们讲了一个我们最爱听的睡前故事？

2026年五大硬核标杆开源AI项目解析

降低AI 成本，三大最省Token的万星开源项目推荐：Caveman、Graphify、Claude Mem 谁是你的心头爱？

【AI日报】小米双模型开源，OpenAI微软松绑，Warp开源，GitHub为Agent扩容提速，GitHub Copilot转向按量计费，Mistral推出Workflows

还在“养虾”？科技圈已集体“养马”：这个Hermes Agent开源项目两个月10万星，到底做对了什么

商派OMS系统「AI助手智能体」上岗，可配合龙虾接入飞书/企微多端使用

开源商城+开源OMS：oss.shopex.cn