

一、数学研究的“S时刻”:从工具到合作者的质变
2026年5月,剑桥大学数学教授、菲尔兹奖得主Timothy Gowers在体验ChatGPT 5.5 Pro后,发出了数学研究可能面临“危机”的警告。
这并非危言耸听,而是基于一次令人震撼的实验结果:这位数学最高奖得主将加法数论中的几个公开问题交给AI,在几乎没有数学指导的情况下,ChatGPT 5.5 Pro在17分钟内给出了一个二次上界的构造——这个成果被Gowers评价为“完全够格写进博士论文”。


实验的核心问题是Mel Nathanson在《加法数论中的多样性、公平与包容问题》论文中提出的:给定一个整数集合A,已知其元素个数|A|=k,以及其二重求和集2A的大小,求A的最小直径。Nathanson本人已证明了一个指数级上界(2^k-1),但怀疑可以优化。ChatGPT 5.5 Pro的突破在于,它通过组合Sidon集(一种求和集最大化的特殊集合)和等差数列,构造出了一个二次上界,这在理论上是可能的最优结果。

更令人惊讶的是后续发展。当Gowers将问题升级到k重求和集的一般情形时,ChatGPT 5.5 Pro在Isaac Rajagopal已有工作的基础上,通过引入k-解离集合的创新构造,将上界从指数级改进到多项式级。整个过程分为八轮交互,总耗时约两小时,Gowers的数学输入为零——他仅扮演了“项目经理”的角色:提出需求、确认方向、要求交付。
二、AI数学能力的结构性突破:从模式识别到概念创新
传统观点认为,大型语言模型在数学领域的优势仅限于模式识别和已有知识的重组。然而,Gowers的实验揭示了更深层次的能力跃迁:
1. 概念迁移与重构能力
ChatGPT 5.5 Pro在解决二重求和集问题时,核心洞察是使用更高效的Sidon集替代Nathanson原始证明中的2的幂次集合。这并非简单的“拼积木”,而是对问题结构的深刻理解:Sidon集确保求和集最大化,等差数列提供灵活性,两者的组合能够精确控制直径。更重要的是,AI能够将这一思路迁移到更复杂的k重求和集问题,通过k-解离集合的概念创新实现突破。
2. 证明策略的自主规划
在Isaac Rajagopal工作的基础上,AI没有简单复制原有证明,而是识别出关键瓶颈——构造具有特定求和集性质的多项式大小集合。它提出的解决方案是:利用有限域上的Bose-Chowla构造生成k-解离集合,然后通过精心设计的参数调整实现目标。这种从问题识别到策略制定的完整链条,已经超越了传统“工具”的范畴。
3. 数学写作的规范化输出
当Gowers要求将论证写成LaTeX预印本格式时,ChatGPT在47分钟内完成了符合学术规范的完整论文。这不仅包括数学内容的准确表达,还涉及引理编号、证明结构、参考文献等学术写作的完整要素。这种能力使得AI产出的数学内容可以直接进入学术交流流程。
三、数学研究生态的连锁冲击
Gowers的焦虑并非源于AI能力的展示本身,而是其对整个数学研究生态系统可能产生的结构性影响:
1. 博士生培养体系的“地基动摇”
传统数学博士培养的核心路径是:导师给出难度适中的公开问题,学生通过解决这些问题学习研究方法和积累信心。Nathanson论文中的问题正是这类“入门级”研究问题的典型代表。当AI能够在两小时内解决这类问题时,新手的入门门槛被急剧抬高——现在需要证明的不再是“没人证明过的东西”,而是“AI也证明不了的东西”。
2. 学术发表体系的规则失效
Gowers面临一个现实困境:这个由AI主导完成的数学成果该如何处理?如果是人类数学家的成果,它完全够得上发表水平。但arXiv已明确拒绝AI生成内容,传统期刊也不太可能接受。这引发了一个根本性问题:在AI参与度越来越高的研究中,成果归属和发表渠道该如何定义?Gowers提议建立专门的AI数学成果仓库,但审核机制、质量标准和学术认可度都是待解难题。
3. 研究价值的重新定义
Gowers提出了一个尖锐的思想实验:如果一位数学家通过与AI长时间对话解决重大难题,数学家起引导作用但主要想法和技术工作都是AI完成的,这算不算该数学家的重大成就?他的答案是否定的。这触及了数学研究的核心价值问题——当证明的“生产”环节可以被自动化,数学家独特贡献的边界在哪里?
四、陶哲轩的“金字塔”模型:证明的生成、验证与消化
另一位菲尔兹奖得主陶哲轩提供了不同的分析框架。他将数学问题的解决分为三个层次:
证明生成:构造完整的证明链条。这是AI目前进步最快的领域,ChatGPT 5.5 Pro的表现已经证明了这一点。
证明验证:确认证明的正确性。形式化验证工具如Lean、Coq等正在快速发展,AI可以辅助甚至自动化这一过程。
证明消化:真正理解证明的内涵、结构和深层意义。陶哲轩认为,这是AI尚未突破、也可能是人类最不可替代的领域。
陶哲轩用“证明消化不良”来形容可能出现的认知危机:当证明像流水线产品一样被大量生成,甚至机器都能完成验证,但没有人真正消化它们时,数学知识的积累将变得空洞。他警告,盲目优化“可读性”指标可能适得其反——就像把所有食物放进搅拌机直接灌入胃中,技术上解决了消化问题,但失去了饮食的本质体验。
五、数学中的“自然难度”与“人工难度”
陶哲轩的深刻洞察在于区分了两种不同类型的数学难度:
人工难度:源于糟糕的表述、混乱的结构或不必要的复杂化。这些是可以通过更好的数学写作消除的障碍,AI确实能在这方面提供巨大帮助。
自然难度:问题本身固有的复杂性,理解它需要真正的智力努力和概念重构。这种“咀嚼”过程不仅是获取知识的手段,更是产生新洞察的源泉。
陶哲轩在播客中透露,他会故意在日程中留出空白时间用于“不期而遇”——那些无法规划的灵感时刻。这暗示了数学研究中非算法化的一面:直觉、审美判断、跨领域联想,这些可能正是AI时代人类数学家的核心优势。
六、人机协作的新范式:从工具使用到思维融合
Gowers虽然感到危机,但也指出了两条缓冲路径:
1. 博士生可以使用AI
未来的研究门槛可能不再是“独立解决AI解不出的问题”,而是在人机协作中做出AI单独做不到的成果。Gowers自己最近就在进行大量人机协作的数学研究,他发现AI能提供有用贡献,但尚未达到独立产生颠覆性想法的程度。
2. 组合数学的特殊性
AI目前在组合数学领域表现突出,因为这类问题往往是从明确问题出发的反向推理。而其他数学分支如代数几何、拓扑学等,更多是从概念出发的正向探索,需要判断哪些观察有趣、哪些方向值得深入——这种“数学审美”对AI来说更具挑战性。
然而,Gowers强调这些判断只适用于当前AI水平。大模型的迭代速度意味着今天的观察可能几个月后就过时。他预测,2029年毕业的博士生将面对完全不同的数学研究生态。
七、数学教育的价值重构:从定理冠名到思维深度
面对AI的冲击,数学学习的价值需要重新审视。Gowers提出了一个务实观点:就像优秀程序员比普通人更擅长“氛围编程”(vibe coding),真正做过研究的数学家也会更擅长与AI协作。因为对问题解决过程的深层理解,能转化为更有效的AI使用能力。
数学作为一种高度可迁移的底层思维能力,其价值可能从“定理冠名”的学术荣誉,转向“思维深度”的个人资本。在AI时代,能够提出好问题、识别重要方向、消化复杂证明、进行跨领域连接的能力,可能比单纯的生产证明更有价值。
八、未来展望:数学研究的“后证明时代”
两位菲尔兹奖得主的观察共同指向一个可能的方向:数学研究正在进入“后证明时代”。在这个时代:
证明生产将日益自动化,但问题提出和概念创新的价值会提升
数学写作和沟通技能变得更为关键,因为需要与AI有效协作
形式化验证成为标准流程,数学严谨性达到新高度
跨学科连接能力成为突破性进展的主要来源
数学教育重点从技巧训练转向思维深度和问题意识培养
Gowers的实验不仅展示了AI在数学研究中的惊人能力,更触发了对数学本质的深层反思。当机器能够完成曾经被认为是人类智能巅峰的创造性证明时,我们不得不重新思考:数学究竟是什么?数学家的独特价值在哪里?数学教育应该培养什么?
答案可能不在那些可以被自动化的技术细节中,而在那些无法被算法化的思维品质里——提出好问题的直觉、识别重要模式的眼光、建立深层连接的创造力,以及在复杂概念中导航的智慧。这些,或许才是AI时代数学研究的真正前沿。

AI的"思考",可能是一场精心设计的表演,到底是我们在使用工具,还是机器给我们讲了一个我们最爱听的睡前故事?
降低AI 成本,三大最省Token的万星开源项目推荐:Caveman、Graphify、Claude Mem 谁是你的心头爱?
【AI日报】小米双模型开源,OpenAI微软松绑,Warp开源,GitHub为Agent扩容提速,GitHub Copilot转向按量计费,Mistral推出Workflows
还在“养虾”?科技圈已集体“养马”:这个Hermes Agent开源项目两个月10万星,到底做对了什么

商派OMS系统「AI助手智能体」上岗,可配合龙虾接入飞书/企微多端使用
开源商城+开源OMS:oss.shopex.cn

夜雨聆风