AI用5天截胡了数学家数年的研究成果

一个博士生冲进导师办公室，眼眶通红——不是因为论文被拒，而是因为他花数年推进的数学难题，被 AI 在 5 天内解决了。这不是科幻，这是 2026 年正在发生的事。

15天，vs 数年

卡内基梅隆大学数学系博士生 Sidharth Hariharan，今年早些时候收到一个消息，冲进了导师办公室，眼里含着泪。

他没做错什么。他的研究方向没问题。只是——一家叫 Math, Inc. 的加州创业公司，用他们的 AI 系统 Gauss，拿着数学家们整理好的攻坚路线图，在 5 天内完成了他原本要花数年才能完成的工作。

5天。数年。

这道题的分量不低：它涉及到对 Viazovska 博士成果的形式化证明——八维空间中球体最密堆积问题，俗称"球堆问题"，是数学史上的顶级难题之一。

年轻数学家花数年积累的研究资本，AI 用一周给花完了。

过去两年，AI 在数学领域的突破正在加速，且正在从"考试做题"迈向"真正做研究"。

AI 数学能力里程碑（来自资料中有据可查的事件）

2021：DeepMind AI 发现绳结理论中人类数学家未曾发现的关系，传统方法可能需要数年
2024：Google DeepMind 两个 AI 模型在国际数学奥林匹克（IMO）斩获银牌
2025：哈佛教授 Brenner 在同一门课上，AI 解题率从 30-50% 跳升至接近全覆盖
2026年5月：OpenAI 用未公开推理模型，反驳了 Paul Erdős 1946 年提出的平面单位距离问题猜想——这个猜想已悬挂近 80 年（数据来源：OpenAI 官方推文，6.93M 浏览）
2026年：Gauss 5 天内完成博士生级别的形式化证明工作

各家公司已经把"在数学上赢"变成了展示机器智能的主战场。NYT 的报道用了"军备竞赛"（arms race）这个词——这不是比喻，这是现状。

数学，这个曾被视为人类智识巅峰的领域，正在成为 AI 公司的公关秀场。

不是所有人都在喝彩。一批顶级数学家在 2026 年 2 月发起了一个叫 First Proof 的项目，目标明确：

建立一套客观、现实的方法论，评估 AI 系统能否真正自主解决研究级别的数学问题。

具体操作是：团队成员拿出自己已解决但未发表的 10 道题，2 月 5 日公开题目，2 月 13 日公开答案，给业界一周时间作答。

结果呢？OpenAI 的提交记录显示，他们在解题过程中加入了人工干预——而这严格违反了项目规则。

这很说明问题：当 AI 公司在"无监督自主解题"的考场上需要偷偷开小抄，说明现阶段的数学 AI 距离真正的自主研究，还有一段诚实的距离。

Tamara Kolda 在 Silicon Reckoner 上的文章说得很清楚，值得引用：

"也许 AI 能解一道给定的数学题，但它没有想要解它的欲望，没有创造性洞察的驱动力，对问题本身是否有意义没有判断，对用哪种方法也没有立场。而我的合作者有观点，他们能争论我们是否在问正确的问题，能激发完全不同的思路，有时能改变我整个数学世界观。"

这个区分很关键。AI 现在能做的，更接近于：在给定路线图的情况下，高速、耐心地执行已知策略。球堆问题的突破，是数学家们提供了形式化路线图，Gauss 按图完成。Erdős 问题的破解，是 AI 在大量穷举推理后找到反例，再由专业数学家提取、改写成标准证明。

这更像一个极度高效的执行者，而不是一个真正的创造者。

AI 数学能力的真实边界（目前来看）

球堆问题的形式化，原本是年轻数学家证明自己的机会——这类工作技术含量高、耗时长、但成果清晰，是博士生涯里重要的"资本积累"。

现在这个机会没了。

AI 抢走的不只是一道题的署名权，而是年轻学者用来证明自己价值的那类工作本身。

这和程序员的处境如出一辙：不是"AI 要替代你"，而是"AI 先把你最容易展示能力的那部分做了"。剩下的，是更难定义、更难量化、也更难被承认的工作。

哈佛教授 Brenner 的应对方式是：让学生出题，而不是做题。"如果不够好的模型都能解你的题，那不算数。"这是一种适应，但也是一种承认——旧的评价体系已经失效。

AI 在数学上的突破是真实的——但它目前最擅长的，是抢走年轻人证明自己的机会，而不是替代真正的数学创造力。学术界需要快点想清楚：如果"完成高难度形式化工作"不再是衡量博士价值的标准，那什么才是？

这个问题，比球堆问题难多了，而且 Gauss 解不了。

💬 你怎么看：AI "截胡"学术成果，算学术不端，还是工具进步的正常结果？