一个博士生冲进导师办公室,眼眶通红——不是因为论文被拒,而是因为他花数年推进的数学难题,被 AI 在 5 天内解决了。这不是科幻,这是 2026 年正在发生的事。

15天,vs 数年
卡内基梅隆大学数学系博士生 Sidharth Hariharan,今年早些时候收到一个消息,冲进了导师办公室,眼里含着泪。
他没做错什么。他的研究方向没问题。只是——一家叫 Math, Inc. 的加州创业公司,用他们的 AI 系统 Gauss,拿着数学家们整理好的攻坚路线图,在 5 天内完成了他原本要花数年才能完成的工作。
5天。数年。
这道题的分量不低:它涉及到对 Viazovska 博士成果的形式化证明——八维空间中球体最密堆积问题,俗称"球堆问题",是数学史上的顶级难题之一。
年轻数学家花数年积累的研究资本,AI 用一周给花完了。
2这不是孤例,是一场军备竞赛
过去两年,AI 在数学领域的突破正在加速,且正在从"考试做题"迈向"真正做研究"。
AI 数学能力里程碑(来自资料中有据可查的事件)
2021:DeepMind AI 发现绳结理论中人类数学家未曾发现的关系,传统方法可能需要数年 2024:Google DeepMind 两个 AI 模型在国际数学奥林匹克(IMO)斩获银牌 2025:哈佛教授 Brenner 在同一门课上,AI 解题率从 30-50% 跳升至接近全覆盖 2026年5月:OpenAI 用未公开推理模型,反驳了 Paul Erdős 1946 年提出的平面单位距离问题猜想——这个猜想已悬挂近 80 年(数据来源:OpenAI 官方推文,6.93M 浏览) 2026年:Gauss 5 天内完成博士生级别的形式化证明工作
各家公司已经把"在数学上赢"变成了展示机器智能的主战场。NYT 的报道用了"军备竞赛"(arms race)这个词——这不是比喻,这是现状。
数学,这个曾被视为人类智识巅峰的领域,正在成为 AI 公司的公关秀场。
3学术界在做什么?
不是所有人都在喝彩。一批顶级数学家在 2026 年 2 月发起了一个叫 First Proof 的项目,目标明确:
建立一套客观、现实的方法论,评估 AI 系统能否真正自主解决研究级别的数学问题。
具体操作是:团队成员拿出自己已解决但未发表的 10 道题,2 月 5 日公开题目,2 月 13 日公开答案,给业界一周时间作答。
结果呢?OpenAI 的提交记录显示,他们在解题过程中加入了人工干预——而这严格违反了项目规则。
这很说明问题:当 AI 公司在"无监督自主解题"的考场上需要偷偷开小抄,说明现阶段的数学 AI 距离真正的自主研究,还有一段诚实的距离。
4"AI 能做题"和"AI 能做研究"是两件事
Tamara Kolda 在 Silicon Reckoner 上的文章说得很清楚,值得引用:
"也许 AI 能解一道给定的数学题,但它没有想要解它的欲望,没有创造性洞察的驱动力,对问题本身是否有意义没有判断,对用哪种方法也没有立场。而我的合作者有观点,他们能争论我们是否在问正确的问题,能激发完全不同的思路,有时能改变我整个数学世界观。"
这个区分很关键。AI 现在能做的,更接近于:在给定路线图的情况下,高速、耐心地执行已知策略。球堆问题的突破,是数学家们提供了形式化路线图,Gauss 按图完成。Erdős 问题的破解,是 AI 在大量穷举推理后找到反例,再由专业数学家提取、改写成标准证明。
这更像一个极度高效的执行者,而不是一个真正的创造者。
AI 数学能力的真实边界(目前来看)
✅ 擅长:给定路线图后的高速形式化执行 ✅ 擅长:在海量数据库中找规律(如绳结关系) ✅ 擅长:链式推理穷举,找人类"嫌烦"的反例 ❌ 不擅长:判断"这个问题值不值得问" ❌ 不擅长:可靠引用来源(AI 会自信地引用不存在的结果) ❌ 不擅长:在无监督条件下完成真正开放的研究级问题
5真正的问题:年轻学者的职业路径
球堆问题的形式化,原本是年轻数学家证明自己的机会——这类工作技术含量高、耗时长、但成果清晰,是博士生涯里重要的"资本积累"。
现在这个机会没了。
AI 抢走的不只是一道题的署名权,而是年轻学者用来证明自己价值的那类工作本身。
这和程序员的处境如出一辙:不是"AI 要替代你",而是"AI 先把你最容易展示能力的那部分做了"。剩下的,是更难定义、更难量化、也更难被承认的工作。
哈佛教授 Brenner 的应对方式是:让学生出题,而不是做题。"如果不够好的模型都能解你的题,那不算数。"这是一种适应,但也是一种承认——旧的评价体系已经失效。
AI 在数学上的突破是真实的——但它目前最擅长的,是抢走年轻人证明自己的机会,而不是替代真正的数学创造力。学术界需要快点想清楚:如果"完成高难度形式化工作"不再是衡量博士价值的标准,那什么才是?
这个问题,比球堆问题难多了,而且 Gauss 解不了。
💬 你怎么看:AI "截胡"学术成果,算学术不端,还是工具进步的正常结果?

夜雨聆风