你有没有想过,AI什么时候会开始"自己想问题"?
不是人类给它出题让它解,而是它自己发现问题、找到人类没想过的路径、然后把答案扔到你桌上说"这个你们搞错了"?
昨天,OpenAI干了一件让整个数学界睡不着觉的事——他们的内部通用推理模型,独立证明了一个被埃尔德什在1946年提出的几何猜想是错的。
80年了。几代数学家在这个"平面单位距离问题"上反复折戟,埃尔德什本人还掏出500美元悬赏——结果让一台没发布过的AI,用一个完全没人想到的方法,给翻案了。
更离谱的是:它走的那条路,连专门研究这个问题的数学家都没见过。
发生了什么
先说清楚这个"单位距离问题"到底在问什么——
平面上随便放n个点,这些点之间距离恰好为1的点对,最多能有多少对?
听起来很简单对吧?但这玩意儿折磨了数学家整整80年。埃尔德什当年的猜想是:方形网格构造基本就是最优解,单位距离对数量的增长"几乎"就是线性的。
80年来,没有人能推翻它。
然后OpenAI的模型出手了。
它的证明不是修修补补,而是直接给出了一个无限的反例序列——单位距离对数量可以获得多项式量级的改进。普林斯顿大学的Will Sawin后续精炼后,算出这个改进幅度大概是δ = 0.014。
你可能觉得才1.4%,这有什么好激动的?
问题在于定性,不是定量。埃尔德什的猜想说的是"不可能比线性好多少",现在模型证明了"它确实可以比线性好"——这叫推翻,不是改进。
证明方法本身才是真正让数学家们倒吸一口凉气的地方。
模型没有走组合几何或者图论的老路,它借用了代数数论领域的工具——研究整数扩张、因子分解那一套东西。这就好比你想证明一道几何题,结果你用的是代数的思路,而且这个代数方法之前根本没人想过能这么用。
哈佛的数学家Melanie Matchett Wood说过一句很到位的话:如果把这次验证工作同等时间给人类数学家,"他们也能找到一个反例"。
但关键在于——AI先找到了。
为什么这事不是"又一个人类输了"的叙事
我知道你可能已经听腻了"AI又赢了人类"的新闻,但这次真的不太一样。
以前的AI做数学,听话归听话,但它本质上是个超级搜索引擎——你给它喂题,它在人类已有的知识库里找相似的解法,然后缝合出一个答案。这是"能做题"。
这一次,模型是在一个开放性的研究问题上给出原创构造——你问它一道没人解过的题,它没去翻任何人的作业本,它自己想了一个连专门研究这个问题的数学家都没想到的方法,然后算出了答案。
这是"能发现"。
菲尔兹奖得主蒂姆·高尔斯(Tim Gowers)的评价我建议你仔细读一遍。他说:
"如果这篇论文出自人类作者,投到《数学年刊》,我会建议接受。"
《数学年刊》是全球最顶级的数学期刊之一。高尔斯不是那种随便说话的人,他也是之前公开质疑AI数学能力的那批人之一。
而且有意思的是,7个月前OpenAI刚因为一次虚假宣传被打脸。当时他们前副总裁Kevin Weil说GPT-5解决了10个埃尔德什未解问题,结果被曼彻斯特大学的Thomas Bloom当场揭穿——那玩意儿只是检索到了已有文献,根本不是原创证明。Weil后来删帖跑路了。
这一次,OpenAI学聪明了。他们直接拉来了9位数学家联合署名,包括Bloom本人。
Bloom这次的态度很有意思,他说AI"正在帮助人类更充分地探索几个世纪以来构建的数学殿堂,还有哪些尚未被看见的奇迹正等候登场"。但他也补了一刀:AI的原始证明虽然完全有效,但被人类数学家"显著改进"了——人类在消化和改进证明方面仍然扮演关键角色。
翻译成人话:AI负责发现,人类负责消化。
这意味着什么
我看到一些自媒体已经开始喊"数学家要失业了",这种说法既蠢又无聊。
但有一些更深的问题值得认真想——
第一,AI开始走人类没想过的路了。
组合几何领域的专家们多少年来都在用图论、组合方法死磕这个猜想,没人想过借用代数数论。但AI没被人类的"领域偏见"污染,它在跨领域的知识库里找到了连接,然后拼出了一个路径。
这说明什么?AI不是简单地更努力地尝试人类已知的方法,它是真的在建立新的知识连接。
第二,"原创性"的定义可能要重新考虑了。
MIT的一个23岁学生Liam Price,用GPT-5.4 Pro在80分钟内解决了一个困扰数学家60年的埃尔德什问题。菲尔兹奖得主陶哲轩亲自验证了这个证明,还把它扩展为新理论的起点。
过去,"解决开放问题"是衡量一个数学家研究能力的核心指标。现在这个门槛被AI一夜之间碾平了。
高尔斯说了一句很重的话:"未来对数学的贡献门槛,将变成证明一些LLM无法证明的东西,而不是仅仅证明一些还没有人证明过的东西。"
这意味着什么?意味着数学研究的方向会发生根本性转向——人类数学家可能要更多地去做那些"AI够不到的地方",而不是和AI抢地盘。
第三,人机协作的新模式正在形成。
OpenAI发布的那篇验证论文本身就是证明。AI生成原始证明,人类数学家负责消化、改进、写出人类能理解的版本。模型跑出了结果,人类负责"翻译"成数学共同体能接受的语言。
陶哲轩把这种现象叫做"证明消化不良"——AI生成和验证证明的速度越来越快,但人类理解、解释、拓展结果的效率跟不上。这不是某一个环节的问题,这是整个数学实践的节奏正在被打乱。
我们应该担心还是期待
我既不是AI万能论者,也不是AI威胁论者。
这次的事件让我最兴奋的不是"AI打败了人类",而是——数学研究有了一个新的探索工具。
几百年来,数学家最大的瓶颈是什么?是想象力。你需要知道哪个方向可能是对的,你需要敢赌一个没人走过的路。人类数学家的知识面是有限的,跨领域的连接靠的是天才般的直觉和运气。
现在AI可以帮你做这个。
它可以遍历不同领域的知识连接,找到人类没想过的路径,然后把这个路径扔给人类专家去判断、去消化、去发展。
这不叫替代。这叫协作升级。
当然,这也带来一些严肃的问题:
博士生怎么办?那些曾经需要数年训练才能叩开的研究大门,现在可能只需要一个提示框和两个小时。数学教育体系需要重新思考自己在培养什么能力。
学术评价体系怎么办?arXiv目前明确拒绝接收AI撰写的内容,那这些突破性的AI证明该往哪投?同行评审的标准怎么定?
知识产权怎么算?这次OpenAI的论文,原始证明是AI生成的,人类数学家负责验证和改进,这个成果算谁的?
这些问题没有标准答案。但它们真实存在,而且很快就需要有人来回答。
最后说一句
过去两年,类似的"AI攻克数学"叙事出现过好几次,仔细看都有各种条件限制。
但这一次,说话的人里有菲尔兹奖得主,有专门打假OpenAI的数学家,有普林斯顿、哈佛、多伦多等顶级机构的学者。他们的评价出奇一致:这确实是AI首次在开放性研究问题上给出可同行审查的原创构造。
从"能做题"到"能发现",这不只是能力的量变,这是范式的转移。
我不知道数学家的未来会怎样。但我知道,数学这门最古老、最纯粹的理性探索,正在被重新定义。
这挺让人激动的。
#AI数学 #OpenAI #埃尔德什 #单位距离猜想 #数学突破 #人工智能 #菲尔兹奖 #通用推理 #范式转移 #人机协作
夜雨聆风