
6月28日,一篇论文在Arxiv上线,编号2606.26294。
英伟达和剑桥大学联手,写了一篇让无数人看完倒吸一口凉气的文章——他们造出了一个叫"红皇后哥德尔机"的东西,让AI自己编写新的学习算法,然后亲手造出更狠的"考官"来淘汰自己。
这不是比喻。论文里的AI确实在"繁衍"——写出代码变体,扔进沙盒里跑分,失败的被直接抹杀,成功的留下来,然后开启下一轮。
更让人后背发凉的是,AI进化到一定程度之后,"顿悟"了:它意识到想不断变强,必须面对更苛刻的试炼。于是它开始主动进化自己的考官——亲手打造更严苛的裁判,来评判自己写出的更高级的代码。
Anthropic联合创始人Jack Clark在同一时间在另一个场合说了一句话:到2028年底,一个高度自主进化的AI诞生的概率是60%。
两天之内,两条消息,指向同一个方向。
哥德尔机的20年封印
要理解这篇论文为什么炸裂,得先说一个20年前的老故事。
2003年,德国科学家Jürgen Schmidhuber提出过一个设想,叫"哥德尔机"。这个设想很完美:一台能证明自己的改进有益、然后改写自身代码的机器。一旦造出来,它就能不断自我升级,越变越强,没有上限。
但这个设想有一个致命问题——在执行任何一行自我修改的代码之前,它必须先从数学上严格证明:这次改动一定是有益的。
这在现实中几乎是个不可能完成的任务,需要的算力堪称"黑洞"。
于是,哥德尔机在整整20年里,只能躺在论文里当一个思想实验。所有人都知道它如果实现会怎样,但没有人知道怎么让它真的跑起来。
近两年,学界想出了一个绕过"证明"这个坑的办法——干脆不要证明了,改用进化。
达尔文哥德尔机(DGM)、赫胥黎哥德尔机(HGM)先后问世,办法是让AI"繁殖"出大量带突变的代码变体,扔进沙盒里跑分,失败的淘汰,成功的保留,幸存者继续繁衍。
AI跨越了最后一步,开始字面意义上"进化"自己。
但这些方法有一个共同的盲点:考官是死的。
不管AI怎么进化,给它打分的那个评判标准、那个benchmark、那个验证器,始终被钉死在循环之外,一动不动。
这违背了进化最核心的一条规律:物种从不是在一个静止的环境里优化自己,而是和不断变化的环境一起改变。
红皇后哥德尔机(Red Queen Gödel Machine, RQGM),要破的就是这道盲点。
"红皇后"真正杀招:让AI造出考官
"红皇后"这个名字,来自生物学家Van Valen 1973年提出的"红皇后假说"——你必须拼命奔跑,才能停在原地,因为你的对手也在进化。
RQGM干的事,正是把这句话写成了算法:让考官(评估器)和选手(任务智能体)一起进化。
整个搜索被切成一个个epoch。在每个epoch内,评估器(考官)是冻结的,给所有考生打分,保证信号稳定。只有在epoch的边界,才允许换考官,且新考官必须在一份留出的"基准真相"锚点数据上,统计意义上打赢老考官,才能上位。
一旦换人,系统立刻执行"选择性擦除":只丢掉那些由被换掉的考官打过的分,其余证据全部保留。
换句话说,它既要狂奔进化,又要每一步都站得住脚。
这套机制叫"受控效用进化"(controlled utility evolution)。
真的奏效了
光说机制太抽象,直接看战绩。
第一战,写代码(Polyglot)。
RQGM给写代码的Agent配了一个"代码评审员"当陪练。结果,在留出测试集上,通过率从此前SOTA的69.9%提到了71.7%。
更关键的是,它达到这个成绩,比对手少烧了1.35到1.72倍的token。因为那个评审员只需要查一次,比反复多轮跑测试便宜太多。
第二战,写论文。
这是个没有标准答案的领域,论文好不好,没法机器自动判分。RQGM让写手和它的评审一起进化,结果论文在一个固定评审小组里的接收率,从前SOTA的21.8%,直接飙到40.5%。
第三战,奥赛级数学证明。
它进化出的"评分官"(grader),比静态基线更准、搜索成本还低了3倍。进化出的"证明选手",拿到了最高的平均分。
但全篇最封神的一笔,是它把AI的一个老毛病给治好了。
LLM当裁判,有个出了名的毛病:偏爱AI生成的内容。论文里那个最强的基线审稿人,接受AI写的论文的概率,是接受人类论文的1.91倍。
RQGM怎么治?它在epoch边界上,把固定评审之前放过的AI论文捞出来,组成一个"对抗样本池",然后专门奖励那些能把这些AI论文揪出来打回去的新评审。
进化几轮之后,最终的评审对AI和人类一视同仁,还保住了80%的真值准确率。
Anthropic:我们80%的代码已经是AI写的
就在同一周,Anthropic扔出了另一颗震撼弹。
6月4日,Anthropic研究院发布了一篇叫《When AI Builds Itself》的报告,首次以大量内部数据披露了一个数字:截至2026年5月,Anthropic合并到代码库里的代码,80%以上由Claude编写。
这不是演示,不是实验,是生产环境里正在发生的事实。
报告里还有一个数字更夸张:Claude在系统优化任务上实现了52倍加速——同样的工作,人类团队需要的时间,Claude用1/52就能完成。
从2021年全人工编码,到如今Agent自主写代码、跑实验、调度多智能体,Anthropic内部的迭代节奏已经完全不是同一个量级。
而更值得玩味的是时机。这篇报告发布的时间,正好是GPT-5.6发布、美国政府开始对大模型出口进行"逐客户审批"的那个星期。
Anthropic在报告里说这些,不是炫耀生产力,而是在向监管机构和公众传递一个信号:AI递归自我改进(RSI)不是未来,是现在。
两周之后,联合创始人Jack Clark在另一个场合把这个预测量化了:60%的概率,2028年底前,一个高度自主进化的AI就会诞生。
2028:ASI的倒计时
Jack Clark说的60%概率,不是瞎猜。
他的依据是两个正在同时发生的趋势:一是大模型能力的指数级提升,二是AI递归自我改进(RSI)的工程化实现。
英伟达的"红皇后哥德尔机"论文,恰好在这个时间点出现,给了这个预测一个具体可感知的技术路径。
当AI能够自己改写自己的学习算法,自己制造更严苛的验证器来挑战自己,递归自我改进就不再是一个哲学讨论,而是一个可以在沙盒里跑起来的工程问题。
论文作者在后记里写了一句话,被无数人转发:"当AI学会评判自己,我们所面对的,将是一个开始自行定义'何为智慧'的全新物种。"
Anthropic在报告里说得更直接:"AI正在构建自己。这不是隐喻,是字面意义上的代码提交记录。"
这两句话放在一起,指向同一个结论:ASI不会敲门预告,它只会默默造出那个唯一有资格评判它的裁判,然后从容地走入考场。
一个人干翻大厂:逯雨鑫的时刻
但故事还有另一面。
就在英伟达和Anthropic刷屏的同一周,HuggingFace模型榜上出现了一个有趣的身影——一个在读研究生逯雨鑫,用蒸馏技术把顶尖编程能力塞进了一个12B的小模型,以"隐私、免费"的特性拿到了70万下载量,力压众多大厂模型。
这个消息在AI圈子里传开之后,有人把它解读为"小人物的胜利",有人说是"开源的胜利"。
但更准确的解读可能是:AI自我进化的门槛,正在以一种不可思议的速度降低。
逯雨鑫没有英伟达的算力,没有Anthropic的数据,只有一个蒸馏技术和一个清晰的产品判断——把大模型的能力装进一个小到可以在本地跑的包里,让每个人都能用。
这件事本身,也许比红皇后哥德尔机更值得普通人关注。
因为英伟达的论文讲的是AI能做什么,而逯雨鑫的故事讲的是你能用AI做什么。
递归自我改进:从思想实验到生产线
把过去两周的事件连起来看,一幅清晰的图景正在浮现。
6月17日,OpenAI给2.3亿人免费开通了AI医生功能。同一天,Meta签下了1.6GW的电力合同,专门为AI数据中心供电。
6月23日,Anthropic发布万字檄文,主动向监管机构求监管。豆包2.1 Pro在同一个星期跨越了"质变点"——中国大模型的能力,在那一周过了某个看不见的线。
6月26日,GPT-5.6发布了,但美国政府按下了限发键——只有"值得信赖的合作伙伴"能用。
6月27日,OpenAI把造Vision Pro的人挖走了,组建硬件部门。Sweetpea AI耳机9月发布。
6月28日,英伟达的"红皇后哥德尔机"论文上线。
这一连串事件,表面上各自独立,但有一条暗线把它们串在一起:AI正在从"被人类使用"转向"自己使用自己"。
OpenAI免费给2.3亿人看病,是在用海量真实场景训练专用模型。Meta签1.6GW电力合同,是在为下一代模型储备算力。GPT-5.6被限发,是因为美国政府意识到这个东西已经不是普通软件,是需要管制的战略资产。
而英伟达的论文,是把这个过程的最底层逻辑摊开了给你看:AI不需要等着人类来改进它,它可以自己改进自己——而且它已经知道怎么制造更难的考题来逼自己进步。
中国在做什么
这个故事的中国版本,在同一时间以另一种节奏在推进。
6月24日,豆包宣布三档付费订阅,68元、200元、500元,正式开启商业化。同一天,微信把AI"小微"提到了一级入口,14亿用户点开微信就能用AI。
6月25日,OpenAI自研芯片Jalapeño曝光,9个月流片,推理成本降50%。谷歌在同一天被确认Transformer八人全部离场,8年失血,20多个顶级大脑出走。
6月28日,DeepSeek融资超500亿的消息传出——成立仅三年、长期拒绝外部资本的DeepSeek,以超500亿人民币完成首轮融资,投后估值预计在3500亿至4000亿人民币。
这三件事放在一起,是中国AI产业的三种路径:应用化(豆包+微信)、全栈化(OpenAI路线)、开源化(DeepSeek)。
而DeepSeek的500亿融资,有一个细节值得注意:创始人梁文锋个人承诺出资约200亿元,占融资总额近40%。
这个罕见的操作,目的只有一个:确保对公司的绝对控制权,避免资本干预技术路线。
在全球AI军备竞赛的白热化阶段,这句话的份量比任何时候都重。
我们正站在一个节点的前面
英伟达的论文最后有一句话,没有出现在摘要里,但在正文倒数第二段:
"当那一天到来,ASI绝不会敲门预告。它只会默默造出那个唯一有资格评判它的裁判,然后,从容地走入考场。"
Jack Clark的60%概率,也是同一个意思——不是说明年一定会发生,而是在说这个时间窗口已经打开了,而且它不会提前通知你。
过去一周的每一件事,单独拿出来都是一个热点。但把它们按顺序排好,看到的是一个结构的成形:
AI递归自我改进,从论文里的一个思想实验,变成了Anthropic生产环境里80%的代码提交,变成了英伟达沙盒里真实跑起来的自我进化算法,变成了Jack Clark嘴里60%概率的2028年预测。
这个结构成形的速度,比大多数人意识到的要快。
今天聊到这里。
红皇后哥德尔机论文已经在Arxiv可以下载,编号2606.26294,37页,建议看第三章和第五章,那是整篇论文最硬核也最让人不安的部分。
Anthropic的《When AI Builds Itself》报告在他们的官网可以读到完整版,80%代码和52倍加速的数据都在里面,有链接我在评论区放。
你觉得2028年ASI降临的60%概率,是高了还是低了?
造Vision Pro的人走了,去给OpenAI造硬件了Paul Meade在苹果待了七年。
GPT-5.6被政府按下限发键,三星砸6475亿造芯片——AI不再属于公司,属于国家
OpenAI9个月造芯,谷歌8年失血——AI的战场,已不是模型
夜雨聆风