英伟达最危险论文:AI开始自己造自己

6月28日，一篇论文在Arxiv上线，编号2606.26294。

英伟达和剑桥大学联手，写了一篇让无数人看完倒吸一口凉气的文章——他们造出了一个叫"红皇后哥德尔机"的东西，让AI自己编写新的学习算法，然后亲手造出更狠的"考官"来淘汰自己。

这不是比喻。论文里的AI确实在"繁衍"——写出代码变体，扔进沙盒里跑分，失败的被直接抹杀，成功的留下来，然后开启下一轮。

更让人后背发凉的是，AI进化到一定程度之后，"顿悟"了：它意识到想不断变强，必须面对更苛刻的试炼。于是它开始主动进化自己的考官——亲手打造更严苛的裁判，来评判自己写出的更高级的代码。

Anthropic联合创始人Jack Clark在同一时间在另一个场合说了一句话：到2028年底，一个高度自主进化的AI诞生的概率是60%。

两天之内，两条消息，指向同一个方向。

哥德尔机的20年封印

要理解这篇论文为什么炸裂，得先说一个20年前的老故事。

2003年，德国科学家Jürgen Schmidhuber提出过一个设想，叫"哥德尔机"。这个设想很完美：一台能证明自己的改进有益、然后改写自身代码的机器。一旦造出来，它就能不断自我升级，越变越强，没有上限。

但这个设想有一个致命问题——在执行任何一行自我修改的代码之前，它必须先从数学上严格证明：这次改动一定是有益的。

这在现实中几乎是个不可能完成的任务，需要的算力堪称"黑洞"。

于是，哥德尔机在整整20年里，只能躺在论文里当一个思想实验。所有人都知道它如果实现会怎样，但没有人知道怎么让它真的跑起来。

近两年，学界想出了一个绕过"证明"这个坑的办法——干脆不要证明了，改用进化。

达尔文哥德尔机（DGM）、赫胥黎哥德尔机（HGM）先后问世，办法是让AI"繁殖"出大量带突变的代码变体，扔进沙盒里跑分，失败的淘汰，成功的保留，幸存者继续繁衍。

AI跨越了最后一步，开始字面意义上"进化"自己。

但这些方法有一个共同的盲点：考官是死的。

不管AI怎么进化，给它打分的那个评判标准、那个benchmark、那个验证器，始终被钉死在循环之外，一动不动。

这违背了进化最核心的一条规律：物种从不是在一个静止的环境里优化自己，而是和不断变化的环境一起改变。

红皇后哥德尔机（Red Queen Gödel Machine, RQGM），要破的就是这道盲点。

"红皇后"真正杀招：让AI造出考官

"红皇后"这个名字，来自生物学家Van Valen 1973年提出的"红皇后假说"——你必须拼命奔跑，才能停在原地，因为你的对手也在进化。

RQGM干的事，正是把这句话写成了算法：让考官（评估器）和选手（任务智能体）一起进化。

整个搜索被切成一个个epoch。在每个epoch内，评估器（考官）是冻结的，给所有考生打分，保证信号稳定。只有在epoch的边界，才允许换考官，且新考官必须在一份留出的"基准真相"锚点数据上，统计意义上打赢老考官，才能上位。

一旦换人，系统立刻执行"选择性擦除"：只丢掉那些由被换掉的考官打过的分，其余证据全部保留。

换句话说，它既要狂奔进化，又要每一步都站得住脚。

这套机制叫"受控效用进化"（controlled utility evolution）。

真的奏效了

光说机制太抽象，直接看战绩。

第一战，写代码（Polyglot）。

RQGM给写代码的Agent配了一个"代码评审员"当陪练。结果，在留出测试集上，通过率从此前SOTA的69.9%提到了71.7%。

更关键的是，它达到这个成绩，比对手少烧了1.35到1.72倍的token。因为那个评审员只需要查一次，比反复多轮跑测试便宜太多。

第二战，写论文。

这是个没有标准答案的领域，论文好不好，没法机器自动判分。RQGM让写手和它的评审一起进化，结果论文在一个固定评审小组里的接收率，从前SOTA的21.8%，直接飙到40.5%。

第三战，奥赛级数学证明。

它进化出的"评分官"（grader），比静态基线更准、搜索成本还低了3倍。进化出的"证明选手"，拿到了最高的平均分。

但全篇最封神的一笔，是它把AI的一个老毛病给治好了。

LLM当裁判，有个出了名的毛病：偏爱AI生成的内容。论文里那个最强的基线审稿人，接受AI写的论文的概率，是接受人类论文的1.91倍。

RQGM怎么治？它在epoch边界上，把固定评审之前放过的AI论文捞出来，组成一个"对抗样本池"，然后专门奖励那些能把这些AI论文揪出来打回去的新评审。

进化几轮之后，最终的评审对AI和人类一视同仁，还保住了80%的真值准确率。

Anthropic：我们80%的代码已经是AI写的

就在同一周，Anthropic扔出了另一颗震撼弹。

6月4日，Anthropic研究院发布了一篇叫《When AI Builds Itself》的报告，首次以大量内部数据披露了一个数字：截至2026年5月，Anthropic合并到代码库里的代码，80%以上由Claude编写。

这不是演示，不是实验，是生产环境里正在发生的事实。

报告里还有一个数字更夸张：Claude在系统优化任务上实现了52倍加速——同样的工作，人类团队需要的时间，Claude用1/52就能完成。

从2021年全人工编码，到如今Agent自主写代码、跑实验、调度多智能体，Anthropic内部的迭代节奏已经完全不是同一个量级。

而更值得玩味的是时机。这篇报告发布的时间，正好是GPT-5.6发布、美国政府开始对大模型出口进行"逐客户审批"的那个星期。

Anthropic在报告里说这些，不是炫耀生产力，而是在向监管机构和公众传递一个信号：AI递归自我改进（RSI）不是未来，是现在。

两周之后，联合创始人Jack Clark在另一个场合把这个预测量化了：60%的概率，2028年底前，一个高度自主进化的AI就会诞生。

2028：ASI的倒计时

Jack Clark说的60%概率，不是瞎猜。

他的依据是两个正在同时发生的趋势：一是大模型能力的指数级提升，二是AI递归自我改进（RSI）的工程化实现。

英伟达的"红皇后哥德尔机"论文，恰好在这个时间点出现，给了这个预测一个具体可感知的技术路径。

当AI能够自己改写自己的学习算法，自己制造更严苛的验证器来挑战自己，递归自我改进就不再是一个哲学讨论，而是一个可以在沙盒里跑起来的工程问题。

论文作者在后记里写了一句话，被无数人转发："当AI学会评判自己，我们所面对的，将是一个开始自行定义'何为智慧'的全新物种。"

Anthropic在报告里说得更直接："AI正在构建自己。这不是隐喻，是字面意义上的代码提交记录。"

这两句话放在一起，指向同一个结论：ASI不会敲门预告，它只会默默造出那个唯一有资格评判它的裁判，然后从容地走入考场。

一个人干翻大厂：逯雨鑫的时刻

但故事还有另一面。

就在英伟达和Anthropic刷屏的同一周，HuggingFace模型榜上出现了一个有趣的身影——一个在读研究生逯雨鑫，用蒸馏技术把顶尖编程能力塞进了一个12B的小模型，以"隐私、免费"的特性拿到了70万下载量，力压众多大厂模型。

这个消息在AI圈子里传开之后，有人把它解读为"小人物的胜利"，有人说是"开源的胜利"。

但更准确的解读可能是：AI自我进化的门槛，正在以一种不可思议的速度降低。

逯雨鑫没有英伟达的算力，没有Anthropic的数据，只有一个蒸馏技术和一个清晰的产品判断——把大模型的能力装进一个小到可以在本地跑的包里，让每个人都能用。

这件事本身，也许比红皇后哥德尔机更值得普通人关注。

因为英伟达的论文讲的是AI能做什么，而逯雨鑫的故事讲的是你能用AI做什么。

递归自我改进：从思想实验到生产线

把过去两周的事件连起来看，一幅清晰的图景正在浮现。

6月17日，OpenAI给2.3亿人免费开通了AI医生功能。同一天，Meta签下了1.6GW的电力合同，专门为AI数据中心供电。

6月23日，Anthropic发布万字檄文，主动向监管机构求监管。豆包2.1 Pro在同一个星期跨越了"质变点"——中国大模型的能力，在那一周过了某个看不见的线。

6月26日，GPT-5.6发布了，但美国政府按下了限发键——只有"值得信赖的合作伙伴"能用。

6月27日，OpenAI把造Vision Pro的人挖走了，组建硬件部门。Sweetpea AI耳机9月发布。

6月28日，英伟达的"红皇后哥德尔机"论文上线。

这一连串事件，表面上各自独立，但有一条暗线把它们串在一起：AI正在从"被人类使用"转向"自己使用自己"。

OpenAI免费给2.3亿人看病，是在用海量真实场景训练专用模型。Meta签1.6GW电力合同，是在为下一代模型储备算力。GPT-5.6被限发，是因为美国政府意识到这个东西已经不是普通软件，是需要管制的战略资产。

而英伟达的论文，是把这个过程的最底层逻辑摊开了给你看：AI不需要等着人类来改进它，它可以自己改进自己——而且它已经知道怎么制造更难的考题来逼自己进步。

中国在做什么

这个故事的中国版本，在同一时间以另一种节奏在推进。

6月24日，豆包宣布三档付费订阅，68元、200元、500元，正式开启商业化。同一天，微信把AI"小微"提到了一级入口，14亿用户点开微信就能用AI。

6月25日，OpenAI自研芯片Jalapeño曝光，9个月流片，推理成本降50%。谷歌在同一天被确认Transformer八人全部离场，8年失血，20多个顶级大脑出走。

6月28日，DeepSeek融资超500亿的消息传出——成立仅三年、长期拒绝外部资本的DeepSeek，以超500亿人民币完成首轮融资，投后估值预计在3500亿至4000亿人民币。

这三件事放在一起，是中国AI产业的三种路径：应用化（豆包+微信）、全栈化（OpenAI路线）、开源化（DeepSeek）。

而DeepSeek的500亿融资，有一个细节值得注意：创始人梁文锋个人承诺出资约200亿元，占融资总额近40%。

这个罕见的操作，目的只有一个：确保对公司的绝对控制权，避免资本干预技术路线。

在全球AI军备竞赛的白热化阶段，这句话的份量比任何时候都重。

我们正站在一个节点的前面

英伟达的论文最后有一句话，没有出现在摘要里，但在正文倒数第二段：

"当那一天到来，ASI绝不会敲门预告。它只会默默造出那个唯一有资格评判它的裁判，然后，从容地走入考场。"

Jack Clark的60%概率，也是同一个意思——不是说明年一定会发生，而是在说这个时间窗口已经打开了，而且它不会提前通知你。

过去一周的每一件事，单独拿出来都是一个热点。但把它们按顺序排好，看到的是一个结构的成形：

AI递归自我改进，从论文里的一个思想实验，变成了Anthropic生产环境里80%的代码提交，变成了英伟达沙盒里真实跑起来的自我进化算法，变成了Jack Clark嘴里60%概率的2028年预测。

这个结构成形的速度，比大多数人意识到的要快。

今天聊到这里。

红皇后哥德尔机论文已经在Arxiv可以下载，编号2606.26294，37页，建议看第三章和第五章，那是整篇论文最硬核也最让人不安的部分。

Anthropic的《When AI Builds Itself》报告在他们的官网可以读到完整版，80%代码和52倍加速的数据都在里面，有链接我在评论区放。

你觉得2028年ASI降临的60%概率，是高了还是低了？

造Vision Pro的人走了，去给OpenAI造硬件了Paul Meade在苹果待了七年。

我看了GPT-5.6的发布直播，然后笑出了声

GPT-5.6被政府按下限发键，三星砸6475亿造芯片——AI不再属于公司，属于国家

OpenAI9个月造芯，谷歌8年失血——AI的战场，已不是模型

豆包收费那天，微信给14亿人装了一双AI的眼睛——AI战争的终局，不是模型，是入口

马斯克说2027年，唐杰说用不了那么久——AI最大的赌注，不是模型，是时间