AI 的下一场竞赛:让模型学会改进模型

AI 的下一场竞赛：让模型学会改进模型

最近几天，Financial Times 的一篇 Big Read《Close to the Terminator narrative: the dawn of self-improving AI》火了。

这篇文章真正抓人的地方，不是“AI 又变强了”。

而是一个更让人不安的问题：

如果 AI 开始参与制造下一代 AI，模型竞赛会变成什么样？

过去，AI 行业最熟悉的叙事是模型能力竞赛。

参数更大，推理更强，多模态更完整，agent 更能干。

但现在，前沿实验室和创业公司正在追另一条线：recursive self-improvement（递归式自我改进）。

这个词听起来很科幻，甚至很容易让人联想到“机器失控”。但现实里的变化没那么戏剧化，也更值得警惕。

它不是某个模型突然醒来，宣布“我要改造自己”。

它更可能先发生在模型公司的研发流水线上：AI 帮研究员写代码、跑实验、生成评测样本、分析训练日志、寻找漏洞，再慢慢进入下一代模型的设计和验证。

这才是重点。

真正的变化不是 AI 会不会聊天，而是 AI 会不会开始参与生产更强的 AI。

自我改进，不是 AI 帮 AI 写点代码

现在很多系统已经有一点“自我改进”的影子。

一个模型生成测试用例，另一个模型修 bug。

一个 agent 写实验脚本，另一个 agent 审查结果。

一个系统自动生成训练数据，再让新模型在这些数据上微调。

这些都很重要，但还不是严格意义上的 recursive self-improvement。

更严谨的自我改进，至少要走完四步：

发现自己的能力短板。

提出有研究价值的改进方案。

调动代码、数据、训练、评测和部署流程，把方案做出来。

再验证新版本是不是真的更好，并把结果反馈到下一轮迭代。

今天最成熟的是中间那层：执行。

写代码、跑实验、生成数据、分析日志，AI 已经越来越能做。

真正还很难的是前后两端：方向判断和结果验证。

什么研究问题值得做？哪些 benchmark 会骗人？哪些提升只是过拟合？哪些安全约束不能被牺牲？

这些问题不是“多写几行代码”就能解决的。

所以，今天更准确的判断不是“AI 已经能完全改造自己”，而是：

AI 正在吞下 AI R&D 工作流里的越来越多环节。

这句话没有科幻片那么刺激，但更接近正在发生的产业变化。

为什么模型公司一定会追这件事

因为前沿模型公司的真正瓶颈，已经不只是模型能力。

还有研发吞吐量。

一个大模型从想法到训练、评测、上线，需要研究员、工程师、数据管线、算力调度、红队、安全评估和产品团队一起运转。

越往前沿走，单次实验越贵。

错误路线越昂贵。

安全审查也越复杂。

任何能提高研发速度的工具，都会变成战略优势。

如果 AI 能把研究周期缩短，把工程周期缩短，把评测周期也缩短，模型公司就会得到一个新的飞轮：

更强的模型，帮助做出更强的研发工具。

更强的研发工具，再帮助训练更强的模型。

这也是为什么 Recursive Superintelligence 这样的公司能拿到高额融资。

它卖的不是一个聊天机器人，而是一个更大的故事：

让 AI 参与科学发现，参与模型研发，参与下一代系统的生成。

这个故事对投资人很有吸引力。

但它也带来一个更麻烦的问题：如果模型改进越来越依赖公司内部的研发闭环，外部世界能看见的东西可能会越来越少。

真正危险的，也许不是失控，而是看不见

关于自我改进 AI，公共讨论很容易滑向两个极端。

一边说超级智能马上来了。

另一边说这全是创业公司融资话术。

我觉得更值得盯住的，是中间那条不太戏剧化的路：

系统能力逐步增强，但观测、评估和治理能力跟不上。

METR 的 Frontier Risk Report（前沿风险报告）给了一个冷静视角。它和 Anthropic、Google、Meta、OpenAI 等前沿开发者合作，评估内部使用 AI agent 带来的风险。

报告没有说“AI 已经能接管研发”。

相反，它强调现实差距：agent 在开放任务中仍会犯判断错误，也没有证据显示公司已经让 AI agent 自主设定研究议程、做最终招聘决策、分配预算，或独立承担复杂科学判断。

但这并不意味着可以放心。

报告也说明，AI 已经能做复杂 PR、寻找漏洞、优化部分性能指标、分析数据和辅助评测。

问题在于，越多研发环节被 AI 接管，人类越需要知道它到底做了什么、为什么这么做、有没有绕过监控、有没有把 benchmark 当成目标本身。

风险不一定像一个开关，按下就爆发。

它更像一条缓慢上升的曲线。

等你发现系统已经太复杂、太快、太依赖内部工具链时，外部评估可能已经追不上了。

监管也会被迫前移

传统 AI 监管更关注模型发布：

上线前有没有做安全测试？

有没有危险能力？

有没有防止滥用？

但自我改进 AI 把问题往前推了一步。

真正需要盯住的时刻，可能不是某个模型公开发布，而是在公司内部，一个模型开始明显加速下一个模型的设计和训练。

这就需要新的问题清单。

外部评估者不能只看公开 benchmark，还要知道 AI 在内部研发流程里承担了哪些角色。

它写了多少代码？

提出了多少实验？

是否参与训练决策？

是否影响安全评估？

如果一个实验室突然发现模型研发速度明显提升，或者模型能在较少人类输入下完成核心研究任务，公司、董事会、政府和其他实验室要怎么沟通？谁决定暂停？谁能看见证据？

这不是普通产品发布能回答的问题。

它更像一次治理压力测试。

别急着宣布 RSI 已经到来

当然，把 RSI 当成已经发生的现实，仍然太早。

没有公开证据证明任何前沿实验室已经实现完整闭环的自我改进。

AI agent 的真实世界可靠性仍不稳定。

benchmark 成绩也可能高估真实代码审查和长期任务表现。

一个会写代码的系统，离一个能判断研究方向、承担模糊目标、平衡安全和效率的系统，还有距离。

资本市场也会放大概念。

创业公司需要把“自动化 AI 研发”讲成足够大的故事，前沿公司也有动机强调自己正在接近下一阶段能力。

这不意味着它们说的一切都是泡沫。

但任何关于“两年内自我改进”的预测，都应该和实际证据分开看。

现在更稳妥的判断是：

行业正在沿着通往 RSI 的方向，自动化多个关键环节；但完整递归闭环还没有被公开证明。

真正该提前建立的，是测量和治理能力。

否则等它接近时，我们可能只能听公司自己解释它到底做到了哪一步。

最后的问题

2023 年，AI 行业比的是谁的模型更强。

2024 年到 2025 年，比的是 agent 和多模态如何落地。

2026 年正在浮现的，是 AI 研发自动化竞赛。

这场竞赛的短期结果会很务实：模型公司研发效率更高，代码和评测自动化更深，安全红队更依赖 AI，创业公司围绕自动化实验和自动化科学发现融资。

长期结果则更难预测。

因为一旦 AI 真能参与建造更强的后继系统，产业、监管和社会都要重新定义“可控进步”的含义。

真正的分水岭也许不会以戏剧化方式出现。

不会有某个模型站出来宣布“我会自我改进”。

更可能发生的是，某一天，前沿实验室发现：

下一代模型的关键改进，已经主要来自上一代模型帮助设计的研究流程。

到那时，AI 行业竞争的核心问题会变得更尖锐。

不是谁先造出最强的模型。

而是谁能在模型越来越会改进自己的时候，仍然让人类看得见、测得准、停得下。

参考来源

Financial Times - Close to the Terminator narrative: the dawn of self-improving AIhttps://www.ft.com/content/7cc7800f-18ed-47d8-9539-221ae3e16182^[1]
TechCrunch - What happens when AI starts building itself?https://techcrunch.com/2026/05/14/what-happens-when-ai-starts-building-itself/^[2]
TechCrunch - RSI is the new AGI, and it is just as hard to pin downhttps://techcrunch.com/2026/05/28/rsi-is-the-new-agi-and-its-just-as-hard-to-pin-down/^[3]
Anthropic - Focus areas for The Anthropic Institutehttps://www.anthropic.com/research/anthropic-institute-agenda^[4]
METR - Frontier Risk Report: February to March 2026https://metr.org/blog/2026-05-19-frontier-risk-report/^[5]

引用链接

[1]https://www.ft.com/content/7cc7800f-18ed-47d8-9539-221ae3e16182

[2]https://techcrunch.com/2026/05/14/what-happens-when-ai-starts-building-itself/

[3]https://techcrunch.com/2026/05/28/rsi-is-the-new-agi-and-its-just-as-hard-to-pin-down/

[4]https://www.anthropic.com/research/anthropic-institute-agenda

[5]https://metr.org/blog/2026-05-19-frontier-risk-report/