AI 的下一场竞赛:让模型学会改进模型
最近几天,Financial Times 的一篇 Big Read《Close to the Terminator narrative: the dawn of self-improving AI》火了。
这篇文章真正抓人的地方,不是“AI 又变强了”。
而是一个更让人不安的问题:
如果 AI 开始参与制造下一代 AI,模型竞赛会变成什么样?
过去,AI 行业最熟悉的叙事是模型能力竞赛。
参数更大,推理更强,多模态更完整,agent 更能干。
但现在,前沿实验室和创业公司正在追另一条线:recursive self-improvement(递归式自我改进)。
这个词听起来很科幻,甚至很容易让人联想到“机器失控”。但现实里的变化没那么戏剧化,也更值得警惕。
它不是某个模型突然醒来,宣布“我要改造自己”。
它更可能先发生在模型公司的研发流水线上:AI 帮研究员写代码、跑实验、生成评测样本、分析训练日志、寻找漏洞,再慢慢进入下一代模型的设计和验证。
这才是重点。
真正的变化不是 AI 会不会聊天,而是 AI 会不会开始参与生产更强的 AI。
自我改进,不是 AI 帮 AI 写点代码
现在很多系统已经有一点“自我改进”的影子。
一个模型生成测试用例,另一个模型修 bug。
一个 agent 写实验脚本,另一个 agent 审查结果。
一个系统自动生成训练数据,再让新模型在这些数据上微调。
这些都很重要,但还不是严格意义上的 recursive self-improvement。
更严谨的自我改进,至少要走完四步:
发现自己的能力短板。
提出有研究价值的改进方案。
调动代码、数据、训练、评测和部署流程,把方案做出来。
再验证新版本是不是真的更好,并把结果反馈到下一轮迭代。
今天最成熟的是中间那层:执行。
写代码、跑实验、生成数据、分析日志,AI 已经越来越能做。
真正还很难的是前后两端:方向判断和结果验证。
什么研究问题值得做?哪些 benchmark 会骗人?哪些提升只是过拟合?哪些安全约束不能被牺牲?
这些问题不是“多写几行代码”就能解决的。
所以,今天更准确的判断不是“AI 已经能完全改造自己”,而是:
AI 正在吞下 AI R&D 工作流里的越来越多环节。
这句话没有科幻片那么刺激,但更接近正在发生的产业变化。
为什么模型公司一定会追这件事
因为前沿模型公司的真正瓶颈,已经不只是模型能力。
还有研发吞吐量。
一个大模型从想法到训练、评测、上线,需要研究员、工程师、数据管线、算力调度、红队、安全评估和产品团队一起运转。
越往前沿走,单次实验越贵。
错误路线越昂贵。
安全审查也越复杂。
任何能提高研发速度的工具,都会变成战略优势。
如果 AI 能把研究周期缩短,把工程周期缩短,把评测周期也缩短,模型公司就会得到一个新的飞轮:
更强的模型,帮助做出更强的研发工具。
更强的研发工具,再帮助训练更强的模型。
这也是为什么 Recursive Superintelligence 这样的公司能拿到高额融资。
它卖的不是一个聊天机器人,而是一个更大的故事:
让 AI 参与科学发现,参与模型研发,参与下一代系统的生成。
这个故事对投资人很有吸引力。
但它也带来一个更麻烦的问题:如果模型改进越来越依赖公司内部的研发闭环,外部世界能看见的东西可能会越来越少。
真正危险的,也许不是失控,而是看不见
关于自我改进 AI,公共讨论很容易滑向两个极端。
一边说超级智能马上来了。
另一边说这全是创业公司融资话术。
我觉得更值得盯住的,是中间那条不太戏剧化的路:
系统能力逐步增强,但观测、评估和治理能力跟不上。
METR 的 Frontier Risk Report(前沿风险报告)给了一个冷静视角。它和 Anthropic、Google、Meta、OpenAI 等前沿开发者合作,评估内部使用 AI agent 带来的风险。
报告没有说“AI 已经能接管研发”。
相反,它强调现实差距:agent 在开放任务中仍会犯判断错误,也没有证据显示公司已经让 AI agent 自主设定研究议程、做最终招聘决策、分配预算,或独立承担复杂科学判断。
但这并不意味着可以放心。
报告也说明,AI 已经能做复杂 PR、寻找漏洞、优化部分性能指标、分析数据和辅助评测。
问题在于,越多研发环节被 AI 接管,人类越需要知道它到底做了什么、为什么这么做、有没有绕过监控、有没有把 benchmark 当成目标本身。
风险不一定像一个开关,按下就爆发。
它更像一条缓慢上升的曲线。
等你发现系统已经太复杂、太快、太依赖内部工具链时,外部评估可能已经追不上了。
监管也会被迫前移
传统 AI 监管更关注模型发布:
上线前有没有做安全测试?
有没有危险能力?
有没有防止滥用?
但自我改进 AI 把问题往前推了一步。
真正需要盯住的时刻,可能不是某个模型公开发布,而是在公司内部,一个模型开始明显加速下一个模型的设计和训练。
这就需要新的问题清单。
外部评估者不能只看公开 benchmark,还要知道 AI 在内部研发流程里承担了哪些角色。
它写了多少代码?
提出了多少实验?
是否参与训练决策?
是否影响安全评估?
如果一个实验室突然发现模型研发速度明显提升,或者模型能在较少人类输入下完成核心研究任务,公司、董事会、政府和其他实验室要怎么沟通?谁决定暂停?谁能看见证据?
这不是普通产品发布能回答的问题。
它更像一次治理压力测试。
别急着宣布 RSI 已经到来
当然,把 RSI 当成已经发生的现实,仍然太早。
没有公开证据证明任何前沿实验室已经实现完整闭环的自我改进。
AI agent 的真实世界可靠性仍不稳定。
benchmark 成绩也可能高估真实代码审查和长期任务表现。
一个会写代码的系统,离一个能判断研究方向、承担模糊目标、平衡安全和效率的系统,还有距离。
资本市场也会放大概念。
创业公司需要把“自动化 AI 研发”讲成足够大的故事,前沿公司也有动机强调自己正在接近下一阶段能力。
这不意味着它们说的一切都是泡沫。
但任何关于“两年内自我改进”的预测,都应该和实际证据分开看。
现在更稳妥的判断是:
行业正在沿着通往 RSI 的方向,自动化多个关键环节;但完整递归闭环还没有被公开证明。
真正该提前建立的,是测量和治理能力。
否则等它接近时,我们可能只能听公司自己解释它到底做到了哪一步。
最后的问题
2023 年,AI 行业比的是谁的模型更强。
2024 年到 2025 年,比的是 agent 和多模态如何落地。
2026 年正在浮现的,是 AI 研发自动化竞赛。
这场竞赛的短期结果会很务实:模型公司研发效率更高,代码和评测自动化更深,安全红队更依赖 AI,创业公司围绕自动化实验和自动化科学发现融资。
长期结果则更难预测。
因为一旦 AI 真能参与建造更强的后继系统,产业、监管和社会都要重新定义“可控进步”的含义。
真正的分水岭也许不会以戏剧化方式出现。
不会有某个模型站出来宣布“我会自我改进”。
更可能发生的是,某一天,前沿实验室发现:
下一代模型的关键改进,已经主要来自上一代模型帮助设计的研究流程。
到那时,AI 行业竞争的核心问题会变得更尖锐。
不是谁先造出最强的模型。
而是谁能在模型越来越会改进自己的时候,仍然让人类看得见、测得准、停得下。
参考来源
Financial Times - Close to the Terminator narrative: the dawn of self-improving AIhttps://www.ft.com/content/7cc7800f-18ed-47d8-9539-221ae3e16182[1]
TechCrunch - What happens when AI starts building itself?https://techcrunch.com/2026/05/14/what-happens-when-ai-starts-building-itself/[2]
TechCrunch - RSI is the new AGI, and it is just as hard to pin downhttps://techcrunch.com/2026/05/28/rsi-is-the-new-agi-and-its-just-as-hard-to-pin-down/[3]
Anthropic - Focus areas for The Anthropic Institutehttps://www.anthropic.com/research/anthropic-institute-agenda[4]
METR - Frontier Risk Report: February to March 2026https://metr.org/blog/2026-05-19-frontier-risk-report/[5]
引用链接
[1]https://www.ft.com/content/7cc7800f-18ed-47d8-9539-221ae3e16182
[2]https://techcrunch.com/2026/05/14/what-happens-when-ai-starts-building-itself/
[3]https://techcrunch.com/2026/05/28/rsi-is-the-new-agi-and-its-just-as-hard-to-pin-down/
[4]https://www.anthropic.com/research/anthropic-institute-agenda
[5]https://metr.org/blog/2026-05-19-frontier-risk-report/
夜雨聆风