一个AI安全研究项目,交给AI自己做:它花了约800小时、约1.8万美元算力,恢复了97%的性能缺口;同样的活,两名人类研究员埋头干了整整一周,只恢复了23%。
这组对比,来自Anthropic刚公开的一份内部报告,名字起得很有画面感——《When AI Builds Itself》,当AI开始造自己。除了这场实验,报告开篇还甩出三个数字:截至2026年5月,Anthropic代码库里超过80%的代码由Claude自己写;2026年第二季度,工程师人均日产代码量是2024年的8倍;Claude能连续自主工作16个小时以上。
结论更刺激:照这个趋势走下去,AI自己设计、自己造出下一代AI,完全可能发生。基于这个判断,Anthropic甚至呼吁全球放缓前沿AI研发。
社交媒体当场就炸了。"AI要自己造自己了""递归自我改进,奇点要来了"——熟悉的配方,熟悉的味道。如果你在AI圈待过两年以上,一定认得这个节奏:每隔几个月,就有一家头部公司抛出一句"时代要变了",大家集体焦虑一轮,然后日子照过。
巧的是,前脚OpenAI刚说"AI显现出递归自我改进的早期迹象",后脚Anthropic就发了"AI正在造下一个自己"。连营销话术都开始你追我赶了。
我把这份报告拆开看了一遍。它哪些是实话、哪些是被舆论放大的焦虑,下面一条条说清楚。

数据这一头,比叙事硬得多
递归自我改进(Recursive Self-Improvement,简称RSI),是AI圈讨论了快二十年的老话题。逻辑很简单:AI能改进自己,改进后的版本再去改进下一代,不需要人插手,形成一个自我加速的飞轮。这是奇点理论的触发条件。
关键在于,RSI不是一个开关,而是一段台阶。学界这些年的研究,大致把它分成六个阶段,从"AI给人打下手"一路爬到"AI完全自主迭代"。Anthropic自己也画了一张时间轴,分成五段,并且把自己标在了第四阶段——离终点只剩一步。
按照业界那把六阶段的尺子重新量一下,Anthropic的真实位置,大概在第3到第4阶段之间。听起来是打了点折扣,但这个位置,已经相当扎实。
支撑它的不是PPT,是两个公开披露的内部实验。
第一个,就是开头那场实验,关于"会不会做研究"。Claude Agent全程自主完成了那个AI安全研究项目,从提假设、跑实验到分析结果,全自动。它用800小时恢复97%、人类一周只恢复23%的背后,是一个真实在转的半自动研究闭环——说它站稳了第3阶段,不为过。
第二个,关于"会不会自我提速"。Anthropic让Claude拿到一段训练小模型的代码,自己运行、计时、改写、再运行。最后它把速度提升了52倍——而一名熟练的人类研究员做同一件事,只能做到4倍。改工具链、跑基准、选更优版本,这条路径已经非常接近"自改进Agent"的逻辑。
52倍对4倍,97%对23%。这两组对比不是噱头,是已经发生的事实。所以那句"AI在大规模参与AI的研发",不是暴论,是实话。
真正卡住RSI的,不是技术,是品味
报告里藏着一个词,叫research taste,研究品味——也就是判断"什么问题值得做"的能力。Anthropic用了一个特别贴切的比喻:
初级员工接到的任务是"这个按钮坏了,去修一下";有经验的员工接到的是"网络有时候会卡,查查为什么";而最资深的人,脑子里想的是"我们下个季度到底该做什么"。
第一层,Claude已经很强;第二层,它在飞快追赶;但第三层——什么问题值得做、哪些结果可信、什么时候该果断放弃——这种品味,人类还握着明显的比较优势。只要这道环节还由人主导,AI就没真正成为自改进Agent,离完整RSI更是隔着一层。
报告里有个数字专门量这件事:在"判断研究下一步该往哪走"上,Claude的新预览版已经能在64%的情况下,被另一个Claude裁判判为提出了更好的下一步;而五个月前,这个数字还是51%。
趋势是真的在往上走。但请注意两点:一是64%离"完全自主判断"还远;二是这个数据,是在问题边界很清楚的实验环境里测出来的。真实世界里全是模糊、矛盾、没有标准答案的问题,AI能判断到什么程度,目前并无定论。
换句话说:AI已经是一个极其能干的"执行者"和"提速器",但还不是那个能拍板"做什么"的人。飞轮的轴心,仍然攥在人手里。
至于未来,连Anthropic自己都不敢把话说满
这份报告没有给一个斩钉截铁的结局,而是摊开列了三种可能——这反倒是它最值得信的地方。
第一种,趋势停在S曲线上。Transformer架构撞墙、算力和能源跟不上、地缘政治切断全球协作,指数曲线弯成S形,慢慢趋平。Anthropic认为这是三种里最不可能的一种。但他们也承认,哪怕真停在这里,今天的能力也已经足够让一家百人公司,去逼近过去千人公司才能干的活——社会结构的震荡不会因为AI停步而消失,它只是换个形态继续。
第二种,飞轮转起来,但人还在掌舵。AI负责执行、生成选项,人负责判断、做最终决策。听着挺理想,但报告点了一个隐藏的麻烦:Amdahl定律。你加速一个环节,瓶颈就会转移到下一个。代码写快了,code review堵车;实验跑快了,结果分析跟不上;分析快了,决策又拖后腿。Anthropic说他们内部正在经历这个过程,每一波提效之后,新的堵点立刻浮出来。这意味着,人掌舵会越来越累、要求越来越高——你得在更快的节奏里,做出更好的判断。Anthropic认为,这是近期最可能发生的情景,而且他们已经在这条路上了。
第三种,才是那个让人脊背发凉的版本:完整RSI,人退到验证角色。AI自主构建后继模型,进度只由算力决定,人从主导者变成监督者。好处是可能极快实现医疗突破、科学加速;坏处是,今天训练里哪怕一个微小的目标偏差,在自我迭代的循环里都可能以指数速度被放大,直到人彻底失去干预能力。这是最不确定,也最不可逆的一种。
讲完三种结局,报告末尾Anthropic开始呼吁:希望建立某种全球协调机制,在风险上升时能有序放缓、甚至暂停前沿AI开发。
翻译一下这段话:势头太猛,我们很担心,觉得该有人出面让大家一起停下——但我们不会单方面停。
把数字当真,把叙事打折
回到开头那个问题——这篇暴论,到底有多真。
数据是真的:80%的代码、52倍的提速、800小时干赢人类一周,这些都不是吹出来的,AI确实在深度参与AI的研发。
但"AI马上就要自己造自己、奇点近在眼前"这层叙事,是被舆论加了倍的。真实进度卡在"研究品味"这道坎上,而这道坎,恰恰是人类目前最难被替代的部分。
至于那句"呼吁全球放缓",值得多想一层。这套叙事Anthropic不是第一次用了:一边制造焦虑,一边把自己摆在"威胁发现者"和"最有能力应对威胁的人"这个位置上。担忧可能是真的,但它同时也是一门生意——你越相信AI危险得需要全球踩刹车,就越相信只有最前沿的那几家公司,才有资格握住方向盘。
所以真正值得你关注的,不是"奇点哪天到",而是那个正在悄悄逼近的现实——当AI把执行环节压到极致快,人类唯一不能丢的,是判断力。会不会问对问题、信不信得过结果、敢不敢及时放弃,这些"研究品味",在AI时代非但不会贬值,反而会成为越来越稀缺的硬通货。
这一点,对工程师如此,对你我做的每一份工作,恐怕都一样。
如果这篇帮你把这场喧嚣看清楚了一点,欢迎点个"在看",也分享给那个一看到"奇点"二字就焦虑的朋友。
当执行被无限加速,你手里那份"判断力",还够不够用?评论区聊聊。

夜雨聆风