AI要自己造AI了?Anthropic又在传播焦虑了

一个AI安全研究项目，交给AI自己做：它花了约800小时、约1.8万美元算力，恢复了97%的性能缺口；同样的活，两名人类研究员埋头干了整整一周，只恢复了23%。

这组对比，来自Anthropic刚公开的一份内部报告，名字起得很有画面感——《When AI Builds Itself》，当AI开始造自己。除了这场实验，报告开篇还甩出三个数字：截至2026年5月，Anthropic代码库里超过80%的代码由Claude自己写；2026年第二季度，工程师人均日产代码量是2024年的8倍；Claude能连续自主工作16个小时以上。

结论更刺激：照这个趋势走下去，AI自己设计、自己造出下一代AI，完全可能发生。基于这个判断，Anthropic甚至呼吁全球放缓前沿AI研发。

社交媒体当场就炸了。"AI要自己造自己了""递归自我改进，奇点要来了"——熟悉的配方，熟悉的味道。如果你在AI圈待过两年以上，一定认得这个节奏：每隔几个月，就有一家头部公司抛出一句"时代要变了"，大家集体焦虑一轮，然后日子照过。

巧的是，前脚OpenAI刚说"AI显现出递归自我改进的早期迹象"，后脚Anthropic就发了"AI正在造下一个自己"。连营销话术都开始你追我赶了。

我把这份报告拆开看了一遍。它哪些是实话、哪些是被舆论放大的焦虑，下面一条条说清楚。

数据这一头，比叙事硬得多

递归自我改进（Recursive Self-Improvement，简称RSI），是AI圈讨论了快二十年的老话题。逻辑很简单：AI能改进自己，改进后的版本再去改进下一代，不需要人插手，形成一个自我加速的飞轮。这是奇点理论的触发条件。

关键在于，RSI不是一个开关，而是一段台阶。学界这些年的研究，大致把它分成六个阶段，从"AI给人打下手"一路爬到"AI完全自主迭代"。Anthropic自己也画了一张时间轴，分成五段，并且把自己标在了第四阶段——离终点只剩一步。

按照业界那把六阶段的尺子重新量一下，Anthropic的真实位置，大概在第3到第4阶段之间。听起来是打了点折扣，但这个位置，已经相当扎实。

支撑它的不是PPT，是两个公开披露的内部实验。

第一个，就是开头那场实验，关于"会不会做研究"。Claude Agent全程自主完成了那个AI安全研究项目，从提假设、跑实验到分析结果，全自动。它用800小时恢复97%、人类一周只恢复23%的背后，是一个真实在转的半自动研究闭环——说它站稳了第3阶段，不为过。

第二个，关于"会不会自我提速"。Anthropic让Claude拿到一段训练小模型的代码，自己运行、计时、改写、再运行。最后它把速度提升了52倍——而一名熟练的人类研究员做同一件事，只能做到4倍。改工具链、跑基准、选更优版本，这条路径已经非常接近"自改进Agent"的逻辑。

52倍对4倍，97%对23%。这两组对比不是噱头，是已经发生的事实。所以那句"AI在大规模参与AI的研发"，不是暴论，是实话。

真正卡住RSI的，不是技术，是品味

报告里藏着一个词，叫research taste，研究品味——也就是判断"什么问题值得做"的能力。Anthropic用了一个特别贴切的比喻：

初级员工接到的任务是"这个按钮坏了，去修一下"；有经验的员工接到的是"网络有时候会卡，查查为什么"；而最资深的人，脑子里想的是"我们下个季度到底该做什么"。

第一层，Claude已经很强；第二层，它在飞快追赶；但第三层——什么问题值得做、哪些结果可信、什么时候该果断放弃——这种品味，人类还握着明显的比较优势。只要这道环节还由人主导，AI就没真正成为自改进Agent，离完整RSI更是隔着一层。

报告里有个数字专门量这件事：在"判断研究下一步该往哪走"上，Claude的新预览版已经能在64%的情况下，被另一个Claude裁判判为提出了更好的下一步；而五个月前，这个数字还是51%。

趋势是真的在往上走。但请注意两点：一是64%离"完全自主判断"还远；二是这个数据，是在问题边界很清楚的实验环境里测出来的。真实世界里全是模糊、矛盾、没有标准答案的问题，AI能判断到什么程度，目前并无定论。

换句话说：AI已经是一个极其能干的"执行者"和"提速器"，但还不是那个能拍板"做什么"的人。飞轮的轴心，仍然攥在人手里。

至于未来，连Anthropic自己都不敢把话说满

这份报告没有给一个斩钉截铁的结局，而是摊开列了三种可能——这反倒是它最值得信的地方。

第一种，趋势停在S曲线上。Transformer架构撞墙、算力和能源跟不上、地缘政治切断全球协作，指数曲线弯成S形，慢慢趋平。Anthropic认为这是三种里最不可能的一种。但他们也承认，哪怕真停在这里，今天的能力也已经足够让一家百人公司，去逼近过去千人公司才能干的活——社会结构的震荡不会因为AI停步而消失，它只是换个形态继续。

第二种，飞轮转起来，但人还在掌舵。AI负责执行、生成选项，人负责判断、做最终决策。听着挺理想，但报告点了一个隐藏的麻烦：Amdahl定律。你加速一个环节，瓶颈就会转移到下一个。代码写快了，code review堵车；实验跑快了，结果分析跟不上；分析快了，决策又拖后腿。Anthropic说他们内部正在经历这个过程，每一波提效之后，新的堵点立刻浮出来。这意味着，人掌舵会越来越累、要求越来越高——你得在更快的节奏里，做出更好的判断。Anthropic认为，这是近期最可能发生的情景，而且他们已经在这条路上了。

第三种，才是那个让人脊背发凉的版本：完整RSI，人退到验证角色。AI自主构建后继模型，进度只由算力决定，人从主导者变成监督者。好处是可能极快实现医疗突破、科学加速；坏处是，今天训练里哪怕一个微小的目标偏差，在自我迭代的循环里都可能以指数速度被放大，直到人彻底失去干预能力。这是最不确定，也最不可逆的一种。

讲完三种结局，报告末尾Anthropic开始呼吁：希望建立某种全球协调机制，在风险上升时能有序放缓、甚至暂停前沿AI开发。

翻译一下这段话：势头太猛，我们很担心，觉得该有人出面让大家一起停下——但我们不会单方面停。

把数字当真，把叙事打折

回到开头那个问题——这篇暴论，到底有多真。

数据是真的：80%的代码、52倍的提速、800小时干赢人类一周，这些都不是吹出来的，AI确实在深度参与AI的研发。

但"AI马上就要自己造自己、奇点近在眼前"这层叙事，是被舆论加了倍的。真实进度卡在"研究品味"这道坎上，而这道坎，恰恰是人类目前最难被替代的部分。

至于那句"呼吁全球放缓"，值得多想一层。这套叙事Anthropic不是第一次用了：一边制造焦虑，一边把自己摆在"威胁发现者"和"最有能力应对威胁的人"这个位置上。担忧可能是真的，但它同时也是一门生意——你越相信AI危险得需要全球踩刹车，就越相信只有最前沿的那几家公司，才有资格握住方向盘。

所以真正值得你关注的，不是"奇点哪天到"，而是那个正在悄悄逼近的现实——当AI把执行环节压到极致快，人类唯一不能丢的，是判断力。会不会问对问题、信不信得过结果、敢不敢及时放弃，这些"研究品味"，在AI时代非但不会贬值，反而会成为越来越稀缺的硬通货。

这一点，对工程师如此，对你我做的每一份工作，恐怕都一样。

如果这篇帮你把这场喧嚣看清楚了一点，欢迎点个"在看"，也分享给那个一看到"奇点"二字就焦虑的朋友。

当执行被无限加速，你手里那份"判断力"，还够不够用？评论区聊聊。