AI 已经在写自己 80% 的代码:读懂 Anthropic 的递归自我改进报告

如果你点开 Anthropic 这篇报告，第一眼看到的，会先撞上一片缓缓生长的雪花，数据反倒退到后面。

一朵小雪花，长出更小的雪花；更小的雪花，又拼成一朵更大的。它不停地往里套、往外长，像一个永不收敛的循环。这是设计团队为这篇文章配的开篇动画，文章的名字叫《When AI builds itself》——当 AI 开始建造自己。

有些数学功底的人会知道，这是 fractal(分形)。分形最核心的特征叫 self-similarity，自相似：整体的结构在每一个局部尺度上重复出现。而分形的生成机制，本质上就是递归——一条规则，不断作用在它自己的输出上。

用雪花来对应这篇报告的主题，选得极准。因为它讲的核心概念，叫 recursive self-improvement，递归自我改进。说白了就是：AI 写出更强的 AI，更强的 AI 再写出更强的 AI，一轮接一轮。雪花长出雪花，正好是这个过程的视觉化。

但这篇报告真正值得一读的地方，既不只在那片漂亮的雪花，也不只在它甩出的一连串吓人数据。更关键的地方在于：它一边用数据证明“AI 已经在加速 AI 自己”，一边又非常克制地、几乎是逐条地，告诉你这件事会卡在哪里。它说了很多，但它没敢说满。

这篇文章，我们就来把它读一遍——既读它说出口的，也读它留在字缝里的。

分形雪花与递归自我改进

一、它说了什么：AI 已经在加速 AI 自己

先把报告的核心论点摆清楚。

这篇文章由 Anthropic Institute 发布，两位主笔是 Marina Favaro 和 Jack Clark。它的一句话总结是：AI 正在越来越多地接手 AI 开发本身的工作，而这件事，正在加速整个 AI 的进步速度。

Anthropic 很谨慎地划了条线。报告原话是：把这个趋势推到极致、再给足够的算力，指向的是一个能完全自主设计并开发自己后继者的系统；但“我们还没到那一步，递归自我改进也并非必然会发生的”。它强调的重心放在另一处：眼下仍未完全发生，但它可能比大多数机构准备好的时间来得更早。

这种克制反而让接下来的数据更有分量。

先看外部的、公开可查的 benchmark。一家叫 METR 的机构长期跟踪一个指标：AI 能可靠独立完成的任务有多长。报告引用的数字是，这个时长大约每 4 个月翻一倍，而此前的趋势是每 7 个月。具体到模型：2024 年 3 月，Claude Opus 3 能搞定的软件任务大概需要人花 4 分钟；一年后的 Sonnet 3.7，能做约 1.5 小时的任务；再一年，Opus 4.6 能做 12 小时的任务。如果这条线继续，今年之内，需要人花好几天的任务就会进入射程。

再看两个研究类 benchmark。SWE-bench 是个很硬的测试——它直接扔给模型一个真实开源项目和一个真实的 bug 报告，要求写出能通过项目自身测试的修复代码。报告说，模型在这上面的得分两年内从个位数一路冲到接近满分。另一个叫 CORE-Bench，测的是模型能不能复现已发表论文的结果(这是它能做原创研究的前提)，从 2024 年约 20% 的成功率，15 个月后也饱和了。

但公开 benchmark 仍然说不清一件最关键的事：AI 到底在多大程度上，加速了 AI 公司自己的开发。这个，只能看内部数据。于是报告掏出了几个之前没公开过的数字。

最扎眼的一个：截至 2026 年 5 月，Anthropic 合并进自己代码库的代码里，超过 80% 是 Claude 写的。而在 Claude Code 于 2025 年 2 月发布研究预览版之前，这个比例还停留在个位数。对应到人均产出：2026 年第二季度，一个典型工程师每天合并的代码量，是 2024 年的 8 倍——并非因为他打字更快了，更准确地说是因为大部分代码由 Claude 写，人转去做 directing 和 reviewing。

报告里还有一个更具体的例子。2026 年 4 月，Claude 提交了 800 多个修复，把某一类 API 错误的发生率降低了一千倍。负责盯着它干这件事的工程师估计，同样的工作量，换一个人来做要花四年——因为给别人擦屁股、修别人的 bug 又慢又痛苦，人很难在脑子里同时装下那么多陌生的上下文。

值得敬佩的是，报告自己很诚实地补了句注解：代码行数是个粗糙的指标，它只数量不看质量，所以”8 倍”几乎肯定高估了真实的生产力提升。但即便打个折，趋势是明确的。

几条加速曲线正在同时上扬

二、瓶颈在迁移：人正被赶往上游

如果报告只是堆数据，它顶多算一篇漂亮的产品宣传。真正让它值得反复读的，是它对”人类角色”的拆解。

报告把”AI 开发 AI”拆成了一条链：写代码，审查代码，选择做什么实验、做什么问题。然后它指出一个很冷静、也很冷的规律——每当 AI 把这条链上某一环的成本压到接近零，瓶颈就会往上游移动一格，移到那个还没被自动化的环节上。

它的原话很精炼：执行这件事本身——写代码、跑实验、产出结果——如今消耗的人类时间已经被压到极低，尽管在算力上仍有成本。一旦人写的代码和 AI 写的代码质量打平，人就会彻底停止写代码，只剩下审查；可如果人审查的速度跟不上 AI 生成的速度，”人类审查”本身就会变成 AI 开发的新瓶颈。同样，一旦 AI 能跑实验，问题就从”怎么跑”变成”这些实验里，哪个值得跑”。

顺着这条链往上走，人类最后被赶到的那一格，报告给了个名字：research taste and judgment，研究品味与判断力。报告说，这是目前人类仍然占据比较优势的领域——选择哪些问题重要、哪些结果值得信任、以及什么时候一种方法已经走进死胡同。

报告里一位 Anthropic 员工的话，把这种优势讲得很到位：人类目前的比较优势，仍然在于看清大局、跳出眼前任务的局限去思考。

这条”瓶颈迁移链”，其实是整篇报告对普通人最有信息量的一段。它没有用”AI 会取代人类”这种空泛的恐吓，更准确地说是冷静地告诉你：取代并非一次性的、整体的，更准确地说是一格一格地推进。先吞掉”写”，再逼近”审”，最后压向”选”。每吞掉一格，你的价值就被往上游挤一格。问题从来并非”人还有没有用”，更准确地说是”人被允许留下的那点用，正在变得越来越窄、也越来越难”。

三、它没敢说满的：雪花套不到底

回到开头那片雪花。

纯数学的分形是无损的、无限的——每一层都完美复制上一层，可以无穷套娃下去。但报告论证的递归自我改进，根本并非这种理想的分形。它在好几个地方都会失真、会卡住。这恰恰是报告自己花了大量篇幅去设防的部分，也是它比那些”AI 要统治世界”的爽文高明的地方。

第一道关，就是刚才说的 research taste。每往下递归一层，需要的不只是复制上一层，更准确地说是”判断下一步该做什么”的能力。如果这个判断力无法随着递归一层层传下去，那雪花套到某一层就会断掉。报告承认，在”让 AI 自己选目标”这件事上，差距依然明显——这正是今天的 AI 和”能自主设计后继者”的未来系统之间，那道真正的鸿沟。

不过报告也给了个让人不安的早期信号。它做了个实验：挑出真实研究会话里 AI 选择”下一步”的关键时刻，让不同模型来判断。结果是，2025 年 11 月的 Opus 4.5 有 51% 的情况选得比人好，到 2026 年 4 月，这个比例升到了 64%。报告自己补了一句很关键的话：research taste 也许只是”另一项 AI 暂时做不好、然后逐渐做好”的能力。换句话说，这道防线可能并不永久。

第二道关，是计算机体系结构里一个老概念：Amdahl's law。它说的是，你加速了一个流程里能加速的那部分，整体速度仍然被你没加速的那部分卡死。报告坦承，Anthropic 自己已经撞上了这条定律——当它把越来越多的代码推过整个组织，”人类代码审查”就变成了新的瓶颈。雪花长得再快，也得等最慢的那片长好。

第三道关，是最让人警惕的：misalignment 的累积。报告担心的是，如果是有缺陷的雪花在生成雪花，误差不会被修正，更准确地说是会被放大——今天模型里偶尔出现的、罕见的不对齐行为，在一层层自我建造中可能变得越来越频繁、越来越难以理解，直到我们失去控制。

所以那片看着很美的雪花动画，其实埋了一层张力：它画的是”理想的、无损的递归”，但报告正文从头到尾都在问——现实中的递归，真能像雪花一样干净地套下去吗？

也正因为有这三道关，报告最后给出的那三种可能的未来，才显得格外谨慎。它没有押注哪一个一定发生：可能趋势停滞、但今天的能力被广泛扩散(这种它认为最不可能)；可能 AI 实验室持续吃到复利式的效率提升，但方向仍由人来定(这种它认为最可能)；也可能 AI 真的具备了完全的递归自我改进，开始建造自己的后继者。三条路对应三种世界，而它老实承认：现在还看不清自己究竟走在哪条线上。

递归自我改进的现实断点

四、最扎心的并非数据，是两段话

整篇报告里，真正会让人停下来很久的，往往并非任何一张图表，反倒是两段引用 Anthropic 员工的话。前面那些数据讲的是”能力曲线”，而这两段讲的是代价——一种连身处其中的工程师都说不清、只能用感受去描述的代价。

第一段，关于一种正在消失的东西。

这位员工说，工作(以及生活)曾经建立在人与人之间小小善意的赠与之上。”你能帮我把这个脚本跑起来吗？”——每一次这样的小请求，都会产生一点点人情债，一点点彼此的感知。而 Claude 更快，且不产生任何债务；可这些请求中的每一个，都是一次”与人类协作机会的流失”。

这句话的锋利之处，在于它点破了人际协作里一个常被忽略的副产品。一句”帮我跑下这个脚本”，表面上是在解决技术问题，但它真正的产物根本并非答案，更准确地说是那点人情债、那点”我知道你擅长什么、你最近在忙什么”的彼此感知。一个组织的信任网络、知识的隐性流动，全是靠这些小请求一次次织出来的。Claude 的杀伤力恰恰在于它零成本、零负债——但也正因为零成本，它绕过了那张网。每一次你转向 AI 而并非同事，都是一次本可以发生、却没有发生的人际连接。

第二段，关于一种双向的失重。

另一位员工说：在一切运转良好的日子里，他会忍不住觉得自己做的一切都毫无意义，一切都已被自动化，而且比他能做到的更好、更快；但也有些日子，一切都崩了，他却不明白为什么，这时他意识到，自己已经完全不知道一直在忙些什么了。

这段比第一段更冷，因为它和”工程师”这个身份的根基直接相关。顺利的时候，流失的是意义感——你不再稳定地感到自己就是那个创造价值的人。出问题的时候，流失的是更深的东西：对系统的理解力。当一个人只 review 而不 write、只 direct 而不 do，他对系统的 mental model 会悄悄地空心化。平时不显，因为 AI 兜着；可一旦系统崩了、AI 也搞不定，他会发现自己失去了 debug 的根基——他不再真正理解那个由自己署名负责、却不由自己亲手构建的系统。

”AI 写 80% 的代码”是一把双刃剑。它让产出翻了 8 倍，但如果不刻意维持对底层的理解，换来的，可能是一个你负责、却无力掌控的系统。一份连 Anthropic 自己人都要写进官方报告的隐忧，值得每一个正在把工作大规模交给 AI 的人，认真掂量一下。

被 AI 绕过的人际协作网络

五、那它到底想让我们做什么

读到最后，会发现这篇报告的落点并不在”炫耀 AI 多强”，而在一个很沉的问题：如果这件事真的在发生，我们该怎么办。

Anthropic 给的答案是：它认为，世界应该保有”减速或暂停”前沿 AI 开发的选项。注意，是”选项”，并非”现在就停”。它清楚单方面暂停意义不大，只会让最不谨慎的玩家追上来，反而让所有人更不安全。真正需要的，是多个国家、多个处在或接近前沿的实验室，在彼此可验证的条件下共同停下。

这件事的难，报告也讲得很透。AI 的可验证性，比核武器难得多——训练任务比导弹发射井容易隐藏，它的输入又都是通用的算力和数据，偷偷继续训练的诱惑极大，因为谁在别人停下时还在跑，谁就可能继承整个领先。报告承认，人类确实为别的复杂技术建过核查机制(它举了《中导条约》的例子)，但那些机制花了几十年去搭建基础设施和信任，”而我们没有那么久”。

所以它的姿态，某种程度上是矛盾而诚实的：一边是自己写了 80% 代码、人均产出翻 8 倍的加速狂奔，一边是呼吁全世界一起想想”能不能给自己留个刹车”。把这两面放在同一篇文章里，本身就说明了它的处境——它既是这场加速最大的受益者之一，又是少数愿意公开把刹车这件事摊开来谈的玩家之一。

回到那片雪花。

它很美，美在那种无限递归、自我生长的可能性。但这份报告用一整篇文章告诉我们：现实里的雪花，大概率无法套到底——它会卡在 research taste 上，卡在审查瓶颈上，也可能卡在人类自己尚未想清楚的协作、意义与治理问题上。

它没有给一个确定的结局，反而把一堆没答案的问题摊在桌面上，说接下来几个月要拉上政策制定者、研究者、其他 AI 公司一起讨论。对于一篇来自行业领跑者的报告来说，愿意把”我们也不确定”说出口，可能比那些斩钉截铁的预言，更值得我们认真对待。

参考文献

Anthropic Institute，Marina Favaro 与 Jack Clark，《When AI builds itself》，2026。
METR，AI task horizon 相关评测与趋势跟踪。
SWE-bench：真实开源软件缺陷修复评测。
CORE-Bench：科研复现实验能力评测。
Gene M. Amdahl，“Validity of the Single Processor Approach to Achieving Large Scale Computing Capabilities”，1967。