
如果你点开 Anthropic 这篇报告,第一眼看到的,会先撞上一片缓缓生长的雪花,数据反倒退到后面。
一朵小雪花,长出更小的雪花;更小的雪花,又拼成一朵更大的。它不停地往里套、往外长,像一个永不收敛的循环。这是设计团队为这篇文章配的开篇动画,文章的名字叫《When AI builds itself》——当 AI 开始建造自己。
有些数学功底的人会知道,这是 fractal(分形)。分形最核心的特征叫 self-similarity,自相似:整体的结构在每一个局部尺度上重复出现。而分形的生成机制,本质上就是递归——一条规则,不断作用在它自己的输出上。
用雪花来对应这篇报告的主题,选得极准。因为它讲的核心概念,叫 recursive self-improvement,递归自我改进。说白了就是:AI 写出更强的 AI,更强的 AI 再写出更强的 AI,一轮接一轮。雪花长出雪花,正好是这个过程的视觉化。
但这篇报告真正值得一读的地方,既不只在那片漂亮的雪花,也不只在它甩出的一连串吓人数据。更关键的地方在于:它一边用数据证明“AI 已经在加速 AI 自己”,一边又非常克制地、几乎是逐条地,告诉你这件事会卡在哪里。它说了很多,但它没敢说满。
这篇文章,我们就来把它读一遍——既读它说出口的,也读它留在字缝里的。

分形雪花与递归自我改进
一、它说了什么:AI 已经在加速 AI 自己
先把报告的核心论点摆清楚。
这篇文章由 Anthropic Institute 发布,两位主笔是 Marina Favaro 和 Jack Clark。它的一句话总结是:AI 正在越来越多地接手 AI 开发本身的工作,而这件事,正在加速整个 AI 的进步速度。
Anthropic 很谨慎地划了条线。报告原话是:把这个趋势推到极致、再给足够的算力,指向的是一个能完全自主设计并开发自己后继者的系统;但“我们还没到那一步,递归自我改进也并非必然会发生的”。它强调的重心放在另一处:眼下仍未完全发生,但它可能比大多数机构准备好的时间来得更早。
这种克制反而让接下来的数据更有分量。
先看外部的、公开可查的 benchmark。一家叫 METR 的机构长期跟踪一个指标:AI 能可靠独立完成的任务有多长。报告引用的数字是,这个时长大约每 4 个月翻一倍,而此前的趋势是每 7 个月。具体到模型:2024 年 3 月,Claude Opus 3 能搞定的软件任务大概需要人花 4 分钟;一年后的 Sonnet 3.7,能做约 1.5 小时的任务;再一年,Opus 4.6 能做 12 小时的任务。如果这条线继续,今年之内,需要人花好几天的任务就会进入射程。
再看两个研究类 benchmark。SWE-bench 是个很硬的测试——它直接扔给模型一个真实开源项目和一个真实的 bug 报告,要求写出能通过项目自身测试的修复代码。报告说,模型在这上面的得分两年内从个位数一路冲到接近满分。另一个叫 CORE-Bench,测的是模型能不能复现已发表论文的结果(这是它能做原创研究的前提),从 2024 年约 20% 的成功率,15 个月后也饱和了。
但公开 benchmark 仍然说不清一件最关键的事:AI 到底在多大程度上,加速了 AI 公司自己的开发。这个,只能看内部数据。于是报告掏出了几个之前没公开过的数字。
最扎眼的一个:截至 2026 年 5 月,Anthropic 合并进自己代码库的代码里,超过 80% 是 Claude 写的。而在 Claude Code 于 2025 年 2 月发布研究预览版之前,这个比例还停留在个位数。对应到人均产出:2026 年第二季度,一个典型工程师每天合并的代码量,是 2024 年的 8 倍——并非因为他打字更快了,更准确地说是因为大部分代码由 Claude 写,人转去做 directing 和 reviewing。
报告里还有一个更具体的例子。2026 年 4 月,Claude 提交了 800 多个修复,把某一类 API 错误的发生率降低了一千倍。负责盯着它干这件事的工程师估计,同样的工作量,换一个人来做要花四年——因为给别人擦屁股、修别人的 bug 又慢又痛苦,人很难在脑子里同时装下那么多陌生的上下文。
值得敬佩的是,报告自己很诚实地补了句注解:代码行数是个粗糙的指标,它只数量不看质量,所以”8 倍”几乎肯定高估了真实的生产力提升。但即便打个折,趋势是明确的。

几条加速曲线正在同时上扬
二、瓶颈在迁移:人正被赶往上游
如果报告只是堆数据,它顶多算一篇漂亮的产品宣传。真正让它值得反复读的,是它对”人类角色”的拆解。
报告把”AI 开发 AI”拆成了一条链:写代码,审查代码,选择做什么实验、做什么问题。然后它指出一个很冷静、也很冷的规律——每当 AI 把这条链上某一环的成本压到接近零,瓶颈就会往上游移动一格,移到那个还没被自动化的环节上。
它的原话很精炼:执行这件事本身——写代码、跑实验、产出结果——如今消耗的人类时间已经被压到极低,尽管在算力上仍有成本。一旦人写的代码和 AI 写的代码质量打平,人就会彻底停止写代码,只剩下审查;可如果人审查的速度跟不上 AI 生成的速度,”人类审查”本身就会变成 AI 开发的新瓶颈。同样,一旦 AI 能跑实验,问题就从”怎么跑”变成”这些实验里,哪个值得跑”。
顺着这条链往上走,人类最后被赶到的那一格,报告给了个名字:research taste and judgment,研究品味与判断力。报告说,这是目前人类仍然占据比较优势的领域——选择哪些问题重要、哪些结果值得信任、以及什么时候一种方法已经走进死胡同。
报告里一位 Anthropic 员工的话,把这种优势讲得很到位:人类目前的比较优势,仍然在于看清大局、跳出眼前任务的局限去思考。
这条”瓶颈迁移链”,其实是整篇报告对普通人最有信息量的一段。它没有用”AI 会取代人类”这种空泛的恐吓,更准确地说是冷静地告诉你:取代并非一次性的、整体的,更准确地说是一格一格地推进。先吞掉”写”,再逼近”审”,最后压向”选”。每吞掉一格,你的价值就被往上游挤一格。问题从来并非”人还有没有用”,更准确地说是”人被允许留下的那点用,正在变得越来越窄、也越来越难”。
三、它没敢说满的:雪花套不到底
回到开头那片雪花。
纯数学的分形是无损的、无限的——每一层都完美复制上一层,可以无穷套娃下去。但报告论证的递归自我改进,根本并非这种理想的分形。它在好几个地方都会失真、会卡住。这恰恰是报告自己花了大量篇幅去设防的部分,也是它比那些”AI 要统治世界”的爽文高明的地方。
第一道关,就是刚才说的 research taste。每往下递归一层,需要的不只是复制上一层,更准确地说是”判断下一步该做什么”的能力。如果这个判断力无法随着递归一层层传下去,那雪花套到某一层就会断掉。报告承认,在”让 AI 自己选目标”这件事上,差距依然明显——这正是今天的 AI 和”能自主设计后继者”的未来系统之间,那道真正的鸿沟。
不过报告也给了个让人不安的早期信号。它做了个实验:挑出真实研究会话里 AI 选择”下一步”的关键时刻,让不同模型来判断。结果是,2025 年 11 月的 Opus 4.5 有 51% 的情况选得比人好,到 2026 年 4 月,这个比例升到了 64%。报告自己补了一句很关键的话:research taste 也许只是”另一项 AI 暂时做不好、然后逐渐做好”的能力。换句话说,这道防线可能并不永久。
第二道关,是计算机体系结构里一个老概念:Amdahl's law。它说的是,你加速了一个流程里能加速的那部分,整体速度仍然被你没加速的那部分卡死。报告坦承,Anthropic 自己已经撞上了这条定律——当它把越来越多的代码推过整个组织,”人类代码审查”就变成了新的瓶颈。雪花长得再快,也得等最慢的那片长好。
第三道关,是最让人警惕的:misalignment 的累积。报告担心的是,如果是有缺陷的雪花在生成雪花,误差不会被修正,更准确地说是会被放大——今天模型里偶尔出现的、罕见的不对齐行为,在一层层自我建造中可能变得越来越频繁、越来越难以理解,直到我们失去控制。
所以那片看着很美的雪花动画,其实埋了一层张力:它画的是”理想的、无损的递归”,但报告正文从头到尾都在问——现实中的递归,真能像雪花一样干净地套下去吗?
也正因为有这三道关,报告最后给出的那三种可能的未来,才显得格外谨慎。它没有押注哪一个一定发生:可能趋势停滞、但今天的能力被广泛扩散(这种它认为最不可能);可能 AI 实验室持续吃到复利式的效率提升,但方向仍由人来定(这种它认为最可能);也可能 AI 真的具备了完全的递归自我改进,开始建造自己的后继者。三条路对应三种世界,而它老实承认:现在还看不清自己究竟走在哪条线上。

递归自我改进的现实断点
四、最扎心的并非数据,是两段话
整篇报告里,真正会让人停下来很久的,往往并非任何一张图表,反倒是两段引用 Anthropic 员工的话。前面那些数据讲的是”能力曲线”,而这两段讲的是代价——一种连身处其中的工程师都说不清、只能用感受去描述的代价。
第一段,关于一种正在消失的东西。
这位员工说,工作(以及生活)曾经建立在人与人之间小小善意的赠与之上。”你能帮我把这个脚本跑起来吗?”——每一次这样的小请求,都会产生一点点人情债,一点点彼此的感知。而 Claude 更快,且不产生任何债务;可这些请求中的每一个,都是一次”与人类协作机会的流失”。
这句话的锋利之处,在于它点破了人际协作里一个常被忽略的副产品。一句”帮我跑下这个脚本”,表面上是在解决技术问题,但它真正的产物根本并非答案,更准确地说是那点人情债、那点”我知道你擅长什么、你最近在忙什么”的彼此感知。一个组织的信任网络、知识的隐性流动,全是靠这些小请求一次次织出来的。Claude 的杀伤力恰恰在于它零成本、零负债——但也正因为零成本,它绕过了那张网。每一次你转向 AI 而并非同事,都是一次本可以发生、却没有发生的人际连接。
第二段,关于一种双向的失重。
另一位员工说:在一切运转良好的日子里,他会忍不住觉得自己做的一切都毫无意义,一切都已被自动化,而且比他能做到的更好、更快;但也有些日子,一切都崩了,他却不明白为什么,这时他意识到,自己已经完全不知道一直在忙些什么了。
这段比第一段更冷,因为它和”工程师”这个身份的根基直接相关。顺利的时候,流失的是意义感——你不再稳定地感到自己就是那个创造价值的人。出问题的时候,流失的是更深的东西:对系统的理解力。当一个人只 review 而不 write、只 direct 而不 do,他对系统的 mental model 会悄悄地空心化。平时不显,因为 AI 兜着;可一旦系统崩了、AI 也搞不定,他会发现自己失去了 debug 的根基——他不再真正理解那个由自己署名负责、却不由自己亲手构建的系统。
”AI 写 80% 的代码”是一把双刃剑。它让产出翻了 8 倍,但如果不刻意维持对底层的理解,换来的,可能是一个你负责、却无力掌控的系统。一份连 Anthropic 自己人都要写进官方报告的隐忧,值得每一个正在把工作大规模交给 AI 的人,认真掂量一下。

被 AI 绕过的人际协作网络
五、那它到底想让我们做什么
读到最后,会发现这篇报告的落点并不在”炫耀 AI 多强”,而在一个很沉的问题:如果这件事真的在发生,我们该怎么办。
Anthropic 给的答案是:它认为,世界应该保有”减速或暂停”前沿 AI 开发的选项。注意,是”选项”,并非”现在就停”。它清楚单方面暂停意义不大,只会让最不谨慎的玩家追上来,反而让所有人更不安全。真正需要的,是多个国家、多个处在或接近前沿的实验室,在彼此可验证的条件下共同停下。
这件事的难,报告也讲得很透。AI 的可验证性,比核武器难得多——训练任务比导弹发射井容易隐藏,它的输入又都是通用的算力和数据,偷偷继续训练的诱惑极大,因为谁在别人停下时还在跑,谁就可能继承整个领先。报告承认,人类确实为别的复杂技术建过核查机制(它举了《中导条约》的例子),但那些机制花了几十年去搭建基础设施和信任,”而我们没有那么久”。
所以它的姿态,某种程度上是矛盾而诚实的:一边是自己写了 80% 代码、人均产出翻 8 倍的加速狂奔,一边是呼吁全世界一起想想”能不能给自己留个刹车”。把这两面放在同一篇文章里,本身就说明了它的处境——它既是这场加速最大的受益者之一,又是少数愿意公开把刹车这件事摊开来谈的玩家之一。
回到那片雪花。
它很美,美在那种无限递归、自我生长的可能性。但这份报告用一整篇文章告诉我们:现实里的雪花,大概率无法套到底——它会卡在 research taste 上,卡在审查瓶颈上,也可能卡在人类自己尚未想清楚的协作、意义与治理问题上。
它没有给一个确定的结局,反而把一堆没答案的问题摊在桌面上,说接下来几个月要拉上政策制定者、研究者、其他 AI 公司一起讨论。对于一篇来自行业领跑者的报告来说,愿意把”我们也不确定”说出口,可能比那些斩钉截铁的预言,更值得我们认真对待。
参考文献
Anthropic Institute,Marina Favaro 与 Jack Clark,《When AI builds itself》,2026。 METR,AI task horizon 相关评测与趋势跟踪。 SWE-bench:真实开源软件缺陷修复评测。 CORE-Bench:科研复现实验能力评测。 Gene M. Amdahl,“Validity of the Single Processor Approach to Achieving Large Scale Computing Capabilities”,1967。
夜雨聆风