6 月 4 日,
Anthropic Institute 发布《当 AI 构建自己》,披露了一组内部数据。

截至 2026 年 5 月,Anthropic 合并到代码库的代码中,超过 80% 由 Claude 编写。而在 Claude Code 于 2025 年 2 月发布研究预览版之前,这个数字还只是个位数。

另外,2026 年第二季度,典型工程师每天合并的代码行数是 2024 年的 8 倍。2026 年 4 月,Claude 完成了 800 多个 API 错误修复,将某类错误减少约 1000 倍,负责工程师估计,如果由人类完成,需要约 4 年时间。
AI 能力提升
Anthropic 设计了一个小型训练代码优化测试。2025 年 5 月,Claude Opus 4 平均带来约 3 倍速度提升。到 2026 年 4 月,Claude Mythos Preview 达到约 52 倍。虽然是在受控实验设置中的相对比较。但从 3 倍到 52 倍,17 倍的增长也显示出 AI 优化能力的质变。
2026 年 4 月,Anthropic 做了一个更接近真实研究流程的实验。两名真人研究员一周内恢复了约 23% 的性能差距,而 Claude agents 在约 800 个累计小时、约 1.8 万美元计算成本下,恢复了 97%。关键是,人类仍然选择了问题并设定了评分规则,也就是说,AI 尚未完全独立定义研究方向,但在执行层面已经超越人类效率。
Anthropic 还有一个自动 Claude 代码审查器。在回溯分析中,如果用于所有变更,约可提前发现 claude.ai 过往生产事故相关 bug 的三分之一。

递归自我改进
报告中有一个词「递归自我改进」:AI 系统能够自己构建和训练模型。也就是 AI 自己训练自己,自我迭代。
现在的 AI 已经可以运行代码、委派其他 agent 做数小时的工作、编写大部分生产代码、参与研究并提供优于人类的建议。但距离完整递归自我改进还缺少的是 AI 独立设定研究方向、端到端完成模型训练和评估的能力。
Anthropic 联合创始人 Jack Clark 在 2026 年 5 月接受 Axios 采访时,给出了一个时间表。他认为到 2028 年底前,AI 模型完全训练其后继者的概率超过 60%。
现在,AI 进步速度取决于人类研究员的数量、创造力和工作时间。而递归自我改进后,AI 进步速度主要取决于算力和训练、推理效率发现的速度。人类研究员的规模增长是线性的,受教育周期、人口基数限制。而算力和 AI 自身的优化能力增长可能是指数级的。
Anthropic 在报告中列出了三种可能的未来。第一种是趋势停滞、能力扩散。当前 AI 能力增长触及瓶颈,可能是 S 曲线、架构极限、算力能源供应链瓶颈等等,但现有能力广泛扩散到各行业。这类似于互联网时代,技术本身不再飞速进步,但应用普及改变社会运作方式。
第二种是复合效率提升、人类仍掌舵。AI 实验室继续获得复合效率提升,AI 开发大幅自动化,但人类仍然设定研究方向、判断结果质量。Anthropic 称这可能让 100 人的公司完成过去 1 万或 10 万人组织的工作。权力高度集中在少数掌握前沿 AI 的组织手中。
第三种是完整递归自我改进。AI 系统实现端到端训练后继者,开始构建自己。AI 进步速度主要由算力和训练、推理效率发现速度决定。人类角色转向监督、验证和治理。如果治理机制失效,人类可能失去对技术方向的控制。

暂停研究 AI
一家估值 9650 亿美元、年收入 470 亿美元、刚刚完成 650 亿美元 Series H 融资、正在准备 IPO 的 AI 巨头,在最火的时候呼吁建立全球放缓或暂停?
Anthropic 说,如果技术进步速度超过社会结构和对齐研究跟上的速度,风险会累积到危险水平。放缓或暂停的目的不是永久停止 AI 发展,而是为社会争取时间。让法律和监管框架跟上技术现实,让对齐研究跟上能力提升,让社会机构建立应对 AI 冲击的缓冲机制。
Anthropic 同时指出了暂停的两面性。好的情况是,如果放缓让谨慎的行为者保持领先,让社会和安全研究赶上,这是好事。坏的情况是,如果放缓只是让不谨慎的行为者赶上,比如不重视安全的实验室、国家行为者,反而让所有人更不安全。因此,Anthropic 强调的是「协调、可验证」的机制,而非单方面行动。
Anthropic 指出,单个实验室单方面暂停虽然立刻可行,但作用有限,主要是改变谁处于领先,而不是产生更广泛的全球审议机制。
最后
今天的分享就到这里。
觉得有用的话,欢迎点赞、分享、关注。

我们下篇文章见。
参考资料:
https://www.anthropic.com/institute/recursive-self-improvement
夜雨聆风