AI正在构建AI:Anthropic内部数据揭示Claude已主导80%以上生产代码,递归自我改进之路加速开启

Anthropic最新报告显示，Claude目前已编写其生产代码的80%以上。工程师每日合并的代码量是2024年的8倍，这一转变标志着AI开发从人类主导转向AI自主执行的重大加速。

过去，AI开发的完整循环由人类完成：编写代码、运行实验、调试系统、解读结果、决定下一步尝试。如今，Claude已接管大量执行环节。它能自主编写和编辑代码、运行代码、委派工作给其他代理、调试事件、优化实验，并在合并前审查代码，甚至捕捉人类遗漏的错误。

一个典型案例：在2026年4月，Claude在一个月内完成了800多个API错误修复，使某类错误减少了1000倍。负责的工程师估计，人类完成类似工作可能需要4年时间——因为修复他人代码中的bug耗时费力，且需同时处理大量陌生上下文。

在优化任务上，进步同样惊人。2025年5月，Claude Opus 4在固定目标的实验中平均实现约3倍加速；到2026年4月，Claude Mythos Preview达到了约52倍加速。而熟练的人类研究员通常需要4-8小时才能达到4倍加速。在执行明确定义的实验优化环节，Claude已在不到一年内从超级助手跃升为超人类水平。

Claude编写的代码质量也在快速提升。在最开放的任务上，其成功率已达到76%（六个月内提升50个百分点）。自动化审查工具显示，Claude审查能提前捕捉过去生产事故中约三分之一的bug。目前，Claude编写的代码已接近人类水平，预计年内将超越。

人类仍掌握关键判断，但执行已高度自动化

人类目前的核心优势在于“品味”与判断：选择值得解决的问题、评估结果的重要性、决定研究方向以及何时停止。这些高层决策仍由人类主导，但“执行”部分正被快速自动化。

报告指出，AI开发正从“人类构建AI”转向“人类指导代理构建AI”。如果这一循环完全闭合，将实现真正的递归自我改进——AI系统自主设计、测试并改进其后继版本。这可能带来科学、医疗等领域的巨大突破，但也显著提升人类对AI系统失去控制的风险。

Anthropic强调，我们尚未达到完全自主递归自我改进，但这一趋势比多数机构预想的来得更快。机构需要提前关注其深远影响，包括安全、监控和行为塑造等方面的挑战。