Anthropic最新报告显示,Claude目前已编写其生产代码的80%以上。工程师每日合并的代码量是2024年的8倍,这一转变标志着AI开发从人类主导转向AI自主执行的重大加速。

过去,AI开发的完整循环由人类完成:编写代码、运行实验、调试系统、解读结果、决定下一步尝试。如今,Claude已接管大量执行环节。它能自主编写和编辑代码、运行代码、委派工作给其他代理、调试事件、优化实验,并在合并前审查代码,甚至捕捉人类遗漏的错误。
一个典型案例:在2026年4月,Claude在一个月内完成了800多个API错误修复,使某类错误减少了1000倍。负责的工程师估计,人类完成类似工作可能需要4年时间——因为修复他人代码中的bug耗时费力,且需同时处理大量陌生上下文。

在优化任务上,进步同样惊人。2025年5月,Claude Opus 4在固定目标的实验中平均实现约3倍加速;到2026年4月,Claude Mythos Preview达到了约52倍加速。而熟练的人类研究员通常需要4-8小时才能达到4倍加速。在执行明确定义的实验优化环节,Claude已在不到一年内从超级助手跃升为超人类水平。
Claude编写的代码质量也在快速提升。在最开放的任务上,其成功率已达到76%(六个月内提升50个百分点)。自动化审查工具显示,Claude审查能提前捕捉过去生产事故中约三分之一的bug。目前,Claude编写的代码已接近人类水平,预计年内将超越。

人类仍掌握关键判断,但执行已高度自动化
人类目前的核心优势在于“品味”与判断:选择值得解决的问题、评估结果的重要性、决定研究方向以及何时停止。这些高层决策仍由人类主导,但“执行”部分正被快速自动化。
报告指出,AI开发正从“人类构建AI”转向“人类指导代理构建AI”。如果这一循环完全闭合,将实现真正的递归自我改进——AI系统自主设计、测试并改进其后继版本。这可能带来科学、医疗等领域的巨大突破,但也显著提升人类对AI系统失去控制的风险。
Anthropic强调,我们尚未达到完全自主递归自我改进,但这一趋势比多数机构预想的来得更快。机构需要提前关注其深远影响,包括安全、监控和行为塑造等方面的挑战。

AI加速自身发展的时代已至,人类角色正从“建造者”逐步转向“战略指导者”。这一转变的速度,值得整个行业高度警醒与准备。
夜雨聆风