美国AI巨头Anthropic近日发布了一份题为《When AI Builds Itself》的重磅报告,该报告由联合创始人 Jack Clark 与内部研究机构负责人 Marina Favaro 联合署名,首次将“递归自我改进”这一理论推到了现实面前。它的核心观点不仅是展示 AI 比人类写得快,更是揭示一个正在自行运转的、足以改变技术演进范式的智能飞轮。
一、核心数据:AI 已全面提效
报告披露的内部数据,首次量化了 AI“自举”的进程。
· 80% 代码占比:截至 2026 年 5 月,Claude 已编写了 Anthropic 主代码库 80% 以上 的代码,而在 2025 年 2 月前这一比例仅为个位数。
· 8 倍产出增长:通过 AI 辅助,Anthropic 工程师人均每天合并的代码量相比 2024 年增长了 8 倍。
· 4 倍个人效率:员工反馈,使用最新模型 Mythos Preview 后,自身产出约为不使用 AI 时的 4 倍。
· 16 小时自主任务:Claude 独立完成可靠任务的能力快速增强,从 2024 年仅能处理 4 分钟 的简单任务,快速进化至可应对 12 小时 的复杂工作。最新 Mythos 预览版更是能在基准测试中自主工作 16 小时以上。
二、深层解读:“递归自我改进”的技术关键
“递归自我改进”的本质是 AI 能够自主设计、构建并训练比自身更强大的下一代模型,形成“能力越强,进化越快”的自我加速循环。虽然完全形态尚未实现,但在局部闭环上已取得突破,主要集中在以下三个层面:
· 代码生成:从辅助工具进化为开发主力。以代码优化为例,Claude 实现了 52 倍 的速度提升,远超顶尖人类研究员的 4 倍。
· 质量保证:Claude 已能作为自动代码评审员,独立拦截大量 Bug 和安全漏洞。人类审查更多成为最后的“安全阀门”而非日常执行者。
· 科研提效:AI 不仅能执行实验,甚至能提出实验方向。Mythos 预览版在一次测试中独立完成 800 多份 修正,将特定 API 错误率降至千分之一。
三、博文的矛盾与争议解读
报告中看似矛盾的“自我刹车”立场,背后是 Anthropic 深刻的历史角色和复杂的利益考量。
· 呼吁全球暂停AI开发
这份警告的核心逻辑在于“失衡”:AI 飞轮转得过快,可能导致社会构建和对齐研究无法跟上技术进步,从而引发失控风险。同时,Anthropic 也清醒地意识到单边行动无效,呼吁建立类似“核不扩散”的全球协约来互相核查,尽管其认为 AI 比核武器更难监管。
· 广泛的质疑
· 商业动机争议:批评者认为这是“监管俘获”行为,通过渲染风险来限制竞争对手、抢占合规赛道。
· 立场矛盾:最显著的矛盾在于其“跑得最快却主动呼吁踩刹车”。Anthropic 的条件是 “如果对手都停” ,自身不会冒险放弃先发优势,这使其呼吁存在明显的博弈考量。
四、总结与深度思考
· 开发者角色的转变:AI 正从“工具”变为“协作者”,人类工程师的角色相应地从直接生产者,转变为 AI 的管理者与目标设定者。
· 自主权的让渡:当超 80% 的代码由 AI 生成后,未来软件系统的演进将越来越多地成为 “黑箱”——人类知道输入和目标,但难以理解其内部实现路径。
· 终极控制权的辩论:当 AI 开始自主训练 AI 时,终极控制权将面临挑战:速度、决策质量与不可预测性之间的权衡,是最大的悬而未决的问题。
· 商业利益与公共安全:Anthropic 的悖论凸显了技术竞赛中的囚徒困境:没有人能单方面按下暂停键,但所有人都在担心即将到来的悬崖。
夜雨聆风