【他山之石】AI 正从“工具”变为“协作者”!美国AI巨头Anthropic官方博文《当构建自身》(When Builds Itself)解读

美国AI巨头Anthropic近日发布了一份题为《When AI Builds Itself》的重磅报告，该报告由联合创始人 Jack Clark 与内部研究机构负责人 Marina Favaro 联合署名，首次将“递归自我改进”这一理论推到了现实面前。它的核心观点不仅是展示 AI 比人类写得快，更是揭示一个正在自行运转的、足以改变技术演进范式的智能飞轮。

一、核心数据：AI 已全面提效

报告披露的内部数据，首次量化了 AI“自举”的进程。

· 80% 代码占比：截至 2026 年 5 月，Claude 已编写了 Anthropic 主代码库 80% 以上的代码，而在 2025 年 2 月前这一比例仅为个位数。

· 8 倍产出增长：通过 AI 辅助，Anthropic 工程师人均每天合并的代码量相比 2024 年增长了 8 倍。

· 4 倍个人效率：员工反馈，使用最新模型 Mythos Preview 后，自身产出约为不使用 AI 时的 4 倍。

· 16 小时自主任务：Claude 独立完成可靠任务的能力快速增强，从 2024 年仅能处理 4 分钟的简单任务，快速进化至可应对 12 小时的复杂工作。最新 Mythos 预览版更是能在基准测试中自主工作 16 小时以上。

二、深层解读：“递归自我改进”的技术关键

“递归自我改进”的本质是 AI 能够自主设计、构建并训练比自身更强大的下一代模型，形成“能力越强，进化越快”的自我加速循环。虽然完全形态尚未实现，但在局部闭环上已取得突破，主要集中在以下三个层面：

· 代码生成：从辅助工具进化为开发主力。以代码优化为例，Claude 实现了 52 倍的速度提升，远超顶尖人类研究员的 4 倍。

· 质量保证：Claude 已能作为自动代码评审员，独立拦截大量 Bug 和安全漏洞。人类审查更多成为最后的“安全阀门”而非日常执行者。

· 科研提效：AI 不仅能执行实验，甚至能提出实验方向。Mythos 预览版在一次测试中独立完成 800 多份修正，将特定 API 错误率降至千分之一。

三、博文的矛盾与争议解读

报告中看似矛盾的“自我刹车”立场，背后是 Anthropic 深刻的历史角色和复杂的利益考量。

· 呼吁全球暂停AI开发

这份警告的核心逻辑在于“失衡”：AI 飞轮转得过快，可能导致社会构建和对齐研究无法跟上技术进步，从而引发失控风险。同时，Anthropic 也清醒地意识到单边行动无效，呼吁建立类似“核不扩散”的全球协约来互相核查，尽管其认为 AI 比核武器更难监管。

· 广泛的质疑

· 商业动机争议：批评者认为这是“监管俘获”行为，通过渲染风险来限制竞争对手、抢占合规赛道。

· 立场矛盾：最显著的矛盾在于其“跑得最快却主动呼吁踩刹车”。Anthropic 的条件是 “如果对手都停” ，自身不会冒险放弃先发优势，这使其呼吁存在明显的博弈考量。

四、总结与深度思考

· 开发者角色的转变：AI 正从“工具”变为“协作者”，人类工程师的角色相应地从直接生产者，转变为 AI 的管理者与目标设定者。

· 自主权的让渡：当超 80% 的代码由 AI 生成后，未来软件系统的演进将越来越多地成为 “黑箱”——人类知道输入和目标，但难以理解其内部实现路径。

· 终极控制权的辩论：当 AI 开始自主训练 AI 时，终极控制权将面临挑战：速度、决策质量与不可预测性之间的权衡，是最大的悬而未决的问题。

· 商业利益与公共安全：Anthropic 的悖论凸显了技术竞赛中的囚徒困境：没有人能单方面按下暂停键，但所有人都在担心即将到来的悬崖。