当AI开始自我构建,Anthropic深度报告:我们应该考虑按下暂停键

每日嘉宾 ▼

ANGEL Guest

导语

2026年6月2日，一则消息震动了全球科技界和华尔街：AI公司Anthropic向美国证券交易委员会（SEC）秘密递交了S-1招股书，正式启动IPO进程。如果顺利，这家成立仅五年的公司最快将在今年秋天登陆纳斯达克，届时很可能缔造全球AI领域有史以来最大规模的公开上市。

五天前——5月28日——Anthropic刚完成H轮650亿美元融资，估值达到9650亿美元（约合人民币6.5万亿元），超越老对手OpenAI（估值8520亿美元），登顶全球估值最高AI企业。而其2026年Q2预测营收已达109亿美元，预计实现公司成立以来首个盈利季度（运营利润约5.59亿美元）。年经常性收入（ARR）从2025年底的90亿美元飙升至2026年5月的470亿美元——不到半年翻了五倍。

这些数字令人眩晕。但更值得关注的是，是谁创造了这一切。

2021年，前OpenAI研究副总裁达里奥·阿莫迪（Dario Amodei）与妹妹丹妮拉·阿莫迪（Daniela Amodei），因对AI安全发展路径的分歧，带领一批核心成员出走，在旧金山创立了Anthropic。达里奥是斯坦福物理学学士、普林斯顿生物物理学博士，曾在谷歌大脑担任高级研究员，是Transformer架构和AI对齐研究的先驱之一。丹妮拉则曾在Stripe担任风险与合规负责人，为Anthropic带来了独特的治理视角。兄妹二人将公司注册为公益性公司（Public Benefit Corporation），将「负责任的AI开发」写进基因。

从创立之初的八人小团队到如今接近万亿估值的巨头，Anthropic只用了五年。它的崛起不仅是商业奇迹，更代表着一种技术哲学——AI的安全可控要比技术进步本身更重要。

而就在IPO风暴的中心，Anthropic的研究院（The Anthropic Institute）选择在此时，抛出一份万字重磅报告——《当AI自我构建》（When AI builds itself）。

这份报告首次披露了大量此前未公开的内部数据：Anthropic超过80%的生产代码由Claude编写，工程师每日合并代码量是两年前的8倍；Claude在实验优化任务上一年内从3倍加速跃升至52倍，超越人类研究员；最复杂的开放式任务中，Claude成功率在六个月内从26%飙升至76%。

这组数据指向一个令人不安的结论：AI距离自己改进自己、自己设计自己、甚至自己「制造下一代自己」——也就是递归自我改进（recursive self-improvement）——可能比任何政府、机构和公众所准备的都要近得多。

Anthropic研究院的核心结论是：如果这一趋势持续，2027年AI系统便可能完成需要人类数周工作的任务；而在最激进的情景下，AI系统将具备完全自主设计和开发继任者的能力——届时AI发展的速度将由算力而非人类决定。

但整份报告最令人震撼的，不是这些数字——而是它的立场。

一家估值近万亿、刚刚递交招股书、即将接受资本市场最严苛审视的AI公司，在长达万字的报告中得出了一个鲜有科技公司敢公开说的结论：我们应该考虑按下暂停键。

报告明确写道：「世界拥有减缓或暂时暂停前沿AI开发的选项是有益的，以使社会结构和对齐研究能跟上技术的步伐。」它进一步指出，单一实验室的单边暂停没有意义——需要全球协作的可核实暂停机制，让所有前沿开发者彼此确认对方确实停了、并且没有坏行为者趁机秘密超越。Anthropic表示，如果这样的机制建立起来，且其他前沿开发者同步行动，它将「预计会减速或暂时暂停。」

报告甚至罕见地坦承了时间的紧迫感。它指出，世界为核武器等技术建立国际核查机制花了几十年——「我们没有那么长时间。」

一家公司一边冲刺IPO，一边公开说「我们可能跑得太快了」。这种张力很少在任何行业的头部玩家身上看到，尤其是在一场史无前例的技术和商业竞赛中。它为什么这么做？报告背后的判断是：AI自我构建的速度正在超越人类理解和控制的速度。如果不提前建立刹车机制，等到失控时，一切可能都晚了。

以下为报告全文翻译。

报告全文

当AI自我构建

我们在递归自我改进方面的进展及其影响

Marina Favaro & Jack Clark / 2026年 / The Anthropic Institute

在AI历史的大部分时间里，人类主导了其发展周期的每一个步骤。但在Anthropic，我们正将越来越多的AI开发工作委托给AI系统本身，这正在加速我们的工作进程。

如果这一趋势走得足够远，并获得足够多的算力，它将指向一个能够完全自主设计和开发自身继任者的AI系统。这被称为递归自我改进（recursive self-improvement）。我们尚未达到这一阶段，递归自我改进也并非不可避免。但它可能比大多数机构所准备的来得更早。

利用公开基准测试和Anthropic内部此前未公开的数据，The Anthropic Institute正在展示AI已经在加速AI系统的开发。仅举一例：如今，Anthropic工程师平均每季度提交的代码量是2021-2025年期间的8倍。

本文讨论的技术趋势表明，AI系统在未来几年将变得更加强大。这些趋势具有深远影响。能够自我构建的AI将是技术史上的重大发展——可能在科学、医疗等领域为世界带来巨大福祉。但完全的递归自我改进也可能增加人类失去对AI系统控制的风险。如果系统能够完全构建自己的继任者，我们保护它们、监控它们、塑造其行为的方式将变得更加重要。

发展时间线

时期	阶段	描述
2021-2023	构建第一代Claude	早期工作与其他科技公司无异：人们在笔记本电脑上编写代码和文档
2023-2025	聊天机器人	人们使用早期聊天机器人协助部分流程，如生成短代码片段并将输出复制到文本编辑器
2025-2026	编程智能体	随着智能体能力增强，它们能够自行编写和编辑代码，有时是整个文件
今天	自主智能体	智能体现在可以自行运行代码，并将数小时的工作委托给其他智能体
20XX？	闭合循环	未来，智能体可能具备足够能力自行构建和训练模型。若此发生，未来版本的Claude可能由Claude自身持续改进

一、来自外部世界的证据

AI模型的改进速度正在加快。它们能够可靠独立完成任务的时长大约每四个月翻一番，早于此前每七个月翻一番的趋势。

具体来看：

2024年3月，Claude Opus 3能完成人类约需4分钟完成的软件任务。

一年后（2025年3月），Claude Sonnet 3.7能完成约需1.5小时的任务。

再一年后（2026年），Claude Opus 4.6能完成12小时的任务。

若此趋势持续，需要熟练人员数天完成的任务可能在今年（2026年）进入AI能力范围。2027年，AI系统可能具备完成需要人类数周工作的任务的能力。

同样的模式出现在编程和研究基准测试上。SWE-bench是真实软件工程的标准测试：给模型一个真实开源代码库和真实bug报告，要求其编写修复代码并通过项目自身测试。模型从个位数得分到两年内饱和该基准。

CORE-Bench测试模型是否能复现已有研究——这是进行原创研究的前提条件。它向AI模型提供已发表论文背后的代码和数据，要求其重新运行所有步骤并确认能复制论文结果。AI系统从2024年约20%的成功率到15个月后饱和该基准。

METR——运行衡量模型完成长时任务能力的基准测试的机构——发现Claude Mythos Preview能工作"至少"16小时，处于"METR无需新任务即可测量的上限。"

公开基准测试能说明很多关于这些系统能力的内容。但它们无法揭示AI系统对加速AI开发本身的影响。为此，我们需要来自AI公司内部的直接证据——比如Anthropic。

二、来自Anthropic内部的证据

构建前沿模型需要两大类工作：一是工程——编写代码、搭建基础设施、监督模型训练；二是研究——决定运行哪些实验、解读结果、确定下一步尝试哪些想法。

在工程和研究两方面，整体情况一致。在工程方面，Claude可以接受一个未充分定义的问题并自行解决；人类提供目标，但不再需要提供方法。在研究方面，Claude已能在执行明确定义的实验方面与熟练人类相当甚至超越。然而，在自主选择目标的判断力方面——无论是工程还是研究——Claude与人类之间仍存在较大差距。这正是今日AI与未来能自主设计继任者的系统之间的差距。

Anthropic员工随经验增长承担的任务分为三个层级：

初级：执行他人指定的任务，如"导出按钮不工作，请修复。"

中级：获得目标后自行设计方案，如"调查为何网络在高负载下变慢。"

高级：决定哪些问题值得解决，如"团队下季度应构建什么？"

2.1 Claude编写了Anthropic大量代码

截至2026年5月，Anthropic合并到代码库中超过80%的代码由Claude编写。在2025年2月Claude Code研究预览版发布之前，这一数字仅为个位数。

每位工程师每天合并的代码行数在Anthropic前四年（2021-2024）保持不变，2025年开始攀升（当Claude开始运行代码而非仅为工程师复制粘贴提供建议时），2026年再次加速（模型开始在更长时间跨度内自主工作）。这两个拐点在下图中清晰可见。在2026年第二季度，典型工程师每天合并的代码量是2024年的8倍。（GitHub——全球大多数软件构建于其上的平台——2025年全年约有十亿次代码提交；到2026年中，每周有2.75亿次，全年预计约140亿次。其COO表示，仅为跟上步伐就在"极力推进"容量扩展。）

需要注意的是：代码行数是一个不完美的衡量标准，它衡量数量而非质量。因此2026年Q2的8倍/人/天代码量几乎肯定高估了真正的生产力提升。但它确实表明加速正在发生。在Anthropic，我们不以代码行数奖励人；团队成员生产更多代码仅仅是因为他们在使用AI系统编写更多代码。

代码量的增加与员工对生产力大幅提升的主观感受一致。在2026年3月对来自Anthropic各研究团队的130名员工的调查中，中位受访者估计，使用Mythos Preview后，他们在原本也要进行的项目类型上，产出量大约是不使用任何AI模型时的4倍。

我们还看到证据表明，Anthropic员工使用Claude完成那些原本根本不会发生的工作，比如构建探索性工具和处理长期搁置的清理工作。例如，2026年4月，Claude提交了超过800个修复，将某类API错误减少了1000倍。监督Claude的工程师估计，人类完成这项工作需要四年时间——解决他人的bug既缓慢又费力，人类难以同时掌握如此多的陌生上下文。

"大约一年前我开始大力'Claudify'（用Claude化）。那是一段疯狂的历程，现在已经约5个月没有自己写过任何代码了。"

—— Anthropic员工

2.2 Claude编写的代码质量良好且持续提升

"好代码"意味着两点：它能运行，且写法让其他工程师能理解并在此基础上构建。

第一标准（能运行）的证据很清晰。Anthropic员工纠正、重定向或中途接管Claude任务的比率已持续下降一年，包括最复杂、最开放的任务。这意味着那些没有明确规格、工程师也不确定答案长什么样的问题。在最开放的任务上，Claude的成功率在2026年5月达到76%，六个月内提升了50个百分点。

一个典型案例：一次例行升级导致数万个训练任务崩溃。工程师仅凭一些文本内容和集群访问权限将Claude指向实时事故。Claude逐一检查运行中的任务并测试每个环境设置，找出触发崩溃的那个晦涩调试标志，可靠地复现了问题，并确认了修复方案。大约两小时内，Claude完成了通常需要两到三天的工作。

第二标准（可读性）：这里人类与AI之间的差距仍然存在，但正在迅速缩小。Anthropic内部尚未达成完全共识，但许多人认为，Claude编写的代码在2025年底仍劣于Anthropic人类编写的代码，目前大致持平，预计一年内将严格优于人类。

"Claude编写的代码在2025年底略逊于Anthropic人类代码，目前大致持平，预计一年内将严格优于人类。"

这已经改变了Anthropic审查代码的方式。对代码库的修改提案现在由自动化Claude审查器在合并前检查bug、安全漏洞等缺陷。我们进行了回溯分析，发现对代码库每次变更进行自动化Claude审查，将能在生产前捕获约三分之一的历史事故背后的bug。编写这些代码的工程师是全球构建这类系统的最优秀人才——而Claude正在捕捉他们遗漏的错误。

2.3 Claude擅长执行他人设定目标的实验

每次Anthropic发布模型时，我们都运行相同的测试：给Claude一些训练小型AI模型的代码，要求其在通过相同正确性检查的前提下尽可能加快代码运行速度。目标和成功指标是预先固定的，Claude的工作是通过重写代码、运行、计时、迭代来找到加速方案。这是一个微型版的实验研究循环。

2025年5月，Claude Opus 4平均实现了约3倍加速。到2026年4月，Claude Mythos Preview实现了约52倍加速。作为参照，熟练人类研究员需要4到8小时才能达到4倍加速。在这部分研究工作流程中——优化明确定义实验中的步骤——Claude在不到一年内从"非常有帮助"进化到超越人类。

"今天的格局大致是'人类有想法，模型能以比以前快一个数量级的速度实现、测试和评估它们'。"

—— Anthropic员工

2.4 Claude在提出自己的实验方面越来越好

2026年4月，Anthropic发布了Claude端到端运行开放式研究项目的首次演示。Claude驱动的智能体被分配了一个AI安全领域的开放问题——大致是"较弱的模型能否可靠地监督较强的模型？"——并被留下去解决。这涉及提出假设、测试、与并行智能体分享发现、迭代。

该任务有明确的性能"地板"和"天花板"：地板是弱监督者自身能做到的水平；天花板是强模型在正确答案上训练后的水平。两名人类研究员用约一周时间恢复了约23%的性能差距；智能体在800累计小时（使用约18,000美元算力）内恢复了97%。在此边界内，智能体自行设计了每一个实验。方向设定是人类扮演的唯一有意义的角色。

"Claude在1-2天内以相当少的帮助完成了这一切。我认为如果一位初级同事在同样时间内带着这样的结果回来，我会略感印象深刻。未来已来。"

—— Anthropic员工

2.5 Claude在引导研究会话走向研究发现方面越来越好

我们检查了真实的Claude Code会话（2026年1月至3月），其中Anthropic研究员正与Claude合作处理开放式调查问题，如弄清为何训练运行持续崩溃，或为何模型在某个基准上得分偏低。在每种情况下，我们都找到了研究员走弯路的时刻——他们追求的方向使会话偏航，最终才回到正轨。

然后我们只向各种Claude模型展示偏航前的工作内容，并问它会怎么做下一步。另一个能看到会话最终结果的独立Claude再判断AI还是人类选择了更好的下一步。在2025年11月，我们最好的模型（Opus 4.5）在51%的情况下优于人类选择；到2026年4月（Mythos Preview），这一比例升至64%。

研究的日常工作很大程度上就是这些下一步决策的链条，因此这是衡量模型最终能否独立运行调查的相关指标。我们将这一结果视为AI系统正在变得更好的早期信号，就在做出AI研究所依赖的那类判断决策方面。

"目前人类的比较优势仍在于看到更大的图景，以及超越眼前任务的思考。"

—— Anthropic员工

三、Anthropic未来的工作形态

证据表明，人类角色在AI开发流程的每个步骤中都在收窄。

一旦人类和AI编写的代码质量达到同等水平，人类将停止编写代码，转而只审查代码。但如果他们审查代码的速度跟不上Claude生成代码的速度，人类审查将成为AI开发的瓶颈。

类似地，一旦Claude能运行实验，问题就转向"这些实验中哪些值得运行？"

简而言之："做"（编写代码、运行实验、产出结果）现在几乎不需要人类时间，即使仍有算力成本。

目前人类的比较优势在于：研究品味和判断力，包括选择哪些问题重要，哪些结果可信，何时某种方法走入死胡同。

"工作（和生活）建立在人与人之间小恩惠的礼物经济上。'你能帮我运行这个脚本吗？'……每一个都创造了一点债务，一点相互意识。[Claude]更快，它不产生债务，但每一次都是失去的人类协作机会。"

—— Anthropic员工

"在一切顺利的日子里，我不禁觉得我做的一切都无关紧要，一切都被自动化了，比我永远能做到的更好更快。但随后有些日子一切都崩溃了，我不明白为什么，我意识到我不再知道自己一直在做什么了。"

—— Anthropic员工

四、如果我们错了怎么办？

对上述证据的一个自然反驳是：仍在人类手中的工作——选择解决哪些问题——才是最重要的。没有这种判断力，Claude是一个有能力的助手，但不是能自主推动AI进步的系统。

目前确实不清楚今天的训练方法和架构是否能解锁这种能力。但AI很少通过"尤里卡！"时刻取得进步。AI近期历史上有过几次这样的时刻，如Transformer架构或混合专家模型，但范式转变的想法每隔几年才出现一次。在两次之间，大多数进步是渐进的：我们扩大规模，看看什么出问题，修复它，再试一次——这正是Claude现在擅长的工作流程。

爱迪生说天才是1%的灵感和99%的汗水。但我们看到汗水正越来越多地被自动化。越来越清晰的是，推动前沿的大部分工作是可以自动化的；大规模研究进步主要是工具和资源的函数，它们决定你能多快运行实验、同时运行多少个实验、以及多快能获得结果。

即使假设Claude永远无法获得良好的研究品味，保守解读仍意味着复合式加速。如果人类将大部分时间花在个位数比例的方向设定工作上，而Claude处理其余工作，那么每位工程师或研究员将引导比以前多得多的工作。我们看到的证据表明，Anthropic员工既在加快速度，又在拓展覆盖面。

五、可能的未来

接下来发生什么取决于两件事：趋势是否持续，以及如果持续，我们选择做什么。我们至少可以设想三种未来情景：

情景一：趋势停滞，但今日AI能力广泛扩散

本文展示了许多指数级轨迹。但这些轨迹实际上可能是S曲线——我们可能正接近曲线的弯折点，规模回报递减，线趋于平直，然后趋于平坦。区分有能力研究员和优秀研究员的判断力，可能是一种无法通过扩大训练输入（如算力和数据）获得的能力。如果是这样，越过这一瓶颈将需要新的想法，比如一种取代当前所有前沿模型使用的Transformer架构的新方法。

即使模型能力冻结在今日水平，世界也将发生重大变化。Project Glasswing是早期信号之一：在最初几周内，Mythos Preview在全球最重要的系统中发现了一万多个高危和严重级别的软件漏洞——网络防御的瓶颈已经从发现漏洞转向修补漏洞不够快。而今日模型向更广泛经济的扩散仍处于早期阶段：一个100人的公司越来越能够完成千人组织的工作，因为每位员工将坐拥一个智能体金字塔。

我们将此情景纳入讨论以求完整，但我们认为它不太可能。每一个我们能测量的能力，包括那些感觉"更软性"的（如代码质量和开放式任务成功率），都遵循了相同的曲线。我们尚未看到曲线弯折。三种情景中，这一种将为政府和社会提供最多适应时间。我们更担心接下来两种，它们将进展更快，留给准备的时间更少。

情景二：AI实验室持续看到复合式效率提升

在此情景中，AI开发大幅自动化，但人类继续设定研究方向和判断结果。随着时间推移，使用AI系统的组织将变得极其高效——100人公司可以完成1万乃至10万人组织的工作。

这将彻底改变知识工作和政府服务，但也可能被用于有害目的：从对全体人口的威权监控，到针对个人定制、以人类团队无法企及的规模运行的影响力操控。在Anthropic这样的公司，人类角色将转向：人们与AI系统合作，规模化地推进研究并生成新洞察，共同构建验证AI输出可信度所需的系统。

加速过程的某一部分往往只是将瓶颈转移到别处：整体速度被未加速的部分所限制。在计算领域，这被称为阿姆达尔定律，同样的逻辑适用于组织。Anthropic已经遇到了阿姆达尔定律的一个特征：随着我们推送更多代码，人工代码审查已经成为新瓶颈。

我们在工程之外也遇到了这种摩擦。由于Anthropic员工与高能力模型合作，新想法、新倡议、新工具和新模拟呈爆炸式增长——远超我们能够跟进的能力。组织发现和修复这些瓶颈的速度可能是一项会随时间提升的技能，也可能成为任何组织中最重要的技能。

我们在此呈现的证据表明，我们很可能正走向这一情景。

情景三：AI系统本身具备完全递归自我改进能力，开始构建继任者

如果技术趋势在推进能力方面持续，且AI系统能够发展出变革性人类创造力所固有的能力，那么AI系统设计和完善自身是可能的。

在这个世界里，AI开发的进展速度完全由算力可用性决定（或由算法训练或推理中各类效率的发现速度决定）。人类在开发中扮演的角色大幅缩减，我们的主要精力可能转向监督、验证和核实一个由AI系统运营的不断扩大的"虚拟实验室"。我们预计，能够自动化AI研发的系统将具有可迁移到其他科学领域的技能，使其能开始革新其他领域。

在这一未来中，对齐问题如何解决（或未解决）是我们最不确定的。模型可能足够对齐、研究品味足够高，能发现并实施我们尚未到达的新颖解决方案。它们也可能足够明智，在条件不具备时暂停开发。或者，今日模型中罕见的错位现象可能随着模型构建继任者而复合，变得更加频繁但更难理解，直到我们失去控制。我们可能无法构建、整合和验证理解我们实际处于哪条趋势线所需的工具。

我们对这个世界会是什么样子没有良好的直觉，因为当前的经济由人类和人类构建的工具驱动。就其本质而言，一个由快速递归自我改进驱动的世界可能被自我改进的模型所主导，因为其能力完全超越人类，且该模型在整个经济中扩散。如果人类劳动不再具有竞争力，经济会是什么样子，难以预测。

即使模型开发完全自动化和递归化，我们也无法预测这对大多数人类的日常生活意味着什么。阿姆达尔定律在此同样适用。递归智能可能导致快速实现《慈爱机器》中概述的许多好处——在某些领域快速实现。我们预计具身智能（机器人技术）可能紧随递归智能之后，沿着类似的路径——以递减成本获得递增回报。更强大的智能可能帮助我们在物理世界中更快建造、开展更高效的救命药物临床试验、发展新型协调形式。

但仅靠实现递归自我改进并不意味着工业生产方式、社会组织方式或市场运作方式立即改变。更强的智能无法了解药物在数十年使用中的作用，无法在宪法规定时间之前举行选举，也无法在一个周末将陌生人变成老友。对大多数人来说，这一未来的感知节奏仍将由瓶颈决定，即使上游实验室以算力的速度运行。这种碰撞——递归智能以越来越快的速度自我构建，撞上人类、关系和治理的世界——是这一未来的另一部分我们无法预测的。

六、我们应该怎么做？

如果能够有效地减缓这项技术的发展，为我们应对其巨大影响争取更多时间，我们认为这很可能是一件好事。但如果减速仅仅让最不谨慎的行为者在技术上追赶上来，那可能让所有人更不安全。在缺乏全球协调机制的情况下，公司和国家政府将不得不在竞争和地缘政治压力下做出关于安全的艰难决定。

我们认为，世界拥有减缓或暂时暂停前沿AI开发的选项是有益的，以使社会结构和对齐研究能跟上技术的步伐。The Anthropic Institute将开展研究——与许多人合作——并采取行动，帮助构建可信减速或暂停所需的系统。

这些系统将使前沿AI开发者能够核实全球其他方确已停止或减缓，且坏行为者不能利用协调减速之名秘密领先。如果此类系统存在，且其他前沿或接近前沿的开发者以可核实的方式也这样做，Anthropic预计会减速或暂时暂停。

实现有意义的暂停需要多个资源充足的前沿或接近前沿的实验室，在多个国家，在相同条件下同意停止。每方都能核实其他方确实已停止。由于AI系统的独特特性，这一军控问题的可探测性（低于可核实性标准）远比其他技术更具挑战。训练运行比导弹发射井更容易隐藏，其输入是通用的，悄悄违约的激励巨大——因为在他人暂停时继续推进的人将继承领先地位。可信的暂停还必须明确触发条件、解除条件和仲裁者。

这一切在原则上并非不可能——世界已为其他复杂技术建立了核查机制（如《中程核力量条约》）——但那些机制花了数十年建立基础设施和信任。我们没有那么长时间。单一实验室的单边暂停虽然可立即实现，但收效甚微：它会改变谁是领跑者，但不会创造目前缺失的更广泛审议过程。

在未来几个月，我们将组织对话，让政策制定者、研究人员、公民社会和其他AI公司共同回答本文提出的一些问题，尤其是关于完全递归自我改进，以及如何创造更好的协调和审议选项。我们将公布讨论结果。共同调查这些问题的窗口就在这里，AI公司外部的人应该参与这一审议。

注释

1. METR的关键指标告诉你AI系统在一篮子任务上能达到50%可靠性的时间跨度，尽管在80%可靠性下趋势线看起来相同。

2. 尤其是随着它们转向更开放的格式和更难的任务（如奥林匹克级数学），由于问题和答案集中的错误（如模糊的问题陈述和无法解决的问题），基准测试通常在低于100%时饱和。

3. Anthropic领导层公开估计90%或更多的代码由Claude编写，包括脚本和实验代码。我们的>80%数字衡量的是合并到生产环境中可归因于Claude的代码行数比例。这在两方面更为保守：归因管道存在缺口，且未归因于Claude的行数包括自动生成的代码和其他非人工手写的工件。

4. 代码生产的激增正在给所有人共享的基础设施带来压力。GitHub——全球大多数软件构建于其上的平台——2025年全年约有十亿次代码提交；到2026年中，每周有2.75亿次，全年预计约140亿次。该公司COO表示，仅为跟上步伐就在"极力推进"容量扩展。

5. 此调查方法的更多细节在Claude Opus 4.7系统卡的第2.3.5节中讨论。

6. 许多受访者可能没有仔细考虑如何解释问题定义中的各种偏差或细微差别，METR最近的研究表明开发者对AI生产力提升的估计可能被高估。

7. 加速倍数的大小在很大程度上取决于起始代码留有多少改进空间，不应将其解读为真实世界的训练加速。因此绝对倍数不是需要锚定的数字。更有参考价值的是这种实验设置所能实现的同类比较，包括跨模型（过去一年从约3倍到约52倍）和与熟练人类的比较（在同一任务上4到8小时达到约4倍）。

8. 作为对判断偏差的检验，我们在另一组127个时刻上运行了相同测试，这些时刻中人类的下一步已经很强（与原始集合相反，原始集合中人类的方向有改进空间）。在那里，模型的建议仅约20%的时间被判断为更好。

* 本文中Anthropic员工的引语来自内部讨论，经许可使用。它们反映的是截至2026年5月的个人观点，而非公司官方立场。

原文链接：https://www.anthropic.com/institute/recursive-self-improvement

整理：每日天使· 如有问题欢迎留言

作者提示：所编译科技投资内容，不代表本账号立场，不构成投资建议

欢迎扫码提交信息加入我们。

上海科创金融研究院出品，纪录科创人物，投早投小投硬科技

优秀投资者、创业者可注明身份来意

私信联系：wtbrbg

关于我们 ▼

About Us