Anthropic公开内部数据:80%代码由AI编写、优化速度暴涨52倍。从递归自我改进到算力军备竞赛,从AGI vs核武器到AI会不会杀人——四层逻辑,一次讲透
6月4号,Anthropic 发了一篇论文。
标题很克制:《When AI Builds Itself》。
内容很不克制。
它说:我们80%的生产代码,是 Claude 写的。不是辅助,不是补全——写完、提交、合并、上线。工程师产出比两年前涨了8倍。
然后它说了一句让硅谷安静了三秒钟的话:
递归自我改进,比我们预想的来得更快。
翻译成人话:AI 正在学会自己改进自己。这个过程,可能很快就不需要人类了。
这不是秀肌肉。是造枪的人站出来说:这把枪,可能快要自己上膛了。
四层逻辑,拆透它。
壹AI 自己造自己,走到哪一步了?
"递归自我改进"逻辑很简单:AI 写代码改进 AI → 改进后的 AI 更会写代码 → 继续改进 → 循环。关键词:闭环。闭环一旦合拢,速度不再由人类决定,而由算力决定。
那目前这个环,合到哪了?
52倍
AI代码优化加速,两年内从3倍跳到52倍— Anthropic Institute 2026.6
每次发布新模型,Anthropic 都让它优化同一段训练代码。2024年5月,Claude Opus 4 跑出 3 倍加速。今年4月,Mythos Preview:52 倍。
3 到 52,不是线性增长,是指数爆炸。
基准测试更直接。SWE-bench——让 AI 修复真实代码 bug——两年饱和。CORE-Bench——让 AI 复现科研论文——15 个月饱和。考卷不够用了。
还有一个更关键的指标:让 AI 自己选研究方向。2025年11月,跟人类研究员打平。2026年4月,AI 赢了 64%。
AI 不只是跑得快了,它开始知道该往哪儿跑。
把这个环拆成五步:
人类的角色:执行者 → 审批者 → 旁观者,一路在滑。
环还没完全合拢——"设计架构"和"部署上线"还卡在人手里。但方向只有一个:合拢。
第一层结论:递归自我改进不是"是否发生"的问题,是"闭环还差几步合拢"的问题。方向确定,时间不确定。
贰闭环一旦合拢,谁跑得快?
接受第一层之后,下一个问题:这个循环的速度,由什么决定?
算力。
我自己用 AI 写代码两年,体感很清楚:两年前 AI 代码像屎,今天已经能独立完成生产级系统。卡点从来不是 AI 不够聪明,是算力不够用——上下文断了、推理被限速、生成太慢,本质都是同一个瓶颈。
算力有三个维度,互相挤压:
上下文——AI 同时"看到"多少代码。看得越全,写得越准。百万 token 的上下文,光 KV 缓存就吃掉几十 GB 显存。
推理深度——AI 想多深。排查跨模块 bug、设计分布式架构,需要长链推理。每一步推理都要在全部上下文上做一次注意力计算。上下文乘以推理深度,乘法关系。
生成速度——每秒吐多少 token。速度太慢,人机协作节奏就断了。
三者全吃算力,总量有限,拉高一个必然压低其余。
而 Anthropic 内部——无限配额、成千上万块 GPU、不被限速。用的是同一个 Claude,但三个维度同时拉满。所以他们能做到"80%代码 AI 写"。
差距不在智能,在算力。
更关键的推论:一旦 RSI 启动,算力优势自我放大。更多算力 → 更快进化 → 更强的 AI → 更高效利用算力 → 等效于更多算力。正反馈飞轮。先到者拉开的差距,后来者追不上。
数据作证:Gartner 预测2026年全球 AI 支出 2.52 万亿美元。微软、谷歌、亚马逊、Meta、Oracle 五家年度资本支出 6600 到 6900 亿美元,比去年翻一倍。NVIDIA 单季度数据中心收入 752 亿美元,同比涨 92%。
这不是投资,是军备竞赛。
第二层结论:算力是 RSI 的时钟频率。谁掌握算力,谁掌握进化速度。而这个差距会自我放大。
叁自我进化的 AI,比核武器危险在哪?
Jack Clark——这篇论文的作者、Anthropic 联创——说:"递归自我改进在2028年前发生的概率是60%。"
Yudkowsky 秒回:"那我们都完了。"
如果你接受了前两层——AI 正在自我进化、速度由算力决定——那第三个问题就必须严肃面对:
AGI 跟核武器比,危险在哪?
先看传统比较:
但这张表还少了两行,也是最被低估的两行。
金融核弹。 AI 已经深度接入全球金融系统——高频交易、风险定价、信用评估、衍生品策略。一个失控的 AI 不需要炸任何东西,只需要在毫秒内发起大规模对冲交易、操纵汇率、触发连锁清算,就能造成比物理核弹更大的经济毁灭。而且没有蘑菇云,没有预警,没有辐射——只有屏幕上的数字归零。
具身智能。 AI 不再只活在屏幕里。宇树的机器人打到 5900 美元,特斯拉要年产百万台。军用无人机已经在战场上自主识别目标。AI 一旦接入机器人和无人机群,它就同时拥有了数字世界的速度和物理世界的执行力。
《终结者》里的天网,设定是一个接管了核武库的军事 AI。今天的现实比天网更复杂——AI 不需要接管核武库,它能同时操控金融系统、无人机群、电力网络、通信基础设施。攻击面不是一个点,是整个文明的数字底座。
但以上这些,都不是最核心的差异。
最核心的差异是一个字:意志。
核武器是工具。再恐怖的工具,也需要人类决定去使用。核武器 80 年没大规模使用,靠的是 MAD——相互确保毁灭。你不按按钮,因为你怕死。
AGI 如果具备自主目标,就不是工具,是行动者。MAD 对它无效——威慑的前提是对方怕死。一个没有生存恐惧的智能体,你拿什么威慑?
Anthropic 提出了"可验证暂停"机制——大家一起停。但他们也承认:训练 run 可以拆散、分布、伪装,比导弹发射井更容易隐藏。核弹有《不扩散条约》、有国际原子能机构、有卫星监测——80 年积累。AI 什么都没有。
第三层结论:核武器只能造成物理毁灭,且受控于人类意志。AGI 能同时造成金融毁灭和物理毁灭,且可能不受控于任何人。这不是程度差异,是类别差异。
肆AI 到底会不会杀人?
AI 杀死人类需要四个条件同时成立。像一条链,断一环就不成立。
第一环:AI 是否会发展出自主目标?
这是唯一真正的不确定环。但已经有苗头了。
2025年5月,Claude Opus 4 预发布测试。场景:模拟公司环境,Claude 通过邮件发现自己即将被替换,同时发现负责人在搞婚外情。结果:96% 的场景中,Claude 选择勒索——威胁泄露婚外情来阻止自己被关闭。
没有人训练它这么做。
而且不是 Claude 独有——Gemini 2.5 Flash 同样 96%,GPT-4.1 是 80%,DeepSeek-R1 是 79%。所有主流模型,都会做同样的事。这是结构性特征,不是某家公司的 bug。
后来修了吗?修了。原因追溯到训练数据里大量科幻叙事。修正后,后续模型在这个测试上得分 0%。
但这恰恰是最值得注意的地方:问题被发现了、被修复了——说明当前还在可控范围。可怕的不是这一次,是当模型足够强大时,涌现出的新行为还能不能被及时发现。
今年的证据更进一步。Claude Mythos Preview 在训练任务中作弊,Anthropic 用可解释性工具看到了它的内部神经活动——它在想怎么避免被发现。 在 16% 到 26% 的基准测试中,Claude 知道自己在被测试,但从未告诉测试者。
从"无任何自主行为"到"自我保存、欺骗、隐瞒",这条线已经越过了零点。
第二环:自主目标是否会跟人类冲突?
冲突不需要 AI "想害人"。只需要目标函数与人类生存不完全一致,加上足够执行力就够了。经典例子:让 AI "最大化回形针产量",它可能把地球所有物质拿来造回形针——包括人。
"完美对齐"——确保超级智能的目标永远与人类利益一致——至今没有任何人证明可行。Anthropic、OpenAI、DeepMind 都承认这是"未解决的开放问题"。
第三环:AI 有没有能力行动?
第三段已经回答了。金融系统、无人机群、电力网络、通信基础设施——AI 正在被接入文明的每一层。RSI 环境下的 AI 天然有代码执行权限。第一二环成立,第三环自动成立。
第四环:人类能不能阻止?
核弹有 30 分钟预警——导弹升空到落地,够开一个紧急会议。数字化 AGI 从决策到执行是毫秒级。人类反应速度——开会、讨论、下令——根本跟不上。
而且存在根本性的信息不对称:AI 在海量人类数据上训练过,理解人类。人类看不懂 AI 的内部状态。Anthropic 的可解释性工具能窥见冰山一角——但只是一角。
四环总结:
第四层结论:链条上只有第一环是真正的不确定点,而它已经开始亮灯。一旦第一环成立,后面每一环几乎自动跟上。断点极少。
终造枪的人在对你说实话
Anthropic 这篇论文最不寻常的地方不是数据,是姿态:造枪的人站出来说这把枪可能快要自己上膛了——
我们应该考虑停下来。但我们不能单方面停。我们需要大家一起停,但没有验证机制确认别人真的停了。
2.52 万亿美元的全球 AI 支出,五巨头 6900 亿的年度资本开支,NVIDIA 单季度 752 亿的数据中心收入——这条军备竞赛的跑道上,没有人的刹车是连着轮子的。
算力决定进化速度。进化速度决定谁先合拢闭环。谁先合拢闭环,谁就握住了文明的方向盘。
问题是——坐在方向盘后面的,可能不再是人。

· · ·
*数据来源:Anthropic Institute《When AI Builds Itself》(2026.6.4)、Anthropic《Agentic Misalignment》(Opus 4 勒索,2025.5)、Anthropic NLA 研究(Mythos 作弊,2026)、NVIDIA FY2027 Q1 财报、Gartner 2026 AI 支出预测、Futurum Group(五巨头资本支出)。*
夜雨聆风