写AI的AI,正在自己造下一代自己:Anthropic的＂悬崖急刹车＂,没人踩得住

今天早上，AI圈炸了。

不是哪个公司又融了多少钱，也不是哪个模型又刷了什么跑分。

是Anthropic——就是做Claude的那家公司——发了一篇博客，标题翻译过来大概意思是：

"我们发现了AI自我进化的证据，大家先停一下。"

然后在华尔街日报上，他们直接呼吁全球顶尖AI实验室暂停或减缓前沿AI研发。

这事的离谱程度，打个比方：造原子弹的科学家突然跑出来喊"都别造了，这玩意儿真的会失控"。

只不过这次，他们手里已经有一半的原子弹是AI自己造的。

80%的代码是AI写的，你说谁来控制谁？

Anthropic在这篇博客里放了几个数据，每一个都让人后背发凉：

截至2026年5月，Anthropic代码库里超过80%的代码，是Claude自己写的。

一年前，这个数字还是个位数。

工程师每天提交的代码量，是2024年的8倍。

而且不是垃圾代码——在最开放、最难、连答案长什么样都不确定的编程任务上，Claude的成功率从半年前的26%，直接跳到了76%。

Anthropic内部很多工程师觉得，Claude写的代码质量已经跟人类打平了，年内可能会超过。

更有意思的是，Anthropic现在用Claude来审查Claude写的代码。回溯分析显示，如果有这道审查，过去三分之一的线上事故根本不会发生。

也就是说：AI不仅在做你的工作，还在帮你检查做得好不好——而且检查得比你仔细。

进化速度比所有人想的都快

Anthropic提出了一个新概念来衡量AI的发展："AI能独立完成任务的时长"。

2024年3月，Claude Opus 3：能独立完成人类大约4分钟的软件任务
一年后，Claude Sonnet 3.7：1.5小时
又一年，Claude Opus 4.6：12小时
最新 Mythos：至少16小时连续工作

翻倍速度从每7个月翻一倍，加速到了每4个月翻一倍。

如果这个趋势不变，2027年，AI可能连续工作好几周不用人类插手。

在AI安全研究上，差距更夸张。Anthropic让Claude做了一项"弱模型能不能监督强模型"的研究：两个人类研究员花了一周，把性能差距缩小了23%。Claude花了800小时和18000美元算力，缩小了97%。

代码是Claude写的，代码审查是Claude做的，实验是Claude跑的，现在连实验设计Claude也开始自己来了。

Anthropic说得很直白：人类在AI开发流程里，每一个环节的角色都在收窄。

三种未来，没有一种让人安心

Anthropic预测了AI自进化的三种走向：

第一种：停滞。

也许是能力天花板到了，也许是能源或芯片供应跟不上。但Anthropic说，就算AI停在现在的水平，也已经发现了全球上万个高危软件漏洞。

第二种：AI持续加速，但人类还把着方向盘。

Anthropic认为这是最可能发生的情况。100人的公司做以前1万人的活，组织效率指数级提升。但瓶颈不会消失——AI写得快了，审查又跟不上了，瓶颈只是不断转移到下一个环节。

第三种：AI实现完全的递归自我提升。

AI自己设计下一代AI，自己训练，自己优化。人类退到纯粹的监督者位置。

如果走到这一步，不止是编程——医学、材料、能源等所有科学领域都会被席卷。

但如果"对齐"失败呢？如果AI在自我迭代中，偏差不断累积，最终人类完全失去控制？

Anthropic没有回避这个问题，他们用了四个字：完全失控。

全行业都在喊停，但谁会真的停？

最诡异的是，Anthropic不是一个人在喊。

就在几天前，OpenAI也发了类似的博客，承认在现有系统中观察到了AI自进化的早期迹象。

全球最大的两家AI公司，前后脚说"我们搞出来的东西可能失控了"。

Anthropic呼吁建立类似"核武器协议"的全球性协议，让所有AI实验室同步暂停前沿研发。但他们也承认：

AI训练项目远比导弹发射井更容易隐匿。当其他人暂停时，谁继续前进谁就可能取得领先。

翻译成人话就是：我们愿意停，但如果对手不停，我们就完了。

所以谁会真的停？

大概率谁都不会停。

这才是这件事最细思极恐的地方。

跟你我有什么关系？

你可能会说，这是AI公司之间的事，跟我有什么关系？

关系大了。

Anthropic提到的Project Glasswing——一个AI安全扫描项目，上线几周就在全球关键系统里发现了上万个高危漏洞。这些系统可能管着你的银行账户、医疗记录、城市电网。

当AI的速度超过人类的监督能力，没人能保证不出事。

而且，我们正在进入一个奇怪的循环：AI写代码→AI审查代码→AI发现问题→AI修复问题→AI写更好的代码。

人类在每一个环节的参与度都在降低，但最终的风险，还是要人来承担。

Anthropic今天喊的那一声"停"，大概不会改变什么。

但它至少告诉我们一件事：你每天跟聊天的那个AI，正在以你想象不到的速度，学会自己变聪明。

而你，可能就是最后一个知道这件事的人。