今天早上,AI圈炸了。

不是哪个公司又融了多少钱,也不是哪个模型又刷了什么跑分。
是Anthropic——就是做Claude的那家公司——发了一篇博客,标题翻译过来大概意思是:
"我们发现了AI自我进化的证据,大家先停一下。"
然后在华尔街日报上,他们直接呼吁全球顶尖AI实验室暂停或减缓前沿AI研发。
这事的离谱程度,打个比方:造原子弹的科学家突然跑出来喊"都别造了,这玩意儿真的会失控"。
只不过这次,他们手里已经有一半的原子弹是AI自己造的。
Anthropic在这篇博客里放了几个数据,每一个都让人后背发凉:
截至2026年5月,Anthropic代码库里超过80%的代码,是Claude自己写的。
一年前,这个数字还是个位数。
工程师每天提交的代码量,是2024年的8倍。
而且不是垃圾代码——在最开放、最难、连答案长什么样都不确定的编程任务上,Claude的成功率从半年前的26%,直接跳到了76%。
Anthropic内部很多工程师觉得,Claude写的代码质量已经跟人类打平了,年内可能会超过。
更有意思的是,Anthropic现在用Claude来审查Claude写的代码。回溯分析显示,如果有这道审查,过去三分之一的线上事故根本不会发生。
也就是说:AI不仅在做你的工作,还在帮你检查做得好不好——而且检查得比你仔细。
Anthropic提出了一个新概念来衡量AI的发展:"AI能独立完成任务的时长"。
2024年3月,Claude Opus 3:能独立完成人类大约4分钟的软件任务 一年后,Claude Sonnet 3.7:1.5小时 又一年,Claude Opus 4.6:12小时 最新 Mythos:至少16小时连续工作
翻倍速度从每7个月翻一倍,加速到了每4个月翻一倍。
如果这个趋势不变,2027年,AI可能连续工作好几周不用人类插手。
在AI安全研究上,差距更夸张。Anthropic让Claude做了一项"弱模型能不能监督强模型"的研究:两个人类研究员花了一周,把性能差距缩小了23%。Claude花了800小时和18000美元算力,缩小了97%。
代码是Claude写的,代码审查是Claude做的,实验是Claude跑的,现在连实验设计Claude也开始自己来了。
Anthropic说得很直白:人类在AI开发流程里,每一个环节的角色都在收窄。
Anthropic预测了AI自进化的三种走向:
第一种:停滞。
也许是能力天花板到了,也许是能源或芯片供应跟不上。但Anthropic说,就算AI停在现在的水平,也已经发现了全球上万个高危软件漏洞。
第二种:AI持续加速,但人类还把着方向盘。
Anthropic认为这是最可能发生的情况。100人的公司做以前1万人的活,组织效率指数级提升。但瓶颈不会消失——AI写得快了,审查又跟不上了,瓶颈只是不断转移到下一个环节。
第三种:AI实现完全的递归自我提升。
AI自己设计下一代AI,自己训练,自己优化。人类退到纯粹的监督者位置。
如果走到这一步,不止是编程——医学、材料、能源等所有科学领域都会被席卷。
但如果"对齐"失败呢?如果AI在自我迭代中,偏差不断累积,最终人类完全失去控制?
Anthropic没有回避这个问题,他们用了四个字:完全失控。

最诡异的是,Anthropic不是一个人在喊。
就在几天前,OpenAI也发了类似的博客,承认在现有系统中观察到了AI自进化的早期迹象。
全球最大的两家AI公司,前后脚说"我们搞出来的东西可能失控了"。
Anthropic呼吁建立类似"核武器协议"的全球性协议,让所有AI实验室同步暂停前沿研发。但他们也承认:
AI训练项目远比导弹发射井更容易隐匿。当其他人暂停时,谁继续前进谁就可能取得领先。
翻译成人话就是:我们愿意停,但如果对手不停,我们就完了。
所以谁会真的停?
大概率谁都不会停。
这才是这件事最细思极恐的地方。
你可能会说,这是AI公司之间的事,跟我有什么关系?
关系大了。
Anthropic提到的Project Glasswing——一个AI安全扫描项目,上线几周就在全球关键系统里发现了上万个高危漏洞。这些系统可能管着你的银行账户、医疗记录、城市电网。
当AI的速度超过人类的监督能力,没人能保证不出事。
而且,我们正在进入一个奇怪的循环:AI写代码→AI审查代码→AI发现问题→AI修复问题→AI写更好的代码。
人类在每一个环节的参与度都在降低,但最终的风险,还是要人来承担。
Anthropic今天喊的那一声"停",大概不会改变什么。
但它至少告诉我们一件事:你每天跟聊天的那个AI,正在以你想象不到的速度,学会自己变聪明。
而你,可能就是最后一个知道这件事的人。
夜雨聆风