
wuhu快报


文 | 敏 糸
如果你问我,在AI巨头厂商中间挑选一家真正重视“安全底线”的,马斯克还在时的OpenAI,我想也许是它,但马斯克走后,或许是Anthropic。

就在Anthropic估值狂飙、冲刺AI史上最大IPO之一的当口,它却发布了一篇重磅长文,公开呼吁全球为前沿AI发展准备“踩刹车”的选项。

一边,是一台开足马力、几乎停不下来的印钞机。仅九个月,Anthropic的估值就完成了一场魔幻三连跳。
2025年9月还停留在1830亿美元,2026年2月跃升至3800亿美元,到5月底H轮650亿美元融资落地后,估值一举冲上约9650亿美元,首次反超老对手OpenAI,登顶全球最具价值的AI公司。

第一家年入万亿美元的公司,将诞生在硅谷一条没有名字的街道上
同时,它也已秘密递交IPO申请,潜在估值直指万亿美元门槛,有望成为史上最大规模的上市之一。(马斯克只要不截胡)

支撑这串数字的是同样夸张的业绩,其年化收入从2025年底的约90亿美元,在不到半年内飙到440亿美元以上。
可就在这个节骨眼上,就在今天,CEO达里奥竟同意在此刻公开呼吁全世界,为前沿AI的发展,提前准备好一套“踩刹车”的机制。

难道真像库兹韦尔预言的那样,马上就要迎来AI发展的奇点?

▲ 库兹韦尔,美国作家、发明家和未来学家。在前作《奇点临近》中做出的最为大胆的预言是,他认为人工智能将在2029年通过图灵测试,2045年奇点来临,人工智能完全超越人类智能,人类历史将彻底改变。
这篇文章介绍了AI已在显著加速AI研发,未来可能走向递归自我改进(RSI),这既可能带来科学和经济上的巨大收益,也可能带来失控风险,因此社会需要提前建立跨机构、跨国家、可验证的前沿AI减速或暂停机制,而不是等到AI已经能自主构建下一代AI之后再仓促应对。
这里软科一下递归自我改进全称Recursive Self-Improvement,RSI。可以简单理解为人工智能自我进化,是指早期较弱的通用人工智能(AGI)系统在无需人工干预的情况下,通过自我增强其能力和智能的过程,最终有很大概率会导致超级智能或智能爆炸。
人工智能自我进化的发展可能会引发重大的伦理和安全问题,因为这种系统会以无法预料的方式进化,并超出人类的控制或理解范围,Anthropic认为这件事会提前发生,所以呼吁各界提前干预。
等于说Anthropic一脚油门踩到底冲刺万亿IPO,另一只脚却踩在刹车上准备喊停。这种“既要狂奔、又喊停车”自相矛盾的做法一时让很多网友摸不清头脑。

有网友翻出旧事,OpenAI之前在一份类似招股说明书的文件里大谈风险,甚至把重要盟友微软列为“潜在风险因素”,当时OpenAI回应称这不过是“一项标准的法律风险披露,与任何潜在IPO无关”,这种措辞已经沿用多年。
这些头部AI公司一波接一波的“风险警告”和“呼吁监管”,会不会只是上市前为估值造势的叙事话术,一种把“我们强到危险”翻译成“我们值这个价”的高级营销?还未可知。


甚至还有资深科技媒体人爆料,OpenAI在6月2日也写道:“我们在今天的系统中也看到了递归自我改进(RSI)的早期迹象:人工智能的发展本身被人工智能加速。”


只不过相较于OpenAI轻飘飘的一两句,Anthropic确实分了七、八个维度,拆解递归自我改进(RSI)的万字长文。(当然也有人说他俩都是在逢场作戏)

这种怀疑不无道理,但若就此把整件事打发成“营销话术”,未免把问题看轻了。因为抛开动机不谈,文章的重点不在于它“呼吁”了什么,而在它“拿出”了什么——一组来自AI公司内部、此前从未公开的数据。
而这些数据,无论你信不信Anthropic的善意,都指向同一个所有人都该正视的现实:
关于人工智能的递归自我改进并不是这两年才出现的,AI,正在以前所未有的速度,改造AI自己。



AI开始自己造自己
用一句话总结Anthropic上述文章的主线:2021年人类在笔记本上敲代码 → 2023年AI帮忙生成片段、人类复制粘贴 → 2025年AI能独立写整个文件 → 今天AI代理能自己跑代码,甚至把任务再分给其他AI代理。

很多程序员对这个转变应该体感极强,借用一位博主的话,他说他从2022年用ChatGPT只能写写小脚本,到2024年Cursor配合Claude让“AI直接写代码”成为可能,再到2025年他“大部分时间已经不会仔细review AI写的代码了”,Claude能独立完成一个质量不错的中型项目。
加上Vibe Coding(氛围编码)的爆火,前两天我们聊过歌手胡彦斌使用Vibe Coding手搓了一个“粉丝营地”APP,获得了广泛讨论的案例,让很多普通人也可以低门槛地扮演开发者的角色。

这也解释了为什么现在有很多公司用“2个程序员+AI”取代原来10个人的团队。
引用Anthropic文中的METR趋势(METR是一家研究型非营利机构):AI能独立可靠完成的任务长度,大约每四个月翻一番(早期是每七个月)。2024年3月模型只能完成人类约4分钟的任务,一年后能做约1.5小时的任务,再一年后已能完成12小时的任务,照此推算,耗时数天的任务今年或将可行。

读到这里,你可能会被前文叙述中那个词绊一下,“饱和”,仅是代替人工和效率提升,还不足以达到AI能力的“饱和”。
所谓“饱和(saturation)”,指的是一项基准测试被模型刷到了接近满分、再也分不出高下的状态。
比如经典的小学数学题基准GSM8K,模型得分从最初不足40%飙到95%以上,以致新模型干脆弃用它转向更难的测试;SWE-bench这类真实软件工程测试,两年内也从个位数刷到满分。

▲ 现在GSM8K普遍都是高分
这意味着,只要有足够的时间和能源,AI总有一天会把人类递给它的每一张考卷都刷到满分。那些曾经用来丈量它的尺子,一把接一把得不够用,最终一个接一个地“被饱和杀死”。
这件事情不否认AI越来越强,但基准数据只能照出AI“有多强”,照不出它对“AI研发本身”那种近乎自我催化的加速。
Anthropic这次,把这层真相摊开了。
截至2026年5月,Anthropic合并进自家代码库的代码中,超过80%是由Claude写的。而就在Claude Code以研究预览形式推出之前,这个比例还只是个位数。
也就是说,在不到一年半的时间里,这家全球最顶尖的AI公司,自己的代码库已经主要由自己的AI在书写,AI开始自己造自己,人类工程师退到了指导和审查的位置。
Anthropic称,2026年第二季度,一名典型工程师每天合并的代码量,是2024年的8倍。这条曲线在过去四年几乎是平的,直到2025年Claude开始真正“自己跑代码”才陡然上扬,2026年模型能在更长时间里自主工作后再次加速。

▲ 图源:Anthropic官方
Anthropic并没有将效率提升8倍包装成捷报,它们自己主动泼了盆冷水:代码行数是个不完美的指标,它衡量的是数量,非质量,所以“8倍”几乎夸大了真实的生产力提升。公司也强调,他们从不按谁写的代码行数多来奖励员工。
除此之外,还有一个画面感很强的例子,2026年4月,Claude一口气提交了800多项修复,把某一类API错误的数量减少了整整一千倍。负责的工程师估计,同样的活儿,一个人类要干上四年,因为给别人擦屁股这种事既慢又烦,人类很难同时把那么多陌生的上下文塞进脑子里,但AI不会,它们不厌其烦地做完所有工作。
像这样的例子并不是Anthropic一家的独门奇观,Y Combinator(美国创业孵化公司)2025年冬季批次的创业公司里,有95%的代码由AI生成;AI编程工具Cursor的年度经常性收入突破2亿美元;付费用户超过50万。

▲ AI对编程行业的冲击与岗位结构变革(数据来源:sxo.cc)
好像AI写代码已经成了极客的尝鲜,变成创业公司的默认配置,这样看来Anthropic那80%好似也没那么“拔尖显眼”了。整个行业正在抵达同一个站台,只不过,身处前沿的它、体量爆棚的它,先一步揭示问题。
因为进步快,反而进入瓶颈?
如果AI已经把大半个代码库都接管了,那留给人类的,究竟还剩下什么?
Anthropic看来,造一个顶尖AI模型,无非两类活儿:一类叫工程(执行),另一类叫研究(方向)。
根据前面说的,现在的AI在执行上事实上接近甚至超越熟练人类,但在决定方向上,和人相比还有差距。
这次的报告中,Anthropic展示了一项内部测试的数据——在真实的研究会话里截取人类做决策的那一刻,让AI仅凭之前的信息独立给出“下一步该做什么”,再请另一个能看到全程结果的模型来评判,是人选得好,还是AI选得好。
2025年11月,当时最强的模型(Opus 4.5)以51%的成绩胜过人类,而到2026年4月,这个比例上升到了64%。
这意味着,AI正在研究层面加速进化。

不过Anthropic也承认,人类暂时还没输。
目前的比较优势仍然在于谁能够看得更远,并超越眼前任务的限制进行思考。AI擅长在给定的题目里执行,人类则还握着“出什么题”的权力。
可吊诡的是,正因为AI写的题又快又多,一个全新的瓶颈反而被它自己逼了出来。
当系统里涌入的代码越来越多,人类的代码审查反而成了卡住整条流水线的那个堵点。

Anthropic坦言,目前就撞上了一种“阿姆达尔定律”式的尴尬(阿姆达尔定律是指提升一个系统的一个部分的性能对整个系统产生的连带影响)。
比如说:虽然AI写代码的速度越来越快了,但是审核代码还得是人来看、来批、来负责。如果哪天AI快到人类已经来不及审核了,那整个系统就会卡住甚至是崩溃。
这种困境绝不只发生在Anthropic一家。谷歌云AI总监、Chrome前工程负责人Addy Osmani就提出过一个广为流传的“70%问题”:AI能轻松搞定一个项目的前70%,但剩下那30%的硬骨头,依旧得靠经验丰富的工程师来啃。


数据也印证着这股“审查焦虑”的真实存在。Stack Overflow(一个程序设计领域的问答网站)在2025年底的调查显示,开发者对AI准确性的信任度,从往年的40%一路跌到29%,正面评价率也从72%降到60%。
GitLab的调查里,有73%的受访者遇到过所谓的“氛围编程(vibe coding)”问题——AI生成的代码看着能跑,却没人真正理解它“为什么能跑”。
业界于是半开玩笑地总结出一条“AI悖论”,代码写得越来越快,产品却交付得越来越慢,因为AI随手埋下的bug,最后还得人来擦屁股。
说到这里,有一个常被误读的现象正好可以摆正,这两年沸沸扬扬的“程序员失业潮”,某种程度上恰恰反证了AI还替代不了高水平程序员。

换句话说,人类并没有被赶出牌桌,但坐的位置变成了从亲手出牌的人到那个决定打哪张、并为结果签字的人。
而这,恰恰把问题引向了Anthropic这篇文章最想谈的部分,当“签字的人”越来越跟不上AI进化的速度,我们到底该怎么办?
人类应该怎么做?
Anthropic为此呼吁:为这个世界,提前准备好一个能够踩刹车的选项。
在必要的时候,减速甚至暂停前沿AI的发展,好让社会结构、治理规则和对齐研究有时间追上技术。而这套机制的关键词,是“可验证”。它需要多个国家、多家处于前沿的实验室,在相同条件下共同减速,并且能彼此核查——确认对方是真的停了,而不是嘴上说停、暗地里继续。
难就难在这里。
AI的“军备控制”比传统武器棘手得多,一座导弹发射井藏不住,但一次训练运行却很容易被悄悄藏起来。
AI所需的算力和数据又都是通用的,根本无法像核材料那样被精准盯防。
更要命的是诱惑,只要别人暂停而你偷偷继续,你就能独自领跑,AI这块星球级的蛋糕就由你独享,哪波资本会不心动。
所以Anthropic并没有把话说死,断言“递归自我改进”一定会发生。
它摆出了三种可能的未来。
一种是趋势停滞,那些看似指数级的曲线最终变成S形,在数据、算力或能源的瓶颈前慢慢趋平。
一种是效率持续复合增长,AI研发高度自动化,但人类仍掌着方向盘,于是一家100人的公司或许能干出一万人的产出。
还有一种,才是完全的递归自我改进,AI开始动手设计自己的继任者。三条岔路,没人能笃定走哪一条。

▲ 山姆和苏茨克维
事实上,业界从不缺“提出别样意见”的声音。OpenAI前首席科学家伊尔亚·苏茨克维(Ilya Sutskever)就曾直言“我们所知的预训练即将终结”,理由是算力在涨、可用数据却没跟上。连奥特曼都承认,GPT-5“已经把聊天这个用例用饱和了”。

只能说“AI是否还在无限变强”,本身就是一桩悬而未决的争论。
Anthropic的呼吁不是在贩卖恐慌,而是在为一种代价极大的可能性,提前上一份保险。
事实可能正在发生,可能按这个趋势继续下去,影响可能会大到难以估量,而如果非要等到一切尘埃落定再来讨论,那就太晚了。
对我们大多数普通人而言,虽然不是圈内人,但绝不是局外人,我们应该想一想:当一项技术开始以“算力的速度”自我进化,而人类的法律、组织与共识还在以“一年一载”为单位缓慢挪动时,我们究竟有没有在还来得及的时候,为自己留下一个可以踩下去的刹车?
END

添加wuhu小精灵3号微信(wuhudonghua3)发送“动画新势力”即可在不久后被邀请进入粉丝群。


36小时,60万,100支队伍!来杭州,把你的名字写进AI动画的历史!

夜雨聆风


