AI公司开始呼吁“暂停AI研发”

最近，Anthropic 呼吁建立一种机制，在风险升高时，可以协调暂停或放慢前沿AI研发。

Anthropic 是 Claude 背后的公司，也是全球最重要的前沿AI实验室之一。一家靠AI吃饭、正在高速推进AI能力的公司，突然出来谈“暂停AI研发”，这件事本身就很有戏剧性。

但如果只看“Anthropic呼吁暂停AI研发”这个标题，很容易误读。

它不是说从明天开始，Claude 不更新了，AI公司都别干了；也不是说普通AI应用、写作工具、图片生成、办公自动化都要停掉。

它真正说的是：

当前沿AI发展到某个危险阶段时，世界应该有一种可验证、可协调的机制，让主要AI实验室能够一起放慢，甚至临时暂停。

换句话说，Anthropic 不是在说“不要AI”，而是在说：

AI竞赛需要一个刹车系统。

问题是，这个刹车谁来踩？什么时候踩？怎么证明别人也真的踩了？如果有人表面减速、暗中加速怎么办？

这才是这场争论真正复杂的地方。

Anthropic到底在担心什么？

Anthropic 最近发布了一篇文章，题目叫《When AI builds itself》，直译过来就是：当AI开始建造自己。

这篇文章的核心观点是：AI正在越来越多地参与AI自己的研发流程。

过去，AI研发主要由人类工程师和研究员推动。

人类写代码。
人类跑实验。
人类分析结果。
人类决定下一步方向。
人类训练下一代模型。

但现在，这个流程正在变化。

Anthropic 在文章中说，在公司内部，AI系统已经承担了越来越多AI开发工作。文章披露，到2026年5月，Anthropic合并进代码库的代码中，超过80%可以归因于Claude；2026年第二季度，典型工程师每天合并的代码量已经是2024年的8倍。Anthropic 还认为，AI已经在加速AI系统自身的发展。

这意味着什么？

意味着AI公司内部的研发效率，正在被AI本身加速。

过去是：

人类研发AI。

现在越来越像：

人类设定目标，AI完成大量研发工作。

未来可能变成：

AI设计下一代AI。

这就是 Anthropic 最担心的东西：递归自我改进。

所谓递归自我改进，可以简单理解为：一个AI系统不仅能完成任务，还能参与设计、训练、优化自己的下一代版本。

Anthropic 自己也承认，现在还没有真正到这一步，也不认为它一定会发生。但它认为，这件事可能比很多机构准备得更早到来。

“研发闭环”正在被补上

很多人听到“AI自己造AI”，第一反应是科幻电影。

但现实中的路径可能并不戏剧化。

它不是某个机器人突然觉醒，也不是某个模型半夜偷偷复制自己。

更现实的路径是这样的：

第一步，AI帮工程师写代码。第二步，AI帮研究员跑实验。第三步，AI帮团队分析实验结果。第四步，AI开始提出下一组实验方向。第五步，AI参与设计下一代模型。第六步，人类只负责监督、验收、判断和授权。

这件事真正关键的，不是AI有没有“意识”。

关键是：AI能不能把研发流程中的关键环节逐步接过去。

如果AI只是聊天机器人，那它是一个工具。

如果AI能写代码、跑实验、找漏洞、做研究、设计新模型，那它就不只是工具，而是一个加速器。

Anthropic 提到，公共基准显示，AI可以可靠独立完成的任务时长大约每四个月翻倍；如果趋势持续，到2027年，AI系统可能能够处理原本人类需要数周完成的任务。

这才是问题的关键：

技术的油门已经踩下去了，但社会的刹车系统还没装好。

为什么不能让Anthropic自己先停？

很多人会问：

既然 Anthropic 觉得危险，那它自己先停不就好了？

这个问题听起来合理，但现实中很难。

因为前沿AI不是一家公司的独角戏。

Anthropic 停了，OpenAI 可能继续。 OpenAI 停了，Google DeepMind 可能继续。美国公司停了，其他国家的实验室可能继续。闭源实验室停了，开源社区可能继续。公开项目停了，秘密训练可能继续。

这就是典型的囚徒困境。

如果所有关键玩家都一起放慢，社会也许能争取更多时间。但如果只有一个玩家放慢，它可能只是把领先位置让给别人。

Anthropic 在原文中也承认，如果减速只是让不那么谨慎的参与者追上来，反而可能让所有人更不安全。它提出的不是“我单方面停”，而是希望建立一种机制，让前沿AI开发者能够验证其他人也确实停止或放慢。

所以，“暂停AI研发”最难的地方不是喊一句停。

真正难的是：

如何让所有关键玩家相信，别人也真的停了。

历史上有没有类似情况？

有。

但AI很特殊，它不能只类比成某一种历史技术。

从治理角度看，AI像核能和基因工程。从生产力角度看，AI像蒸汽机和电气化。从创作和知识工作角度看，AI像摄影术、电子表格和编译器。

这些历史类比放在一起，才能看清AI真正的复杂性。

AI像核能：强大、双刃剑，而且必须可验证

Anthropic这次谈“暂停”，最像核军控中的一个核心问题：

大家都知道某种技术很危险，但没有人愿意单方面停下来，因为你停了，别人可能继续。

核技术也是这样。

核能可以发电、治病、做科研，但也可以制造核武器。因此国际社会后来建立了核不扩散和核查机制。IAEA 对核保障监督的说明是，通过技术措施独立核查核材料和核设施没有被挪用于非和平目的。

这和 Anthropic 现在担心的问题非常像。

不是单纯说“大家别做了”，而是要建立一种机制，能够证明别人也真的慢下来了。

但AI和核能也有一个关键差异。

核材料、离心机、反应堆、导弹井，这些东西有相对明显的物理痕迹。

AI不一样。

AI训练可以藏在数据中心里。芯片是通用资源。电力是通用资源。云计算是通用资源。数据、算法、工程团队也都不像核设施那样显眼。

Anthropic 原文也提到，AI训练任务比导弹井更容易隐藏，输入资源又是通用的；如果有人在别人暂停时偷偷继续训练，就可能继承领先优势。

所以，AI军控可能比核军控更难。

因为AI的问题不是“有没有危险”，而是：

你怎么证明别人没有偷偷加速？

AI也像1975年的Asilomar会议

另一个非常重要的历史类比，是1975年的 Asilomar 会议。

1970年代，重组DNA技术刚出现时，科学家担心把不同生物的基因拼接在一起，可能带来未知的生物安全风险。于是，一批生物学家、医生、律师等人在美国加州 Asilomar 开会，讨论这项新技术的风险和规则。相关历史资料显示，会议的目标之一就是讨论在什么条件下可以解除此前的自愿暂停，并让重组DNA研究在安全防护条件下继续推进。

这个例子和 Anthropic 的呼吁非常接近。

它不是反科学。不是反技术。不是要求人类永远停止探索。

它表达的是另一种态度：

当一项技术进入高风险阶段时，科学共同体应该先承认风险，再设计规则。

这件事对今天的AI很有启发。

但AI和重组DNA也有不同。

Asilomar 会议主要面对的是实验室生物安全问题，很多风险可以通过实验等级、物理隔离、生物防护和实验规范来管理。

AI面对的则是全球商业竞争、国家安全竞争、资本竞争和开源扩散。

一个实验室遵守规范，不代表另一个国家、另一家公司、另一个开源团队也会同步遵守。

所以，Asilomar 告诉我们：历史上科学家确实主动踩过刹车。

但AI的问题是：

这一次刹车不只在实验室里，而是在全球竞赛场上。

从生产力看，AI更像蒸汽机：它不是消灭汗水，而是重定义汗水

如果讨论“1%灵感，99%汗水”，最好的历史类比其实是蒸汽机。

蒸汽机没有让劳动消失，但它让很多体力劳动不再是生产的核心瓶颈。

James Watt 在18世纪改进蒸汽机，加入分离冷凝器，大幅提高蒸汽机效率；Britannica 将 Watt 蒸汽机称为第一种真正高效的蒸汽机，原因就在于它通过分离冷凝器解决了能量浪费问题。

这带来的结果不是“人不重要了”。

而是人的价值位置变了。

过去重要的是人和牲畜的肌肉。后来重要的是机器、能源、工厂组织、工程师、资本和管理。体力汗水被机械化了，但系统设计、机器维护、工艺改进和商业组织变得更重要。

AI正在做类似的事情。

只不过它机械化的不是肌肉，而是部分脑力劳动。

写代码。改文案。做表格。生成方案。总结资料。调试问题。跑实验。重复试错。

所以，AI不是让“99%的汗水”完全不重要。

它是让一部分低层次汗水迅速贬值。

从创作看，AI像摄影术：贬值的是“逼真复现”，不是审美判断

摄影术出现时，画家也受到过冲击。

在摄影出现之前，画家很重要的一部分价值，是把人、风景、事件画得像。

摄影出现后，机器可以更快、更准确地记录现实。

Britannica 在介绍摄影史时提到，摄影早期曾因为依赖技术而被贬低为“机械艺术”，但摄影并不是照相机一按就自动完成的过程。

这和今天的AI生成内容非常像。

AI会让“把东西做出来”的门槛下降。

写一篇文章，容易了。画一张图，容易了。做一套PPT，容易了。生成一段代码，容易了。写十个标题，容易了。

但它不会自动告诉你：

什么值得写？什么值得画？什么值得做？什么有审美？什么有风险？什么能打动人？什么只是看起来很完整，其实没有洞察？

摄影没有消灭艺术。

它逼迫绘画走向新的方向，也创造了摄影师这个新职业。

AI大概率也不会消灭创作。

它会让创作者从“手工生成者”，变成“导演、编辑、策展人、判断者”。

未来真正值钱的，不一定是你能不能写一段文字、画一张图、做一个方案。

真正值钱的是：

你知道要生成什么，为什么生成，生成给谁看，怎样判断好坏，以及出了问题谁负责。

从知识工作看，AI像电子表格：消灭的是重复计算，不是商业判断

还有一个非常贴近知识工作的类比：电子表格。

在电子表格出现之前，很多财务分析、预算测算、商业计划都需要大量手工计算。改一个数字，后面一整串表格可能都要重算。

计算机历史博物馆介绍，Dan Bricklin 在哈佛商学院时，希望加快手工更新电子表格的繁琐过程，于是和 Bob Frankston 设计出了 VisiCalc，也就是早期电子表格软件。后来，Lotus 1-2-3、Excel 等工具继续改变了商业计算方式。

电子表格出现后，会计、财务、分析师并没有消失。

但他们的工作变了。

以前大量时间花在手工计算、抄表、改公式、重算数字。

后来这些“汗水”被软件吃掉了。

但真正重要的问题变成：

模型假设对不对？现金流预测合理不合理？风险有没有漏掉？这个商业决策能不能成立？数据背后有没有人为操纵或认知偏差？

AI对知识工作的影响会更大，但逻辑类似：

当计算、排版、生成、归纳、试错变便宜以后，判断会变贵。

99%的汗水不重要了吗？

就是那些目标清楚、步骤明确、标准稳定、结果容易检查的重复劳动。

比如：

按照模板写一份初稿。把会议录音整理成纪要。写常规代码。做基础调研。生成十个标题。把表格格式调好。把资料重新排版。把已有观点改写成另一种口吻。

这些事情不是完全没有价值。

但它们会越来越不稀缺。

AI越强，这类劳动的价格越低。

那什么是高级汗水？

是那些包含判断、经验、反馈和责任的劳动。

比如：

定义真正的问题。识别真实需求。设计实验路径。建立评价标准。判断结果是否可信。理解人性和组织。协调资源和利益。在不确定中做选择。出了问题承担后果。

这些才是未来更重要的汗水。

Anthropic 原文中其实已经把这个问题说得很直接。它引用了“天才是1%灵感和99%汗水”这句话，然后说，“汗水”正在越来越自动化；同时它也承认，人类眼下仍有优势的地方，是研究品味和判断力，包括选择什么问题重要、相信什么结果、什么时候判断一条路线走不通。

所以未来不是：

1%灵感重要，99%汗水不重要。

更准确地说，未来是：

1%灵感会变得廉价，99%的低级汗水会被自动化，真正稀缺的是判断、品味、验证和责任。

未来的公式可能要改写

过去那句话是：

1%灵感 + 99%汗水 = 天才⧉

AI时代，公式可能变成：

1%灵感 + 9%判断 + 90%组织、验证、迭代和负责 = 成果⧉

“汗水”没有消失，只是换了形态。

以前的汗水，是亲手把事情做出来。以后的汗水，是让一群AI把事情做对。

以前的汗水，是执行。以后的汗水，是定义、调度、筛选、验收、修正。

以前比的是谁更能熬。以后比的是谁更知道该往哪里熬。

以前很多人靠“我能做”建立价值。以后更多人要靠“我知道什么值得做，以及怎么判断做得对不对”建立价值。

这是一种更残酷的变化。

因为执行能力可以通过时间堆出来。

但判断力不是简单堆时间就有。

判断力来自长期实践、失败经验、反馈循环、领域知识和责任压力。

AI可以加速执行，但它不会自动替你经历这些。

没有努力过的人失去判断力

AI时代有一个很大的陷阱：

人类可能跳过练习阶段，直接进入指挥阶段。

这听起来很诱人。

不会写代码，也可以让AI写代码。不会画画，也可以让AI画图。不会写文章，也可以让AI出稿。不会做研究，也可以让AI给出结论。

但问题是，如果一个人从来没有经历过“低级汗水”，他可能也长不出“高级判断”。

一个优秀编辑之所以能判断文章好坏，是因为他自己改过无数烂稿。

一个优秀工程师之所以能审AI写的代码，是因为他自己踩过无数坑。

一个优秀研究者之所以能判断实验方向，是因为他知道失败结果长什么样。

一个优秀创业者之所以能识别伪需求，是因为他真的和客户、销售、现金流、交付打过交道。

如果一个人从来没有经历过这些汗水，直接用AI生成结果，他可能会很快，但很浅。

他能产出很多东西，却不知道哪些东西是真的。他能调用很多工具，却不知道工具什么时候会骗人。他能让AI给出十个方案，却不知道第十一个才是正确方向。他能做出看似完整的作品，却无法判断里面有没有关键错误。

所以，AI时代的基本功不是不重要，而是更重要。

只不过基本功的作用变了：

过去，基本功用来生产结果；以后，基本功用来判断结果。

AI真正改变的，是人类在系统里的位置

过去我们谈AI，常常把它看成一种工具。

写文章的工具。画图的工具。写代码的工具。客服自动化的工具。数据分析的工具。办公提效的工具。

但Anthropic这次讨论的重点，不是AI替代某一种岗位。

它提醒我们，AI正在成为一种更底层的东西：

加速器。

它加速软件开发。加速科研实验。加速漏洞发现。加速内容生产。加速组织运转。也加速AI公司研发下一代AI。

一旦AI不只是被应用到经济活动里，而是被应用到“生产AI本身”的环节里，事情就不一样了。

因为这意味着AI进步不再完全受限于人类工程师的速度。

人类仍然重要，但角色会变化。

从亲手写代码，变成审查代码。从亲自跑实验，变成选择实验方向。从完成任务，变成管理AI代理。从劳动者，变成监督者、判断者和方向设定者。

这听起来像是升级。

但它也有一个新瓶颈：

如果AI生成成果的速度超过人类审查成果的速度，人类就会从发动机变成刹车片。

而刹车片，是会磨损的。

普通人为什么应该关心这件事？

很多人可能会说：

这些都是硅谷大公司的事，和普通人有什么关系？

关系很大。

第一，AI会改变就业结构。

如果一个100人的团队借助AI可以完成过去1000人甚至更多人的工作，企业组织方式、岗位需求和薪酬结构都会发生变化。Anthropic 在其未来情景中也提到，AI可能让小团队完成过去大型组织才能完成的工作。

第二，AI会改变安全风险。

更强的AI可以帮助发现漏洞，也可能帮助制造攻击。它可以提升防御能力，也可能放大网络攻击、诈骗、舆论操纵和自动化监控。

第三，AI会改变权力结构。

谁拥有最强模型，谁就拥有更强的生产力、信息处理能力和研发速度。AI不只是商业产品，也会成为国家能力、企业能力和组织能力的一部分。

第四，AI治理会影响创新机会。

监管太松，风险可能失控。监管太紧，创新可能被少数巨头垄断。完全没有协调，所有人可能被迫参加一场谁都不敢减速的竞赛。

所以，Anthropic这次呼吁的意义，不在于它说得一定对。

它真正把一个更底层的问题摆到了台前：

当AI的发展速度超过社会理解速度时，我们该怎么办？

不要把问题简化成“停不停”

这场争论最容易被简化成两个阵营。

一边说：继续冲，别管风险。另一边说：赶紧停，AI太危险。

但真实问题没有这么简单。

如果完全不管风险，前沿AI可能在安全评估、对齐机制和社会治理没有准备好的情况下继续狂奔。

如果简单粗暴叫停，又可能让领先者巩固优势，让后来者失去机会，甚至让研发活动转入地下。

更合理的问题应该是：

我们能不能建立一种透明、可验证、有触发条件的机制？

比如：

什么能力水平的模型必须接受更严格测试？什么规模的训练任务需要登记？模型发布前是否需要第三方安全评估？关键算力是否需要审计？一旦模型出现危险能力，是否有统一的暂停标准？暂停之后，如何恢复？谁有资格判断风险已经降低？如何避免安全监管变成巨头护城河？

这些问题，远比一句“支持暂停”或“反对暂停”更重要。

Anthropic这次呼吁，不能简单理解成“良心发现”，也不能简单理解成“商业阴谋”。

它同时包含两面。

一面是真实的技术焦虑。

AI确实正在进入一个新阶段：它不仅能完成任务，还能帮助研发更强的AI。如果这种加速持续，社会治理、安全评估和对齐研究可能跟不上。

另一面是现实的商业博弈。

谁来定义“安全”？谁来定义“前沿模型”？谁来制定暂停标准？谁有能力满足监管要求？谁会在规则中获得优势？谁会被挡在门外？

这些问题都会影响AI产业未来的权力分配。

据 AP 报道，OpenAI 对 Anthropic 的呼吁持不同立场，更强调AI创新的节奏和规则不应由某一家实验室、公司或特殊利益集团决定，而应由民主政府制定。

Business Insider 汇总的反应也显示，一些支持者认为Anthropic是在推动必要的安全机制，而一些批评者则怀疑这可能是在塑造有利于自身的监管环境，甚至压制开源和后来者竞争。

所以，这件事最值得关注的，不是 Anthropic 会不会马上停止研发。

它不会。

更值得关注的是：

AI行业正在从“模型竞赛”进入“规则竞赛”。

过去比的是谁的模型更强。

接下来比的可能是：

谁能定义什么叫安全。谁能定义什么叫危险。谁能定义什么叫负责任。谁能定义什么样的AI可以继续训练。谁能定义什么样的AI必须暂停。

这才是真正的权力变化。

人类还剩什么？

这个问题最后会落回每个人身上。

如果AI能写代码，程序员还剩什么？

如果AI能写文章，作者还剩什么？

如果AI能做PPT，咨询顾问还剩什么？

如果AI能跑实验，研究员还剩什么？

如果AI能生成方案，管理者还剩什么？

答案不是“什么都不剩”。

答案是：

人类剩下的，是那些不能只靠生成完成的东西。

问题定义。价值判断。真实需求。审美品味。责任承担。复杂协调。长期信任。风险识别。路线选择。对人的理解。对结果的验证。

AI会让很多东西变便宜。

但它也会让某些东西变得更贵。

当答案变便宜，问题变贵。

当生成变便宜，判断变贵。当执行变便宜，方向变贵。当内容变便宜，信任变贵。当效率变便宜，责任变贵。

这就是AI时代真正的结构性变化。

99%的汗水不重要了？

历史上，每一次重大技术进步，都会替代一部分“汗水”。

蒸汽机替代了肌肉。摄影术替代了逼真描摹。电子表格替代了手工计算。 AI正在替代部分重复性脑力劳动。

但这些技术从来没有真正消灭人类价值。

它们只是重新定义了什么叫价值。

AI时代也一样。

它不是让努力变得无用。

它是让某些努力变得不再稀缺。

过去，很多人靠执行力建立价值。未来，更多人要靠判断力建立价值。

过去，很多人的优势是“我能做得比别人快”。未来，真正的优势可能是“我知道什么值得做，怎么做才对，以及为什么不能那样做”。

所以，“1%灵感、99%汗水”这句话并没有过时。

它只是需要改写。

AI时代不是：

1%灵感重要，99%汗水不重要。

而是：

99%的低级汗水不再稀缺，真正稀缺的是判断、验证、组织和责任。

Anthropic这次关于“暂停AI”的争论，表面上是在讨论AI公司要不要减速。

但更深处，它在提醒我们：

当工具开始参与制造更强的工具，当AI开始加速AI自身，人类最需要补上的，可能不是更多油门，而是一套真正可用的刹车系统。

因为未来最危险的，未必是AI太聪明。

而是人类在还没想清楚方向的时候，就已经被竞争推着全速前进。