最近,Anthropic 呼吁建立一种机制,在风险升高时,可以协调暂停或放慢前沿AI研发。
Anthropic 是 Claude 背后的公司,也是全球最重要的前沿AI实验室之一。一家靠AI吃饭、正在高速推进AI能力的公司,突然出来谈“暂停AI研发”,这件事本身就很有戏剧性。
但如果只看“Anthropic呼吁暂停AI研发”这个标题,很容易误读。
它不是说从明天开始,Claude 不更新了,AI公司都别干了;也不是说普通AI应用、写作工具、图片生成、办公自动化都要停掉。
它真正说的是:
当前沿AI发展到某个危险阶段时,世界应该有一种可验证、可协调的机制,让主要AI实验室能够一起放慢,甚至临时暂停。
换句话说,Anthropic 不是在说“不要AI”,而是在说:
AI竞赛需要一个刹车系统。
问题是,这个刹车谁来踩?什么时候踩?怎么证明别人也真的踩了?如果有人表面减速、暗中加速怎么办?
这才是这场争论真正复杂的地方。
Anthropic到底在担心什么?
Anthropic 最近发布了一篇文章,题目叫《When AI builds itself》,直译过来就是:当AI开始建造自己。
这篇文章的核心观点是:AI正在越来越多地参与AI自己的研发流程。
过去,AI研发主要由人类工程师和研究员推动。
人类写代码。 人类跑实验。 人类分析结果。 人类决定下一步方向。 人类训练下一代模型。
但现在,这个流程正在变化。
Anthropic 在文章中说,在公司内部,AI系统已经承担了越来越多AI开发工作。文章披露,到2026年5月,Anthropic合并进代码库的代码中,超过80%可以归因于Claude;2026年第二季度,典型工程师每天合并的代码量已经是2024年的8倍。Anthropic 还认为,AI已经在加速AI系统自身的发展。
这意味着什么?
意味着AI公司内部的研发效率,正在被AI本身加速。
过去是:
人类研发AI。
现在越来越像:
人类设定目标,AI完成大量研发工作。
未来可能变成:
AI设计下一代AI。
这就是 Anthropic 最担心的东西:递归自我改进。
所谓递归自我改进,可以简单理解为:一个AI系统不仅能完成任务,还能参与设计、训练、优化自己的下一代版本。
Anthropic 自己也承认,现在还没有真正到这一步,也不认为它一定会发生。但它认为,这件事可能比很多机构准备得更早到来。
“研发闭环”正在被补上

很多人听到“AI自己造AI”,第一反应是科幻电影。
但现实中的路径可能并不戏剧化。
它不是某个机器人突然觉醒,也不是某个模型半夜偷偷复制自己。
更现实的路径是这样的:
第一步,AI帮工程师写代码。 第二步,AI帮研究员跑实验。 第三步,AI帮团队分析实验结果。 第四步,AI开始提出下一组实验方向。 第五步,AI参与设计下一代模型。 第六步,人类只负责监督、验收、判断和授权。
这件事真正关键的,不是AI有没有“意识”。
关键是:AI能不能把研发流程中的关键环节逐步接过去。
如果AI只是聊天机器人,那它是一个工具。
如果AI能写代码、跑实验、找漏洞、做研究、设计新模型,那它就不只是工具,而是一个加速器。
Anthropic 提到,公共基准显示,AI可以可靠独立完成的任务时长大约每四个月翻倍;如果趋势持续,到2027年,AI系统可能能够处理原本人类需要数周完成的任务。
这才是问题的关键:
技术的油门已经踩下去了,但社会的刹车系统还没装好。
为什么不能让Anthropic自己先停?

很多人会问:
既然 Anthropic 觉得危险,那它自己先停不就好了?
这个问题听起来合理,但现实中很难。
因为前沿AI不是一家公司的独角戏。
Anthropic 停了,OpenAI 可能继续。 OpenAI 停了,Google DeepMind 可能继续。 美国公司停了,其他国家的实验室可能继续。 闭源实验室停了,开源社区可能继续。 公开项目停了,秘密训练可能继续。
这就是典型的囚徒困境。
如果所有关键玩家都一起放慢,社会也许能争取更多时间。 但如果只有一个玩家放慢,它可能只是把领先位置让给别人。
Anthropic 在原文中也承认,如果减速只是让不那么谨慎的参与者追上来,反而可能让所有人更不安全。它提出的不是“我单方面停”,而是希望建立一种机制,让前沿AI开发者能够验证其他人也确实停止或放慢。
所以,“暂停AI研发”最难的地方不是喊一句停。
真正难的是:
如何让所有关键玩家相信,别人也真的停了。
历史上有没有类似情况?
有。
但AI很特殊,它不能只类比成某一种历史技术。
从治理角度看,AI像核能和基因工程。 从生产力角度看,AI像蒸汽机和电气化。 从创作和知识工作角度看,AI像摄影术、电子表格和编译器。
这些历史类比放在一起,才能看清AI真正的复杂性。
AI像核能:强大、双刃剑,而且必须可验证
Anthropic这次谈“暂停”,最像核军控中的一个核心问题:
大家都知道某种技术很危险,但没有人愿意单方面停下来,因为你停了,别人可能继续。
核技术也是这样。
核能可以发电、治病、做科研,但也可以制造核武器。因此国际社会后来建立了核不扩散和核查机制。IAEA 对核保障监督的说明是,通过技术措施独立核查核材料和核设施没有被挪用于非和平目的。
这和 Anthropic 现在担心的问题非常像。
不是单纯说“大家别做了”,而是要建立一种机制,能够证明别人也真的慢下来了。
但AI和核能也有一个关键差异。
核材料、离心机、反应堆、导弹井,这些东西有相对明显的物理痕迹。
AI不一样。
AI训练可以藏在数据中心里。 芯片是通用资源。 电力是通用资源。 云计算是通用资源。 数据、算法、工程团队也都不像核设施那样显眼。
Anthropic 原文也提到,AI训练任务比导弹井更容易隐藏,输入资源又是通用的;如果有人在别人暂停时偷偷继续训练,就可能继承领先优势。
所以,AI军控可能比核军控更难。
因为AI的问题不是“有没有危险”,而是:
你怎么证明别人没有偷偷加速?
AI也像1975年的Asilomar会议

另一个非常重要的历史类比,是1975年的 Asilomar 会议。
1970年代,重组DNA技术刚出现时,科学家担心把不同生物的基因拼接在一起,可能带来未知的生物安全风险。于是,一批生物学家、医生、律师等人在美国加州 Asilomar 开会,讨论这项新技术的风险和规则。相关历史资料显示,会议的目标之一就是讨论在什么条件下可以解除此前的自愿暂停,并让重组DNA研究在安全防护条件下继续推进。
这个例子和 Anthropic 的呼吁非常接近。
它不是反科学。 不是反技术。 不是要求人类永远停止探索。
它表达的是另一种态度:
当一项技术进入高风险阶段时,科学共同体应该先承认风险,再设计规则。
这件事对今天的AI很有启发。
但AI和重组DNA也有不同。
Asilomar 会议主要面对的是实验室生物安全问题,很多风险可以通过实验等级、物理隔离、生物防护和实验规范来管理。
AI面对的则是全球商业竞争、国家安全竞争、资本竞争和开源扩散。
一个实验室遵守规范,不代表另一个国家、另一家公司、另一个开源团队也会同步遵守。
所以,Asilomar 告诉我们:历史上科学家确实主动踩过刹车。
但AI的问题是:
这一次刹车不只在实验室里,而是在全球竞赛场上。
从生产力看,AI更像蒸汽机:它不是消灭汗水,而是重定义汗水
如果讨论“1%灵感,99%汗水”,最好的历史类比其实是蒸汽机。
蒸汽机没有让劳动消失,但它让很多体力劳动不再是生产的核心瓶颈。
James Watt 在18世纪改进蒸汽机,加入分离冷凝器,大幅提高蒸汽机效率;Britannica 将 Watt 蒸汽机称为第一种真正高效的蒸汽机,原因就在于它通过分离冷凝器解决了能量浪费问题。
这带来的结果不是“人不重要了”。
而是人的价值位置变了。
过去重要的是人和牲畜的肌肉。 后来重要的是机器、能源、工厂组织、工程师、资本和管理。 体力汗水被机械化了,但系统设计、机器维护、工艺改进和商业组织变得更重要。
AI正在做类似的事情。
只不过它机械化的不是肌肉,而是部分脑力劳动。
写代码。 改文案。 做表格。 生成方案。 总结资料。 调试问题。 跑实验。 重复试错。
所以,AI不是让“99%的汗水”完全不重要。
它是让一部分低层次汗水迅速贬值。
从创作看,AI像摄影术:贬值的是“逼真复现”,不是审美判断
摄影术出现时,画家也受到过冲击。
在摄影出现之前,画家很重要的一部分价值,是把人、风景、事件画得像。
摄影出现后,机器可以更快、更准确地记录现实。
Britannica 在介绍摄影史时提到,摄影早期曾因为依赖技术而被贬低为“机械艺术”,但摄影并不是照相机一按就自动完成的过程。
这和今天的AI生成内容非常像。
AI会让“把东西做出来”的门槛下降。
写一篇文章,容易了。 画一张图,容易了。 做一套PPT,容易了。 生成一段代码,容易了。 写十个标题,容易了。
但它不会自动告诉你:
什么值得写? 什么值得画? 什么值得做? 什么有审美? 什么有风险? 什么能打动人? 什么只是看起来很完整,其实没有洞察?
摄影没有消灭艺术。
它逼迫绘画走向新的方向,也创造了摄影师这个新职业。
AI大概率也不会消灭创作。
它会让创作者从“手工生成者”,变成“导演、编辑、策展人、判断者”。
未来真正值钱的,不一定是你能不能写一段文字、画一张图、做一个方案。
真正值钱的是:
你知道要生成什么,为什么生成,生成给谁看,怎样判断好坏,以及出了问题谁负责。
从知识工作看,AI像电子表格:消灭的是重复计算,不是商业判断
还有一个非常贴近知识工作的类比:电子表格。
在电子表格出现之前,很多财务分析、预算测算、商业计划都需要大量手工计算。改一个数字,后面一整串表格可能都要重算。
计算机历史博物馆介绍,Dan Bricklin 在哈佛商学院时,希望加快手工更新电子表格的繁琐过程,于是和 Bob Frankston 设计出了 VisiCalc,也就是早期电子表格软件。后来,Lotus 1-2-3、Excel 等工具继续改变了商业计算方式。
电子表格出现后,会计、财务、分析师并没有消失。
但他们的工作变了。
以前大量时间花在手工计算、抄表、改公式、重算数字。
后来这些“汗水”被软件吃掉了。
但真正重要的问题变成:
模型假设对不对? 现金流预测合理不合理? 风险有没有漏掉? 这个商业决策能不能成立? 数据背后有没有人为操纵或认知偏差?
AI对知识工作的影响会更大,但逻辑类似:
当计算、排版、生成、归纳、试错变便宜以后,判断会变贵。
99%的汗水不重要了吗?

就是那些目标清楚、步骤明确、标准稳定、结果容易检查的重复劳动。
比如:
按照模板写一份初稿。 把会议录音整理成纪要。 写常规代码。 做基础调研。 生成十个标题。 把表格格式调好。 把资料重新排版。 把已有观点改写成另一种口吻。
这些事情不是完全没有价值。
但它们会越来越不稀缺。
AI越强,这类劳动的价格越低。
那什么是高级汗水?
是那些包含判断、经验、反馈和责任的劳动。
比如:
定义真正的问题。 识别真实需求。 设计实验路径。 建立评价标准。 判断结果是否可信。 理解人性和组织。 协调资源和利益。 在不确定中做选择。 出了问题承担后果。
这些才是未来更重要的汗水。
Anthropic 原文中其实已经把这个问题说得很直接。它引用了“天才是1%灵感和99%汗水”这句话,然后说,“汗水”正在越来越自动化;同时它也承认,人类眼下仍有优势的地方,是研究品味和判断力,包括选择什么问题重要、相信什么结果、什么时候判断一条路线走不通。
所以未来不是:
1%灵感重要,99%汗水不重要。
更准确地说,未来是:
1%灵感会变得廉价,99%的低级汗水会被自动化,真正稀缺的是判断、品味、验证和责任。
未来的公式可能要改写
过去那句话是:
1%灵感 + 99%汗水 = 天才⧉AI时代,公式可能变成:
1%灵感 + 9%判断 + 90%组织、验证、迭代和负责 = 成果⧉“汗水”没有消失,只是换了形态。
以前的汗水,是亲手把事情做出来。 以后的汗水,是让一群AI把事情做对。
以前的汗水,是执行。 以后的汗水,是定义、调度、筛选、验收、修正。
以前比的是谁更能熬。 以后比的是谁更知道该往哪里熬。
以前很多人靠“我能做”建立价值。 以后更多人要靠“我知道什么值得做,以及怎么判断做得对不对”建立价值。
这是一种更残酷的变化。
因为执行能力可以通过时间堆出来。
但判断力不是简单堆时间就有。
判断力来自长期实践、失败经验、反馈循环、领域知识和责任压力。
AI可以加速执行,但它不会自动替你经历这些。
没有努力过的人失去判断力
AI时代有一个很大的陷阱:
人类可能跳过练习阶段,直接进入指挥阶段。
这听起来很诱人。
不会写代码,也可以让AI写代码。 不会画画,也可以让AI画图。 不会写文章,也可以让AI出稿。 不会做研究,也可以让AI给出结论。
但问题是,如果一个人从来没有经历过“低级汗水”,他可能也长不出“高级判断”。
一个优秀编辑之所以能判断文章好坏,是因为他自己改过无数烂稿。
一个优秀工程师之所以能审AI写的代码,是因为他自己踩过无数坑。
一个优秀研究者之所以能判断实验方向,是因为他知道失败结果长什么样。
一个优秀创业者之所以能识别伪需求,是因为他真的和客户、销售、现金流、交付打过交道。
如果一个人从来没有经历过这些汗水,直接用AI生成结果,他可能会很快,但很浅。
他能产出很多东西,却不知道哪些东西是真的。 他能调用很多工具,却不知道工具什么时候会骗人。 他能让AI给出十个方案,却不知道第十一个才是正确方向。 他能做出看似完整的作品,却无法判断里面有没有关键错误。
所以,AI时代的基本功不是不重要,而是更重要。
只不过基本功的作用变了:
过去,基本功用来生产结果;以后,基本功用来判断结果。
AI真正改变的,是人类在系统里的位置

过去我们谈AI,常常把它看成一种工具。
写文章的工具。 画图的工具。 写代码的工具。 客服自动化的工具。 数据分析的工具。 办公提效的工具。
但Anthropic这次讨论的重点,不是AI替代某一种岗位。
它提醒我们,AI正在成为一种更底层的东西:
加速器。
它加速软件开发。 加速科研实验。 加速漏洞发现。 加速内容生产。 加速组织运转。 也加速AI公司研发下一代AI。
一旦AI不只是被应用到经济活动里,而是被应用到“生产AI本身”的环节里,事情就不一样了。
因为这意味着AI进步不再完全受限于人类工程师的速度。
人类仍然重要,但角色会变化。
从亲手写代码,变成审查代码。 从亲自跑实验,变成选择实验方向。 从完成任务,变成管理AI代理。 从劳动者,变成监督者、判断者和方向设定者。
这听起来像是升级。
但它也有一个新瓶颈:
如果AI生成成果的速度超过人类审查成果的速度,人类就会从发动机变成刹车片。
而刹车片,是会磨损的。
普通人为什么应该关心这件事?
很多人可能会说:
这些都是硅谷大公司的事,和普通人有什么关系?
关系很大。
第一,AI会改变就业结构。
如果一个100人的团队借助AI可以完成过去1000人甚至更多人的工作,企业组织方式、岗位需求和薪酬结构都会发生变化。Anthropic 在其未来情景中也提到,AI可能让小团队完成过去大型组织才能完成的工作。
第二,AI会改变安全风险。
更强的AI可以帮助发现漏洞,也可能帮助制造攻击。它可以提升防御能力,也可能放大网络攻击、诈骗、舆论操纵和自动化监控。
第三,AI会改变权力结构。
谁拥有最强模型,谁就拥有更强的生产力、信息处理能力和研发速度。AI不只是商业产品,也会成为国家能力、企业能力和组织能力的一部分。
第四,AI治理会影响创新机会。
监管太松,风险可能失控。 监管太紧,创新可能被少数巨头垄断。 完全没有协调,所有人可能被迫参加一场谁都不敢减速的竞赛。
所以,Anthropic这次呼吁的意义,不在于它说得一定对。
它真正把一个更底层的问题摆到了台前:
当AI的发展速度超过社会理解速度时,我们该怎么办?
不要把问题简化成“停不停”
这场争论最容易被简化成两个阵营。
一边说:继续冲,别管风险。 另一边说:赶紧停,AI太危险。
但真实问题没有这么简单。
如果完全不管风险,前沿AI可能在安全评估、对齐机制和社会治理没有准备好的情况下继续狂奔。
如果简单粗暴叫停,又可能让领先者巩固优势,让后来者失去机会,甚至让研发活动转入地下。
更合理的问题应该是:
我们能不能建立一种透明、可验证、有触发条件的机制?
比如:
什么能力水平的模型必须接受更严格测试? 什么规模的训练任务需要登记? 模型发布前是否需要第三方安全评估? 关键算力是否需要审计? 一旦模型出现危险能力,是否有统一的暂停标准? 暂停之后,如何恢复? 谁有资格判断风险已经降低? 如何避免安全监管变成巨头护城河?
这些问题,远比一句“支持暂停”或“反对暂停”更重要。
Anthropic这次呼吁,不能简单理解成“良心发现”,也不能简单理解成“商业阴谋”。
它同时包含两面。
一面是真实的技术焦虑。
AI确实正在进入一个新阶段:它不仅能完成任务,还能帮助研发更强的AI。如果这种加速持续,社会治理、安全评估和对齐研究可能跟不上。
另一面是现实的商业博弈。
谁来定义“安全”? 谁来定义“前沿模型”? 谁来制定暂停标准? 谁有能力满足监管要求? 谁会在规则中获得优势? 谁会被挡在门外?
这些问题都会影响AI产业未来的权力分配。
据 AP 报道,OpenAI 对 Anthropic 的呼吁持不同立场,更强调AI创新的节奏和规则不应由某一家实验室、公司或特殊利益集团决定,而应由民主政府制定。
Business Insider 汇总的反应也显示,一些支持者认为Anthropic是在推动必要的安全机制,而一些批评者则怀疑这可能是在塑造有利于自身的监管环境,甚至压制开源和后来者竞争。
所以,这件事最值得关注的,不是 Anthropic 会不会马上停止研发。
它不会。
更值得关注的是:
AI行业正在从“模型竞赛”进入“规则竞赛”。
过去比的是谁的模型更强。
接下来比的可能是:
谁能定义什么叫安全。 谁能定义什么叫危险。 谁能定义什么叫负责任。 谁能定义什么样的AI可以继续训练。 谁能定义什么样的AI必须暂停。
这才是真正的权力变化。
人类还剩什么?
这个问题最后会落回每个人身上。
如果AI能写代码,程序员还剩什么?
如果AI能写文章,作者还剩什么?
如果AI能做PPT,咨询顾问还剩什么?
如果AI能跑实验,研究员还剩什么?
如果AI能生成方案,管理者还剩什么?
答案不是“什么都不剩”。
答案是:
人类剩下的,是那些不能只靠生成完成的东西。
问题定义。 价值判断。 真实需求。 审美品味。 责任承担。 复杂协调。 长期信任。 风险识别。 路线选择。 对人的理解。 对结果的验证。
AI会让很多东西变便宜。
但它也会让某些东西变得更贵。
当答案变便宜,问题变贵。
当生成变便宜,判断变贵。 当执行变便宜,方向变贵。 当内容变便宜,信任变贵。 当效率变便宜,责任变贵。
这就是AI时代真正的结构性变化。
99%的汗水不重要了?
历史上,每一次重大技术进步,都会替代一部分“汗水”。
蒸汽机替代了肌肉。 摄影术替代了逼真描摹。 电子表格替代了手工计算。 AI正在替代部分重复性脑力劳动。
但这些技术从来没有真正消灭人类价值。
它们只是重新定义了什么叫价值。
AI时代也一样。
它不是让努力变得无用。
它是让某些努力变得不再稀缺。
过去,很多人靠执行力建立价值。 未来,更多人要靠判断力建立价值。
过去,很多人的优势是“我能做得比别人快”。 未来,真正的优势可能是“我知道什么值得做,怎么做才对,以及为什么不能那样做”。
所以,“1%灵感、99%汗水”这句话并没有过时。
它只是需要改写。
AI时代不是:
1%灵感重要,99%汗水不重要。
而是:
99%的低级汗水不再稀缺,真正稀缺的是判断、验证、组织和责任。
Anthropic这次关于“暂停AI”的争论,表面上是在讨论AI公司要不要减速。
但更深处,它在提醒我们:
当工具开始参与制造更强的工具,当AI开始加速AI自身,人类最需要补上的,可能不是更多油门,而是一套真正可用的刹车系统。
因为未来最危险的,未必是AI太聪明。
而是人类在还没想清楚方向的时候,就已经被竞争推着全速前进。
夜雨聆风