声明:本公众号以分享市场信息,探讨经济相关知识为原则,仅与广大投资者分享交流,不构成投资建议。资本市场有风险,投资需谨慎。
本文来源于经济学人2026年4月11日刊,57页,原文标题Artificial intelligence- Mythical monster(人工智能——神话怪物),文中观点仅代表《经济学人》一家之言,读者们可舍短取长。正文可能有删改,使用AI工具翻译及配图配文
导读:OpenAI前研究总监、Anthropic负责人达里奥·阿莫代伊警告,其最新Claude模型“Mythos”过于强大,暂不广泛使用。Mythos能发现包括存在27年的漏洞在内的各系统严重漏洞,苹果、谷歌等参与其“玻璃翼计划”印证了威胁可信度。尽管可盈利,但若模型黑客能力被不加管控地推出,将带来风险;该计划也可能触及美国政府囤积网络漏洞的需求,引发争议。
对Anthropic最新模型风险的警告不应被忽视
2019年,当OpenAI完成训练一个名为GPT-2的新大型语言模型时,这家人工智能实验室最初宣称该模型过于危险,不能发布。当时担任OpenAI研究总监的达里奥·阿莫代伊坚称,世界需要时间来准备。
最终,该模型于当年晚些时候发布。此后,一系列更强大的模型被开发出来,却没有释放末日。然而,七年过去了,现任OpenAI劲敌Anthropic负责人的阿莫代伊再次感到担忧。4月7日,他宣布其实验室Claude模型系列的最新成员“Mythos”过于强大,尚不能广泛使用。这一次,他可能是对的。
据Anthropic称,Mythos的能力“大大超过我们之前训练的任何模型”。该实验室表示,该系统发现软件漏洞并修复或利用它们的能力尤其令其担忧。
通常,这类说法应该持怀疑态度。Anthropic构建了该模型,进行了测试,并将从其系统远比之前任何系统更聪明的看法中受益。该实验室最近势头正劲。4月6日,它宣布其年化收入已达到300亿美元,而去年底仅为90亿美元。它肯定渴望保持其势头。
然而,有理由认真对待Anthropic的最新警告。首先是其严重性:Anthropic表示,Mythos已经在“每个主要操作系统和网络浏览器”中发现了严重漏洞,其中一个漏洞27年来一直未被发现。
其次是其他公司的反应。在暂停发布的同时,Anthropic宣布了“玻璃翼计划”,旨在帮助公司在模型广泛发布前利用Mythos加强网络防御。领先软件开发商的参与——包括苹果、Linux基金会和CrowdStrike,以及直接在AI领域与Anthropic竞争的谷歌——表明威胁是可信的。
阿莫代伊减轻危险的方法是明智的。如果获得领先优势,公司可以使用Mythos测试未发布代码的弱点,并在发布前修复任何漏洞。即便如此,Anthropic也能从“玻璃翼计划”中获益良多。该实验室将承担该计划使用该模型产生的首批1亿美元成本。但最终,它将向参与者收取使用Mythos的费用,是前代Opus的五倍。
这可能是一个值得付出的代价。Anthropic的竞争对手迟早会开发出具有类似黑客能力的模型。其他前沿实验室,如OpenAI和谷歌,都有自己合理的发布政策。但开源实验室,尤其是位于中国的实验室,往往不太关注安全。
黑客可能不是唯一对“玻璃翼计划”感到恼火的人。美国政府长期以来一直寻求利用对手网络防御中的弱点。这意味着囤积未被发现的漏洞,用于这些“零日”漏洞将产生最大影响的时候。如果“玻璃翼计划”成功,它可能会解除美国的许多网络武器。
这肯定会激怒美国国防部长皮特·赫格塞斯,他今年早些时候在实验室与五角大楼就限制将其模型用于军事目的发生争执后,给Anthropic贴上了供应链风险的标签。阿莫代伊可能仍然是他的眼中钉。
夜雨聆风