AI | Anthropic的新模型“Mythos”强大得不敢让人用

声明：本公众号以分享市场信息，探讨经济相关知识为原则，仅与广大投资者分享交流，不构成投资建议。资本市场有风险，投资需谨慎。

本文来源于经济学人2026年4月11日刊，57页，原文标题Artificial intelligence- Mythical monster（人工智能——神话怪物），文中观点仅代表《经济学人》一家之言，读者们可舍短取长。正文可能有删改，使用AI工具翻译及配图配文

导读：OpenAI前研究总监、Anthropic负责人达里奥·阿莫代伊警告，其最新Claude模型“Mythos”过于强大，暂不广泛使用。Mythos能发现包括存在27年的漏洞在内的各系统严重漏洞，苹果、谷歌等参与其“玻璃翼计划”印证了威胁可信度。尽管可盈利，但若模型黑客能力被不加管控地推出，将带来风险；该计划也可能触及美国政府囤积网络漏洞的需求，引发争议。

对Anthropic最新模型风险的警告不应被忽视

2019年，当OpenAI完成训练一个名为GPT-2的新大型语言模型时，这家人工智能实验室最初宣称该模型过于危险，不能发布。当时担任OpenAI研究总监的达里奥·阿莫代伊坚称，世界需要时间来准备。

最终，该模型于当年晚些时候发布。此后，一系列更强大的模型被开发出来，却没有释放末日。然而，七年过去了，现任OpenAI劲敌Anthropic负责人的阿莫代伊再次感到担忧。4月7日，他宣布其实验室Claude模型系列的最新成员“Mythos”过于强大，尚不能广泛使用。这一次，他可能是对的。

据Anthropic称，Mythos的能力“大大超过我们之前训练的任何模型”。该实验室表示，该系统发现软件漏洞并修复或利用它们的能力尤其令其担忧。

通常，这类说法应该持怀疑态度。Anthropic构建了该模型，进行了测试，并将从其系统远比之前任何系统更聪明的看法中受益。该实验室最近势头正劲。4月6日，它宣布其年化收入已达到300亿美元，而去年底仅为90亿美元。它肯定渴望保持其势头。

然而，有理由认真对待Anthropic的最新警告。首先是其严重性：Anthropic表示，Mythos已经在“每个主要操作系统和网络浏览器”中发现了严重漏洞，其中一个漏洞27年来一直未被发现。

其次是其他公司的反应。在暂停发布的同时，Anthropic宣布了“玻璃翼计划”，旨在帮助公司在模型广泛发布前利用Mythos加强网络防御。领先软件开发商的参与——包括苹果、Linux基金会和CrowdStrike，以及直接在AI领域与Anthropic竞争的谷歌——表明威胁是可信的。

阿莫代伊减轻危险的方法是明智的。如果获得领先优势，公司可以使用Mythos测试未发布代码的弱点，并在发布前修复任何漏洞。即便如此，Anthropic也能从“玻璃翼计划”中获益良多。该实验室将承担该计划使用该模型产生的首批1亿美元成本。但最终，它将向参与者收取使用Mythos的费用，是前代Opus的五倍。

这可能是一个值得付出的代价。Anthropic的竞争对手迟早会开发出具有类似黑客能力的模型。其他前沿实验室，如OpenAI和谷歌，都有自己合理的发布政策。但开源实验室，尤其是位于中国的实验室，往往不太关注安全。

黑客可能不是唯一对“玻璃翼计划”感到恼火的人。美国政府长期以来一直寻求利用对手网络防御中的弱点。这意味着囤积未被发现的漏洞，用于这些“零日”漏洞将产生最大影响的时候。如果“玻璃翼计划”成功，它可能会解除美国的许多网络武器。

这肯定会激怒美国国防部长皮特·赫格塞斯，他今年早些时候在实验室与五角大楼就限制将其模型用于军事目的发生争执后，给Anthropic贴上了供应链风险的标签。阿莫代伊可能仍然是他的眼中钉。

道巴朔狐经济学人板块已连续更新超400天，正在向1000天迈进

片文只字，皆是你我的精神营养；刷刷世界，谁愿尝清茶几口

各位读者朋友们，读者群现已开放，抛砖引玉，望有识之士不吝赐教

加入方式：点击下方文章，添加小狐微信，发送“读者群”

独学无获，众论生慧｜道巴朔狐读者交流群4月20日开放邀请

国际新闻板块已入驻腾讯新闻，喜欢阅读国际新闻的读者可以在腾讯新闻搜索道巴朔狐。

公众号已有超过1600篇的经济学人文章，可以作为一个小型知识库使用，使用方法见经济学人知识库与号内搜索指引

公众号已接入AI机器人，可直接在聊天窗口找“小狐AI”提问，取代之前的公众号标签功能，小狐已全面掌握经济学人文章知识库，可让AI帮忙找想要的类型文章，赶快来试试吧！