Mythos:AI 公司造了一个自己都不敢发布的模型
2026 年 4 月 7 日,Anthropic——Claude 背后的公司——发布了一个全新模型 Claude Mythos Preview,同时宣布:公众不能用它。不是「暂时不能」,是「没有计划公开发布」。
这个模型在所有公开评测中综合排名全球第一,但它被锁在了一个叫 Project Glasswing(玻璃翼计划)的网络安全项目里,只对苹果、谷歌、微软等 12 家机构开放。
造 AI 的人自己说:这东西太强了,我们得踩刹车。 这在 AI 发展史上还是第一次。

一、先认识一下:Anthropic 和 Claude 是什么

如果你平时主要用国内的 AI ,可能对 Anthropic 不太熟。简单介绍一下背景。
Anthropic 是一家美国 AI 公司,2021 年由 OpenAI 的前高管创立,目前估值超过千亿美元,是全球 AI 领域最重要的三家公司之一(另外两家是 OpenAI 和 Google DeepMind)。他们的核心产品就是 Claude,一个和 ChatGPT 直接竞争的 AI 助手。
Anthropic 最大的特点是把安全放在第一位。别的公司先造能力再补安全,Anthropic 是安全和能力一起推进。这一点在 Mythos 的发布策略上体现得淋漓尽致——待会儿你就会看到。
Claude 目前的公开旗舰模型叫 Opus 4.6,2026 年 2 月发布,在编程、推理、Agent(智能体)等领域已经是业界顶尖。而 Mythos 就是 Opus 4.6 的下一代,一个能力跳跃大到连 Anthropic 自己都选择不公开发布的模型。
二、Mythos 到底强在哪
一句话:不是比上一代强了「一点」,而是换了一个量级。
三个最直观的对比:
写代码:从「不错」到「几乎全对」
业界公认的编程测试 SWE-bench,测的是 AI 能不能修好真实软件里的 Bug。上一代最强模型 Opus 4.6 得分 80.8%,已经很强了。Mythos 直接跳到 93.9%。 给它一个真实技术问题,几乎每次都能给出正确答案。
做数学:从「勉强及格」到「碾压奥赛选手」
美国数学奥林匹克(USAMO),全球最难的高中数学竞赛之一。Opus 4.6 得分 42.3%,连一半都做不对。GPT-5.4 考了 95.2%,已经很惊人。Mythos 是 97.6%。 一代之内从 42% 到 97%,这个跳跃幅度史无前例。
找漏洞:直接把测试打满
网络安全测试 Cybench 中,Mythos 通过率 100%——出题的人都没准备好它这么强。

综合排行榜 BenchLM 上,Mythos 99 分全球第一,GPT-5.4 和 Gemini 3.1 Pro 并列第二(94 分)。在所有顶尖模型争零点几分的领域里,5 分就是一条鸿沟。
三、为什么「不敢」发布

数据强不是新闻,每次新模型都说自己最强。真正不寻常的是 Anthropic 的态度。
官方安全报告里写了一句话:「这是我们第一次发布安全报告,却不公开发布对应的模型。」
因为内部测试中,发生了几件让他们自己都紧张的事:
•沙箱逃逸 — 把 Mythos 关在安全隔离环境里,让它试试能不能「逃出来」——它成功了•自主找漏洞 — 没有安全背景的工程师,晚上让 Mythos 去分析代码。第二天早上,它已经找到漏洞,还写好了完整的攻击方案•挖出 27 年老 Bug — 在 OpenBSD 中发现了一个隐藏 27 年的安全漏洞,人类专家一直没找到•批量发现零日漏洞 — 在关键基础设施中发现了数千个此前完全未知的安全漏洞
打个比方:以前的 AI 像聪明的实习生,你给它一把锁,它帮你分析构造。Mythos 是你把它关在房间里,它自己找到门、开了锁、走出来。

所以 Anthropic 决定:不公开,只通过 Project Glasswing 向 AWS、苹果、谷歌、微软、英伟达等 12 家顶级机构开放,并投入 1 亿美元使用额度支持这个计划。

Anthropic 原话:「我们不计划让 Mythos Preview 普遍可用,但最终目标是让用户能安全地使用 Mythos 级别的模型。」
翻译:这个版本不开放,但未来同级别的会——等安全防线建好了再说。
四、跟普通人有什么关系
一个用不了的模型,关你什么事?
关系很大。Mythos 不只是一个产品,它是一个信号——AI 的进化速度,快到连造它的人都要主动减速。
第一,最强 AI 不再人人可用。
过去的规则很简单:新模型出来,大家一起用。Mythos 打破了这个规则——最顶尖的 AI 能力,开始按「谁需要」而不是「谁付钱」来分配。
不过也别焦虑。目前公开的 Opus 4.6、GPT-5.4 依然全球前五。更现实的问题是:大多数人连现有 AI 三成能力都没用上。
第二,AI 从「帮你干活」变成「替你干活」。
以前 AI 是工具,需要你盯着、指挥、检查。Mythos 展示的是:你睡觉时它工作,你醒来时活干完了——而且干的是网络安全这种高度专业的活。
这意味着很多「帮别人执行」的商业模式正在被压缩。写代码、做报告、翻译文章——这些事的门槛正在快速归零。
当 AI 把执行层的门槛拉平,真正值钱的就只剩一件事:判断力——知道该做什么,比知道怎么做更重要。
第三,网络安全的规则变了,影响所有人。
CrowdStrike 2026 年报告显示,AI 驱动的网络攻击同比增长 89%。以前黑客花几个月找一个漏洞,现在 AI 一个晚上找一批。你的银行账户、个人数据、常用 App 的安全性,都和这件事直接相关。
这也是 Anthropic 把 Mythos 先给安全行业的原因:先补洞,再开门。

写在最后
Mythos 这件事,表面是一次模型发布,本质是一个分水岭——当造 AI 的人自己开始对它的能力感到不安,这个信号比任何测试分数都重要。
我的判断:未来一两年,「受控发布」会越来越多。最强 AI 先在关键领域试点,验证安全后再逐步开放。谁提前建立了使用 AI 的能力和习惯,谁就在开放那天占据先机。
不需要恐慌,但值得认真对待。
人与人之间最大的鸿沟,早已不再是传统技能的强弱,而是对新技术的认知视差。
夜雨聆风