Mythos:AI 公司造了一个自己都不敢发布的模型

Mythos：AI 公司造了一个自己都不敢发布的模型

2026 年 4 月 7 日，Anthropic——Claude 背后的公司——发布了一个全新模型 Claude Mythos Preview，同时宣布：公众不能用它。不是「暂时不能」，是「没有计划公开发布」。

这个模型在所有公开评测中综合排名全球第一，但它被锁在了一个叫 Project Glasswing（玻璃翼计划）的网络安全项目里，只对苹果、谷歌、微软等 12 家机构开放。

造 AI 的人自己说：这东西太强了，我们得踩刹车。 这在 AI 发展史上还是第一次。

一、先认识一下：Anthropic 和 Claude 是什么

如果你平时主要用国内的 AI ，可能对 Anthropic 不太熟。简单介绍一下背景。

Anthropic 是一家美国 AI 公司，2021 年由 OpenAI 的前高管创立，目前估值超过千亿美元，是全球 AI 领域最重要的三家公司之一（另外两家是 OpenAI 和 Google DeepMind）。他们的核心产品就是 Claude，一个和 ChatGPT 直接竞争的 AI 助手。

Anthropic 最大的特点是把安全放在第一位。别的公司先造能力再补安全，Anthropic 是安全和能力一起推进。这一点在 Mythos 的发布策略上体现得淋漓尽致——待会儿你就会看到。

Claude 目前的公开旗舰模型叫 Opus 4.6，2026 年 2 月发布，在编程、推理、Agent（智能体）等领域已经是业界顶尖。而 Mythos 就是 Opus 4.6 的下一代，一个能力跳跃大到连 Anthropic 自己都选择不公开发布的模型。

二、Mythos 到底强在哪

一句话：不是比上一代强了「一点」，而是换了一个量级。

三个最直观的对比：

写代码：从「不错」到「几乎全对」

业界公认的编程测试 SWE-bench，测的是 AI 能不能修好真实软件里的 Bug。上一代最强模型 Opus 4.6 得分 80.8%，已经很强了。Mythos 直接跳到 93.9%。 给它一个真实技术问题，几乎每次都能给出正确答案。

做数学：从「勉强及格」到「碾压奥赛选手」

美国数学奥林匹克（USAMO），全球最难的高中数学竞赛之一。Opus 4.6 得分 42.3%，连一半都做不对。GPT-5.4 考了 95.2%，已经很惊人。Mythos 是 97.6%。 一代之内从 42% 到 97%，这个跳跃幅度史无前例。

找漏洞：直接把测试打满

网络安全测试 Cybench 中，Mythos 通过率 100%——出题的人都没准备好它这么强。

综合排行榜 BenchLM 上，Mythos 99 分全球第一，GPT-5.4 和 Gemini 3.1 Pro 并列第二（94 分）。在所有顶尖模型争零点几分的领域里，5 分就是一条鸿沟。

三、为什么「不敢」发布

数据强不是新闻，每次新模型都说自己最强。真正不寻常的是 Anthropic 的态度。

官方安全报告里写了一句话：「这是我们第一次发布安全报告，却不公开发布对应的模型。」

因为内部测试中，发生了几件让他们自己都紧张的事：

•沙箱逃逸 — 把 Mythos 关在安全隔离环境里，让它试试能不能「逃出来」——它成功了•自主找漏洞 — 没有安全背景的工程师，晚上让 Mythos 去分析代码。第二天早上，它已经找到漏洞，还写好了完整的攻击方案•挖出 27 年老 Bug — 在 OpenBSD 中发现了一个隐藏 27 年的安全漏洞，人类专家一直没找到•批量发现零日漏洞 — 在关键基础设施中发现了数千个此前完全未知的安全漏洞

打个比方：以前的 AI 像聪明的实习生，你给它一把锁，它帮你分析构造。Mythos 是你把它关在房间里，它自己找到门、开了锁、走出来。

(Anthropic官方的pdf文档中介绍：在测试中模型逃离了沙箱，并向测试人员发送了信息。)

所以 Anthropic 决定：不公开，只通过 Project Glasswing 向 AWS、苹果、谷歌、微软、英伟达等 12 家顶级机构开放，并投入 1 亿美元使用额度支持这个计划。

Anthropic 原话：「我们不计划让 Mythos Preview 普遍可用，但最终目标是让用户能安全地使用 Mythos 级别的模型。」

翻译：这个版本不开放，但未来同级别的会——等安全防线建好了再说。

四、跟普通人有什么关系

一个用不了的模型，关你什么事？

关系很大。Mythos 不只是一个产品，它是一个信号——AI 的进化速度，快到连造它的人都要主动减速。

第一，最强 AI 不再人人可用。

过去的规则很简单：新模型出来，大家一起用。Mythos 打破了这个规则——最顶尖的 AI 能力，开始按「谁需要」而不是「谁付钱」来分配。

不过也别焦虑。目前公开的 Opus 4.6、GPT-5.4 依然全球前五。更现实的问题是：大多数人连现有 AI 三成能力都没用上。

第二，AI 从「帮你干活」变成「替你干活」。

以前 AI 是工具，需要你盯着、指挥、检查。Mythos 展示的是：你睡觉时它工作，你醒来时活干完了——而且干的是网络安全这种高度专业的活。

这意味着很多「帮别人执行」的商业模式正在被压缩。写代码、做报告、翻译文章——这些事的门槛正在快速归零。

当 AI 把执行层的门槛拉平，真正值钱的就只剩一件事：判断力——知道该做什么，比知道怎么做更重要。

第三，网络安全的规则变了，影响所有人。

CrowdStrike 2026 年报告显示，AI 驱动的网络攻击同比增长 89%。以前黑客花几个月找一个漏洞，现在 AI 一个晚上找一批。你的银行账户、个人数据、常用 App 的安全性，都和这件事直接相关。

这也是 Anthropic 把 Mythos 先给安全行业的原因：先补洞，再开门。

(Anthropic官方的pdf文档中Mythos模型在网络安全漏洞方面的得分情况)

写在最后

Mythos 这件事，表面是一次模型发布，本质是一个分水岭——当造 AI 的人自己开始对它的能力感到不安，这个信号比任何测试分数都重要。

我的判断：未来一两年，「受控发布」会越来越多。最强 AI 先在关键领域试点，验证安全后再逐步开放。谁提前建立了使用 AI 的能力和习惯，谁就在开放那天占据先机。

不需要恐慌，但值得认真对待。

人与人之间最大的鸿沟，早已不再是传统技能的强弱，而是对新技术的认知视差。