一个AI模型,让美联储主席和财政部长连夜召集华尔街开会

4月10日，一件罕见的事情发生了。

美国财政部长 Scott Bessent 和美联储主席 Jerome Powell，在华盛顿财政部大楼紧急召集了一场会议。到场的不是政客，而是华尔街最有权势的那群人——花旗集团 CEO Jane Fraser、高盛 CEO David Solomon、美国银行 CEO Brian Moynihan、摩根士丹利 CEO Ted Pick、富国银行 CEO Charlie Scharf。

议题只有一个：Anthropic 三天前发布的 AI 模型 Mythos，可能对全球金融系统构成"系统性风险"。

同一天，加拿大央行召集六大银行开会讨论同一件事。英国央行宣布将在两周内把 Mythos 列入跨市场韧性工作组的议程。

三个国家，三家央行，同一周内，因为同一个 AI 模型而行动。

这在 AI 发展史上从未发生过。

Mythos 做了什么

4月7日，Anthropic 在官网发布了一篇措辞异常谨慎的公告。

他们说，Claude Mythos Preview 是一个通用大模型，没有专门为网络安全训练过。但在内部测试中，它展现出了一种令人不安的能力：自主发现并利用软件漏洞，速度和深度远超此前任何 AI 系统。

具体来说：

• Mythos 已经发现了数千个高危漏洞，覆盖所有主流操作系统和所有主流浏览器
• 其中一些漏洞存在了超过27年，从未被人类发现
• 它能独立完成从"发现漏洞"到"编写攻击代码"的完整链路
• 在一个测试案例中，Mythos 成功攻破了浏览器的安全隔离，让一个恶意网站能够读取另一个网站的数据——比如你的银行账户页面
• 它的首次利用成功率达到 83.1%

Anthropic 用了一个短语来形容这个模型的能力等级："超越了除最顶尖人类之外的所有安全研究员。"

在编码能力基准测试上，Mythos 的表现同样碾压性的：SWE-bench Verified（软件工程基准）得分 93.9%，而此前最强的 Opus 4.6 是 80.8%。Terminal-Bench 2.0 得分 82.0%，Opus 4.6 是 65.4%。

这不是一个"稍微好一点"的模型。这是一个跳了一个台阶的模型。

Anthropic 为什么不发布它

Anthropic 做了一个在 AI 行业近七年来从未有过的决定：不向公众发布这个模型。

上一次有 AI 公司因安全考虑而扣住模型，还要追溯到 2019 年 OpenAI 暂缓发布 GPT-2。那时的理由是担心"大规模生成虚假信息"。而 Mythos 的危险级别完全不同——它直接威胁到数字基础设施的物理安全。

取而代之的是一个名为 Project Glasswing（玻璃翼项目）的防御计划。

Anthropic 将 Mythos 的使用权限仅开放给 40 多家组织，包括 Apple、Microsoft、Google、Amazon、NVIDIA、CrowdStrike、Palo Alto Networks，以及金融领域的摩根大通。这些公司有一个共同特征：它们要么是关键软件基础设施的维护者，要么是网络安全领域的头部玩家。

Anthropic 为此承诺了 1 亿美元的使用额度和 400 万美元的开源安全组织直接捐赠。

逻辑很简单：让防守方先跑起来。在类似能力的模型不可避免地扩散之前，给全世界最重要的软件先打上补丁。

Anthropic 首席科学家 Jared Kaplan 在接受《纽约时报》采访时说了一句让人不寒而栗的话："这是我们未来能用到的最弱的模型。"

华尔街为什么慌了

你可能会问：软件漏洞跟银行有什么关系？

关系比你想象的大得多。

TD Securities 分析师 Jaret Seiberg 的分析很直接："如果客户无法访问资金，或者对资产安全失去信心，一家大银行就可能被动摇。而这种动摇可能迅速演变为系统性威胁——如果人们不再相信金融机构能安全地存储财富和处理交易。"

现代银行业运行在层层叠叠的软件之上。从网上银行的前端界面，到支付清算的后台系统，到客户身份验证，到加密通信——每一层都依赖于"漏洞不会被大规模发现和利用"这个前提。

Mythos 打破了这个前提。

更让监管者担忧的是 Anthropic 在公告中的一句话："鉴于 AI 的进步速度，类似的能力不久后就会扩散，可能超出那些致力于安全部署的参与者的范围。后果——对经济、公共安全和国家安全——可能是严重的。"

这不是在说"Mythos 很危险"。这是在说：就算我们管住了 Mythos，下一个类似的模型也会出现，而那个模型的开发者可能没有我们这么谨慎。

据 Fortune 报道，OpenAI 正在内部开发一个代号为"Spud"的模型，预计在网络安全能力上可以匹配 Mythos。其他实验室大概率也在做类似的事情。

这是一场倒计时已经开始的竞赛：防守方能在攻击方获得同等武器之前，修好多少漏洞？

质疑声：这是真正的威胁，还是一场精心设计的营销？

不是所有人都买账。

安全公司 AISLE 做了一个实验：他们把 Anthropic 公开展示的漏洞案例，用更小、更便宜的开源模型重新跑了一遍。结果发现，小模型恢复了大部分相同的分析结果。

AISLE 的结论很尖锐："AI 网络安全能力是'锯齿状'的——它并不随模型规模平滑增长。真正的护城河是系统，而不是模型本身。"

Tom's Hardware 更不客气，直接称 Mythos 的宣传是一场"sales pitch"（销售话术）。他们指出，Anthropic 声称发现了"数千个"严重零日漏洞，但实际上只有 198 个经过人工验证。

Reddit 上有人写道："有一个很大的理由让人怀疑：我们可以真正使用小模型，但我们用不了 Anthropic 那个'对凡人来说太危险'的特殊营销模型。"

另一方面，获得 Mythos 访问权限的安全研究人员普遍表示，这个模型确实代表了一次实质性的能力跃升。WIRED 报道称，当 Anthropic 的红队负责人 Logan Graham 联系 Glasswing 项目的潜在合作伙伴时，"电话越打越短，因为威胁变得越来越明显。"

Guardrail Technologies 的 CEO TJ Marlin 对《美国银行家》说："银行高管们应该'完全清醒'地面对 Mythos 的风险。"

真相可能介于两者之间。Mythos 的能力大概率被 Anthropic 放大了——但这不意味着底层趋势是假的。AI 正在以肉眼可见的速度变得更擅长发现和利用代码中的弱点。这个趋势不会因为某一个模型是不是"营销"而改变。

真正值得担心的事

这件事最重要的不是 Mythos 本身。

如果你把视线从这一个模型上移开，看到的是一个更大的图景：AI 安全正在从"理论讨论"变成"金融监管议题"。

三国央行同时为一个 AI 模型开会——这意味着监管者已经把"AI 驱动的网络攻击"视为与市场崩盘、银行挤兑同等级别的系统性风险。

这个转变的速度极快。2024 年，AI 安全的讨论还停留在"会不会产生虚假信息"的层面。2025 年，变成了"会不会被用来写恶意代码"。到了 2026 年 4 月，它已经是"美联储主席需要亲自过问"的级别了。

Anthropic 自己在公告中写了一句话，读起来更像是对整个行业的警告而非对自家产品的描述：

"保护关键基础设施是民主国家的头等国家安全优先事项——AI 网络能力的出现，是美国及其盟友必须在 AI 技术上保持决定性领先的又一个原因。"

这句话的潜台词是：如果民主国家不在 AI 上保持领先，独裁国家的 AI 模型也会获得同样的能力——但它们可能不会选择"先给防守方打补丁"这条路。

我认为，Mythos 事件真正标志性的意义在于：AI 的影响已经穿透了科技行业的边界，开始直接重塑金融监管、国家安全和国际关系的权力结构。

这不再是一个关于"AI 能写多好的代码"的技术故事。

这是一个关于"谁掌握 AI，谁就掌握了数字世界攻防主动权"的地缘政治故事。

而这个故事，才刚刚开始。