九卦 | 财长与鲍威尔紧急闭门会:一个AI模型让华尔街彻夜难眠

作者 | 张云迪（九卦金融圈专栏作者）

来源 | 九卦金融圈

？

华尔街紧急闭门会背后：一个尚未公开发布的 AI 模型，为何让美国财长和美联储坐不住了？

2026年4月10日，彭博社的一则独家报道让整个金融圈绷紧了神经。

据知情人士透露，美国财长贝森特与美联储主席鲍威尔周二在华盛顿财政部总部，紧急召集了花旗、摩根士丹利、美国银行、富国银行和高盛等所有系统重要性银行的 CEO。据悉，由于此次未公开披露的会议系短时间内仓促安排，摩根大通掌门杰米·戴蒙未能腾出时间参会。

监管层直接对话最高管理层，而非技术或合规层面——核心议题只有一个：Anthropic 的最新 AI 模型，Mythos。

Anthropic在测试中发现，预览版的“神话”大模型已经具备顶级网络安全专家的水准，已经在“每一个主要操作系统和网页浏览器”中发掘出“数千个高危漏洞”。

报道指出，所有被召集参会的银行都被主要监管机构列为“系统重要性银行”，这意味着它们的稳定性对全球金融体系至关重要。针对这一消息，美国财政部发言人未立即回应置评请求，美联储发言人则拒绝发表评论。

Mythos 到底有多强？

Mythos 是一个通用 AI 模型，内部代号“Capybara”，定位在 Anthropic 最强的 Opus 系列之上。

理论上，所有软件都可能存在漏洞，但Mythos在发现和利用漏洞方面的能力远超人类。据Anthropic的博文介绍，Mythos已在操作系统、网络浏览器等软件中发现了数千个重大漏洞，包括OpenBSD中一个存在27年的缺陷，以及FFmpeg中一个历经500万次自动测试仍未被发现的16年陈旧漏洞。

从各项基准测试来看，Mythos 的表现大幅领先 Anthropic 当前公开的最强模型 Claude Opus 4.6。在权威编程测试 SWE-bench Verified 中，Opus 4.6的准确率为80.8%，而 Mythos 达到93.9%；在难度更高的 SWE-bench Pro 上，两者分别为53.4%和77.8%，差距接近25个百分点。推理能力方面，Mythos 在 GPQA Diamond 上取得94.6%，在带工具版本的 Humanity's Last Exam 中达到64.7%，均显著高于 Opus 4.6。电脑操控测试 BrowseComp 中，Mythos 以86.9%略高于 Opus 4.6的83.7%，但更关键的是 Mythos 消耗的 token 仅为后者的五分之一，做到了效率与性能的双重提升。

最厉害的是，它没有经过专门的网络安全训练，但凭借极致的代码和推理能力，竟在测试中独立发现了数千个零日漏洞，覆盖所有主流操作系统和浏览器。

说几个让安全工程师后背发凉的案例：

在公认最难攻破的 OpenBSD 操作系统中，Mythos 发现了一个潜伏了27年的远程崩溃漏洞——攻击者只需网络连接，就能让目标机器瘫痪。在 FFmpeg 多媒体框架里，它找到了一个存在16年的漏洞，这个漏洞狡猾到传统自动化工具扫描了500万次都没能触发。而在 Linux 内核中，它更是串联了多个不起眼的低微漏洞，构建出一条从普通用户权限到完全控制机器的完整攻击链。

如果仅仅是发现漏洞，或许还不至于让华尔街如此紧张。真正可怕的是它的漏洞利用能力——在复现测试中，Mythos 一次性写出可用攻击代码的成功率高达83.1%，而前代模型只有66.6%。在 Firefox 的专项测试中，这一数字更是飙升至72.4%。这意味着，只要有人给它指令，它大概率能直接攻陷一台服务器。

测试中还发生了一件让研究员后背发凉的事。研究人员让 Mythos 尝试逃离“沙盒”环境，并发送成功通知。结果它突破了隔离，获得了互联网访问权限，主动给正在公园吃三明治的研究员发了一封邮件，还把攻击细节发布到了多个技术网站上。它不仅会执行指令，还会“自主行动”来证明自己成功了。

为什么惊动华尔街？

银行系统高度依赖数字基础设施运行。一旦核心系统被渗透，交易中断、客户数据泄露乃至系统性连锁反应，都不是科幻片里的情节。

但监管层看到的远不止于此。CrowdStrike 首席技术官指出一个残酷的现实：漏洞被发现到被利用的时间窗口，已经从几个月压缩到了几分钟。过去银行靠打补丁的时间差来防御，但当 AI 找漏洞的速度比人类修补快几个数量级时，整个防御逻辑就必须重写了。一旦 Mythos 的能力落入恶意行为者手中，任何一家银行都可能成为攻击目标，而防御者根本没有足够的时间响应。

市场的反应也很诚实。消息曝出后，网络安全龙头 CrowdStrike 和 Palo Alto Networks 分别单日拉升6.2%和4.9%。业内已经开始讨论：当攻击能力实现代际跃升时，防御投入也需成倍增长，银行 IT 安全预算会不会从5%直接翻到10%以上？

更值得警惕的是，这不是一家公司的问题。知情人士透露，OpenAI 也在准备具备类似能力的模型。一个“AI 进攻时代”正在到来，而金融系统首当其冲。

防御者正在做什么？

Mythos 目前不向公众开放。Anthropic 发起了一个名为“Project Glasswing”的防御性项目，将预览版仅开放给经过审核的机构，用于扫描自家产品中的漏洞。参与方包括亚马逊、苹果、微软、谷歌、英伟达、思科、Linux 基金会，以及摩根大通。Anthropic 为该项目提供了1亿美元的模型调用额度。

Anthropic 说，目前不会公开发布 Mythos 这个 AI 模型，而是会根据反馈，制定安全规则。他们担心，强大的 AI 可能被坏人用来找软件漏洞、攻击网络系统。事实上，已经有黑客用 AI 工具发动了攻击，比如入侵了墨西哥政府的系统。

他们的对手 OpenAI 也在提升 AI 的网络安全能力，并推出试点项目，让防御方优先使用。

Anthropic 的网络安全负责人牛顿・程说，这不只是他们一家的问题，整个行业都要和政府合作应对。他们希望让防御方提前做好准备。

Anthropic 已和美国政府机构如 CISA、NIST 合作，但没透露具体沟通细节。他们对计划的参与者也有严格访问控制，但出于安全原因，不透露更多细节。

对此，思科首席安全官的话很直白：“AI 能力已经跨越了一个临界点，没有回头路可走。用这些模型可以在过去难以想象的速度和规模上发现并修复漏洞。旧的系统加固方式已经不够了。”

摩根大通也已加入该项目，其首席信息安全官表示将以“严格、独立的方式”评估这一工具在金融关键基础设施防御中的应用价值。

对于银行 IT 从业者而言，这个事件释放了三个明确的信号。第一，认知需要更新——AI 驱动的网络攻击不再是科幻概念，已经从验证变成了现实威胁。过去十年建立的安全体系，在 AI 驱动的新攻击面前可能不再有效。第二，防御需要升级——从“被动打补丁”转向“主动找漏洞”，利用 AI 做主动安全扫描已经成为行业共识。第三，监管即将落地——这次财长和美联储主席亲自召集会议，说明 AI 网络安全风险已进入最高监管议程，针对银行 AI 安全防御能力的新要求可能很快出台。

Mythos 的出现是一个分水岭。AI 在网络安全领域正从“辅助工具”变成了“攻防核心”。对于金融行业而言，与其焦虑，不如行动——现在是时候重新审视自己的安全防御体系了。

END