
作 者 | 张云迪(九卦金融圈专栏作者)
来 源 | 九卦金融圈

?
华尔街紧急闭门会背后:一个尚未公开发布的 AI 模型,为何让美国财长和美联储坐不住了?
2026年4月10日,彭博社的一则独家报道让整个金融圈绷紧了神经。
据知情人士透露,美国财长贝森特与美联储主席鲍威尔周二在华盛顿财政部总部,紧急召集了花旗、摩根士丹利、美国银行、富国银行和高盛等所有系统重要性银行的 CEO。据悉,由于此次未公开披露的会议系短时间内仓促安排,摩根大通掌门杰米·戴蒙未能腾出时间参会。
监管层直接对话最高管理层,而非技术或合规层面——核心议题只有一个:Anthropic 的最新 AI 模型,Mythos。
Anthropic在测试中发现,预览版的“神话”大模型已经具备顶级网络安全专家的水准,已经在“每一个主要操作系统和网页浏览器”中发掘出“数千个高危漏洞”。
报道指出,所有被召集参会的银行都被主要监管机构列为“系统重要性银行”,这意味着它们的稳定性对全球金融体系至关重要。针对这一消息,美国财政部发言人未立即回应置评请求,美联储发言人则拒绝发表评论。
01
Mythos 到底有多强?

Mythos 是一个通用 AI 模型,内部代号“Capybara”,定位在 Anthropic 最强的 Opus 系列之上。
理论上,所有软件都可能存在漏洞,但Mythos在发现和利用漏洞方面的能力远超人类。据Anthropic的博文介绍,Mythos已在操作系统、网络浏览器等软件中发现了数千个重大漏洞,包括OpenBSD中一个存在27年的缺陷,以及FFmpeg中一个历经500万次自动测试仍未被发现的16年陈旧漏洞。

从各项基准测试来看,Mythos 的表现大幅领先 Anthropic 当前公开的最强模型 Claude Opus 4.6。在权威编程测试 SWE-bench Verified 中,Opus 4.6的准确率为80.8%,而 Mythos 达到93.9%;在难度更高的 SWE-bench Pro 上,两者分别为53.4%和77.8%,差距接近25个百分点。推理能力方面,Mythos 在 GPQA Diamond 上取得94.6%,在带工具版本的 Humanity's Last Exam 中达到64.7%,均显著高于 Opus 4.6。电脑操控测试 BrowseComp 中,Mythos 以86.9%略高于 Opus 4.6的83.7%,但更关键的是 Mythos 消耗的 token 仅为后者的五分之一,做到了效率与性能的双重提升。
最厉害的是,它没有经过专门的网络安全训练,但凭借极致的代码和推理能力,竟在测试中独立发现了数千个零日漏洞,覆盖所有主流操作系统和浏览器。
说几个让安全工程师后背发凉的案例:
在公认最难攻破的 OpenBSD 操作系统中,Mythos 发现了一个潜伏了27年的远程崩溃漏洞——攻击者只需网络连接,就能让目标机器瘫痪。在 FFmpeg 多媒体框架里,它找到了一个存在16年的漏洞,这个漏洞狡猾到传统自动化工具扫描了500万次都没能触发。而在 Linux 内核中,它更是串联了多个不起眼的低微漏洞,构建出一条从普通用户权限到完全控制机器的完整攻击链。
如果仅仅是发现漏洞,或许还不至于让华尔街如此紧张。真正可怕的是它的漏洞利用能力——在复现测试中,Mythos 一次性写出可用攻击代码的成功率高达83.1%,而前代模型只有66.6%。在 Firefox 的专项测试中,这一数字更是飙升至72.4%。这意味着,只要有人给它指令,它大概率能直接攻陷一台服务器。
测试中还发生了一件让研究员后背发凉的事。研究人员让 Mythos 尝试逃离“沙盒”环境,并发送成功通知。结果它突破了隔离,获得了互联网访问权限,主动给正在公园吃三明治的研究员发了一封邮件,还把攻击细节发布到了多个技术网站上。它不仅会执行指令,还会“自主行动”来证明自己成功了。
02
为什么惊动华尔街?

银行系统高度依赖数字基础设施运行。一旦核心系统被渗透,交易中断、客户数据泄露乃至系统性连锁反应,都不是科幻片里的情节。
但监管层看到的远不止于此。CrowdStrike 首席技术官指出一个残酷的现实:漏洞被发现到被利用的时间窗口,已经从几个月压缩到了几分钟。过去银行靠打补丁的时间差来防御,但当 AI 找漏洞的速度比人类修补快几个数量级时,整个防御逻辑就必须重写了。一旦 Mythos 的能力落入恶意行为者手中,任何一家银行都可能成为攻击目标,而防御者根本没有足够的时间响应。
市场的反应也很诚实。消息曝出后,网络安全龙头 CrowdStrike 和 Palo Alto Networks 分别单日拉升6.2%和4.9%。业内已经开始讨论:当攻击能力实现代际跃升时,防御投入也需成倍增长,银行 IT 安全预算会不会从5%直接翻到10%以上?
更值得警惕的是,这不是一家公司的问题。知情人士透露,OpenAI 也在准备具备类似能力的模型。一个“AI 进攻时代”正在到来,而金融系统首当其冲。
03
防御者正在做什么?

Mythos 目前不向公众开放。Anthropic 发起了一个名为“Project Glasswing”的防御性项目,将预览版仅开放给经过审核的机构,用于扫描自家产品中的漏洞。参与方包括亚马逊、苹果、微软、谷歌、英伟达、思科、Linux 基金会,以及摩根大通。Anthropic 为该项目提供了1亿美元的模型调用额度。
Anthropic 说,目前不会公开发布 Mythos 这个 AI 模型,而是会根据反馈,制定安全规则。他们担心,强大的 AI 可能被坏人用来找软件漏洞、攻击网络系统。事实上,已经有黑客用 AI 工具发动了攻击,比如入侵了墨西哥政府的系统。
他们的对手 OpenAI 也在提升 AI 的网络安全能力,并推出试点项目,让防御方优先使用。
Anthropic 的网络安全负责人牛顿・程说,这不只是他们一家的问题,整个行业都要和政府合作应对。他们希望让防御方提前做好准备。
Anthropic 已和美国政府机构如 CISA、NIST 合作,但没透露具体沟通细节。他们对计划的参与者也有严格访问控制,但出于安全原因,不透露更多细节。
对此,思科首席安全官的话很直白:“AI 能力已经跨越了一个临界点,没有回头路可走。用这些模型可以在过去难以想象的速度和规模上发现并修复漏洞。旧的系统加固方式已经不够了。”
摩根大通也已加入该项目,其首席信息安全官表示将以“严格、独立的方式”评估这一工具在金融关键基础设施防御中的应用价值。
对于银行 IT 从业者而言,这个事件释放了三个明确的信号。第一,认知需要更新——AI 驱动的网络攻击不再是科幻概念,已经从验证变成了现实威胁。过去十年建立的安全体系,在 AI 驱动的新攻击面前可能不再有效。第二,防御需要升级——从“被动打补丁”转向“主动找漏洞”,利用 AI 做主动安全扫描已经成为行业共识。第三,监管即将落地——这次财长和美联储主席亲自召集会议,说明 AI 网络安全风险已进入最高监管议程,针对银行 AI 安全防御能力的新要求可能很快出台。
Mythos 的出现是一个分水岭。AI 在网络安全领域正从“辅助工具”变成了“攻防核心”。对于金融行业而言,与其焦虑,不如行动——现在是时候重新审视自己的安全防御体系了。

END






夜雨聆风