4月10日,一件罕见的事情发生了。
美国财政部长 Scott Bessent 和美联储主席 Jerome Powell,在华盛顿财政部大楼紧急召集了一场会议。到场的不是政客,而是华尔街最有权势的那群人——花旗集团 CEO Jane Fraser、高盛 CEO David Solomon、美国银行 CEO Brian Moynihan、摩根士丹利 CEO Ted Pick、富国银行 CEO Charlie Scharf。
议题只有一个:Anthropic 三天前发布的 AI 模型 Mythos,可能对全球金融系统构成"系统性风险"。
同一天,加拿大央行召集六大银行开会讨论同一件事。英国央行宣布将在两周内把 Mythos 列入跨市场韧性工作组的议程。
三个国家,三家央行,同一周内,因为同一个 AI 模型而行动。
这在 AI 发展史上从未发生过。
Mythos 做了什么
4月7日,Anthropic 在官网发布了一篇措辞异常谨慎的公告。
他们说,Claude Mythos Preview 是一个通用大模型,没有专门为网络安全训练过。但在内部测试中,它展现出了一种令人不安的能力:自主发现并利用软件漏洞,速度和深度远超此前任何 AI 系统。
具体来说:
- • Mythos 已经发现了数千个高危漏洞,覆盖所有主流操作系统和所有主流浏览器
- • 其中一些漏洞存在了超过27年,从未被人类发现
- • 它能独立完成从"发现漏洞"到"编写攻击代码"的完整链路
- • 在一个测试案例中,Mythos 成功攻破了浏览器的安全隔离,让一个恶意网站能够读取另一个网站的数据——比如你的银行账户页面
- • 它的首次利用成功率达到 83.1%
Anthropic 用了一个短语来形容这个模型的能力等级:"超越了除最顶尖人类之外的所有安全研究员。"
在编码能力基准测试上,Mythos 的表现同样碾压性的:SWE-bench Verified(软件工程基准)得分 93.9%,而此前最强的 Opus 4.6 是 80.8%。Terminal-Bench 2.0 得分 82.0%,Opus 4.6 是 65.4%。
这不是一个"稍微好一点"的模型。这是一个跳了一个台阶的模型。
Anthropic 为什么不发布它
Anthropic 做了一个在 AI 行业近七年来从未有过的决定:不向公众发布这个模型。
上一次有 AI 公司因安全考虑而扣住模型,还要追溯到 2019 年 OpenAI 暂缓发布 GPT-2。那时的理由是担心"大规模生成虚假信息"。而 Mythos 的危险级别完全不同——它直接威胁到数字基础设施的物理安全。
取而代之的是一个名为 Project Glasswing(玻璃翼项目)的防御计划。
Anthropic 将 Mythos 的使用权限仅开放给 40 多家组织,包括 Apple、Microsoft、Google、Amazon、NVIDIA、CrowdStrike、Palo Alto Networks,以及金融领域的摩根大通。这些公司有一个共同特征:它们要么是关键软件基础设施的维护者,要么是网络安全领域的头部玩家。
Anthropic 为此承诺了 1 亿美元的使用额度和 400 万美元的开源安全组织直接捐赠。
逻辑很简单:让防守方先跑起来。在类似能力的模型不可避免地扩散之前,给全世界最重要的软件先打上补丁。
Anthropic 首席科学家 Jared Kaplan 在接受《纽约时报》采访时说了一句让人不寒而栗的话:"这是我们未来能用到的最弱的模型。"
华尔街为什么慌了
你可能会问:软件漏洞跟银行有什么关系?
关系比你想象的大得多。
TD Securities 分析师 Jaret Seiberg 的分析很直接:"如果客户无法访问资金,或者对资产安全失去信心,一家大银行就可能被动摇。而这种动摇可能迅速演变为系统性威胁——如果人们不再相信金融机构能安全地存储财富和处理交易。"
现代银行业运行在层层叠叠的软件之上。从网上银行的前端界面,到支付清算的后台系统,到客户身份验证,到加密通信——每一层都依赖于"漏洞不会被大规模发现和利用"这个前提。
Mythos 打破了这个前提。
更让监管者担忧的是 Anthropic 在公告中的一句话:"鉴于 AI 的进步速度,类似的能力不久后就会扩散,可能超出那些致力于安全部署的参与者的范围。后果——对经济、公共安全和国家安全——可能是严重的。"
这不是在说"Mythos 很危险"。这是在说:就算我们管住了 Mythos,下一个类似的模型也会出现,而那个模型的开发者可能没有我们这么谨慎。
据 Fortune 报道,OpenAI 正在内部开发一个代号为"Spud"的模型,预计在网络安全能力上可以匹配 Mythos。其他实验室大概率也在做类似的事情。
这是一场倒计时已经开始的竞赛:防守方能在攻击方获得同等武器之前,修好多少漏洞?
质疑声:这是真正的威胁,还是一场精心设计的营销?
不是所有人都买账。
安全公司 AISLE 做了一个实验:他们把 Anthropic 公开展示的漏洞案例,用更小、更便宜的开源模型重新跑了一遍。结果发现,小模型恢复了大部分相同的分析结果。
AISLE 的结论很尖锐:"AI 网络安全能力是'锯齿状'的——它并不随模型规模平滑增长。真正的护城河是系统,而不是模型本身。"
Tom's Hardware 更不客气,直接称 Mythos 的宣传是一场"sales pitch"(销售话术)。他们指出,Anthropic 声称发现了"数千个"严重零日漏洞,但实际上只有 198 个经过人工验证。
Reddit 上有人写道:"有一个很大的理由让人怀疑:我们可以真正使用小模型,但我们用不了 Anthropic 那个'对凡人来说太危险'的特殊营销模型。"
另一方面,获得 Mythos 访问权限的安全研究人员普遍表示,这个模型确实代表了一次实质性的能力跃升。WIRED 报道称,当 Anthropic 的红队负责人 Logan Graham 联系 Glasswing 项目的潜在合作伙伴时,"电话越打越短,因为威胁变得越来越明显。"
Guardrail Technologies 的 CEO TJ Marlin 对《美国银行家》说:"银行高管们应该'完全清醒'地面对 Mythos 的风险。"
真相可能介于两者之间。Mythos 的能力大概率被 Anthropic 放大了——但这不意味着底层趋势是假的。AI 正在以肉眼可见的速度变得更擅长发现和利用代码中的弱点。这个趋势不会因为某一个模型是不是"营销"而改变。
真正值得担心的事
这件事最重要的不是 Mythos 本身。
如果你把视线从这一个模型上移开,看到的是一个更大的图景:AI 安全正在从"理论讨论"变成"金融监管议题"。
三国央行同时为一个 AI 模型开会——这意味着监管者已经把"AI 驱动的网络攻击"视为与市场崩盘、银行挤兑同等级别的系统性风险。
这个转变的速度极快。2024 年,AI 安全的讨论还停留在"会不会产生虚假信息"的层面。2025 年,变成了"会不会被用来写恶意代码"。到了 2026 年 4 月,它已经是"美联储主席需要亲自过问"的级别了。
Anthropic 自己在公告中写了一句话,读起来更像是对整个行业的警告而非对自家产品的描述:
"保护关键基础设施是民主国家的头等国家安全优先事项——AI 网络能力的出现,是美国及其盟友必须在 AI 技术上保持决定性领先的又一个原因。"
这句话的潜台词是:如果民主国家不在 AI 上保持领先,独裁国家的 AI 模型也会获得同样的能力——但它们可能不会选择"先给防守方打补丁"这条路。
我认为,Mythos 事件真正标志性的意义在于:AI 的影响已经穿透了科技行业的边界,开始直接重塑金融监管、国家安全和国际关系的权力结构。
这不再是一个关于"AI 能写多好的代码"的技术故事。
这是一个关于"谁掌握 AI,谁就掌握了数字世界攻防主动权"的地缘政治故事。
而这个故事,才刚刚开始。
夜雨聆风