2026年4月8日,美国财政部长贝森特和美联储主席鲍威尔做了一件罕见的事:联合召集华尔街六大银行的CEO,紧急到财政部总部开会。
花旗的Fraser来了,高盛的Solomon来了,摩根士丹利、美银、富国的一把手悉数到场。摩根大通的戴蒙没来,说是行程冲突。但真实原因可能没这么简单——后面会讲到。
上一次美国财长和美联储主席一起把银行CEO们叫到同一间屋子里,是2008年10月13日。保尔森和伯南克向他们摊牌:金融系统正在崩溃,联邦政府准备了2500亿美元的TARP注资计划,各位签字吧。
18年了。这次触发紧急会议的不是市场崩盘,不是银行倒闭,而是一个AI模型。
一个模型翻出了整个互联网的家底
这个模型叫 Mythos,Anthropic 做的。
它干了什么呢?用几周时间扫描了所有主流操作系统和浏览器的代码,翻出了数千个零日漏洞,大量是高危级别。有些漏洞在那里躺了二十多年,经历了无数轮人工审计和自动化测试,没有任何人、任何工具碰过它们。
OpenBSD 里一个27年的远程崩溃漏洞——这个系统的卖点就是安全——被 Mythos 翻了出来。FFmpeg 里一个16年的bug,扛过了上百万次模糊测试,也没逃过。
更让人睡不好觉的是利用能力。Anthropic 红队测试的数据:Mythos 首次尝试就能把发现的漏洞变成可用攻击代码的成功率是 83.1%。而它的上一代模型 Opus 4.6,在同样的测试里成功率接近零。
不是提升了几倍。是从不会到会。
Anthropic 还说了一个细节:这些能力不是专门训练出来的。 没有人给 Mythos 喂安全攻防的专项数据。它只是在代码理解、推理和自主行动上整体变强了,漏洞挖掘能力作为副产品涌现了出来。
这句话翻译一下:以后任何模型只要通用能力追到这个水平,都会自动获得同等的漏洞发现和利用能力。不需要额外训练,不需要专门意图。能力到了,技能自己长出来。
最荒诞的一幕:被叫来的人恰恰没有盾
Anthropic 没有公开发布 Mythos。它搞了一个叫 Project Glasswing 的联盟,只允许12家创始合作伙伴和约40个额外组织使用这个模型,限定用途为防御性安全审计。
12家创始伙伴:亚马逊、苹果、微软、谷歌、英伟达、CrowdStrike、思科、博通、Palo Alto Networks、Linux基金会——以及 摩根大通。
金融机构里,就摩根大通一家。
再看被贝森特和鲍威尔叫来开会的名单——花旗、高盛、摩根士丹利、美银、富国——没有一家在 Glasswing 名单上。它们被紧急召集,不是因为拿到了什么新武器,是因为有人告诉它们:你们的墙上可能全是洞,但能照出这些洞的X光机,你们用不了。
这就是戴蒙不用来的原因。摩根大通已经坐在牌桌上了。这家银行每年花6亿美元、养着3000人的网络安全团队,现在又多了一张别人没有的牌。同一天,摩根大通的分析师发布研报上调了 CrowdStrike 和 Palo Alto Networks——理由就是 Glasswing 成立。信息差已经在变成钱了。
当矛和盾合二为一
传统网络安全有一个隐含假设:进攻工具和防御工具是两套生意。你可以不造导弹,去买防空系统就行。
Mythos 把这个假设废掉了。发现漏洞和利用漏洞,用的是同一个模型、同一种能力。拿它扫自己的系统就是防御,拿它扫别人的系统就是攻击。区别只在于你把武器指向谁。
拿不到这个级别的模型,意味着你同时丢掉了矛和盾。
Cato Networks 的创始人 Kramer 说得很直白:Mythos 后面是下一个 OpenAI 模型,再后面是 Gemini,再过几个月是开源的中国模型。能力扩散是必然的。但问题在于时间差——先拿到的人已经在补墙了,后拿到的人可能连自己有多少洞都不知道。
中国金融系统的隐藏变量
话说到这,必须聊聊咱们国内的情况了。
肯定有人会说:怕什么,咱们有 DeepSeek、千问、文心,追平漏洞挖掘能力就是个时间问题。
我同意追上只是时间问题。但我更担心的,是追上之前的这段空窗期,以及一个容易被忽视的隐藏变量——信创替代。中国金融行业正在大规模推进国产化替代:操作系统从 Windows/Linux 发行版换成统信、麒麟,数据库从 Oracle/DB2 换成达梦、GBase、OceanBase,中间件和应用框架也在全面重构。这件事的战略意义毋庸置疑,长期来看是对的。但短期有一个现实问题:新代码意味着新漏洞。一个在 Oracle 上运行了十几年的系统,经过无数次安全审计和生产检验,它的漏洞——至少是已知漏洞——大多已经被修补了。当你把它迁移到一个新数据库上,重写了适配层代码,改了存储过程,换了驱动,整个链路上每一个接口调用都是潜在的攻击面。而这些新代码,恰恰还没有经过大规模安全审计。国内网络安全厂商——奇安信、深信服、绿盟——做的是传统安全防护,在 AI 驱动的深度漏洞挖掘能力上,跟 Mythos 的差距不是一个数量级的问题。Mythos 在成熟代码里都能翻出27年前的漏洞。想象一下它扫描一套刚完成信创迁移、大量代码还没过第二轮审计的金融核心系统,会发现什么。这不是危言耸听。Anthropic 在2025年11月就披露过,某黑客组织曾经使用早期的 Claude 模型,对约30个组织发动了自动化间谍攻击。那还是 Opus 4.6 之前的模型,漏洞利用成功率接近零的模型。
以后会反复出现的剧本
Mythos 这件事值得记住,因为它不是孤例,而是一种模式的开端。
当一项关键能力同时是矛和盾的时候,它的分发方式就不可能是自由市场。它会变成俱乐部制——有资格进场的人攻防兼备,门外的人两头落空。这个逻辑不只在网络安全领域成立。药物研发、材料科学、军事情报,凡是AI能力同时具有建设性和破坏性的地方,都会出现类似的分化。
以后的竞争不是谁的模型benchmark跑分更高,而是谁能进入关键能力的分发圈子。
2008年那次会议之后,美国用了三年走出金融危机。这次没有明确的时间线。开源模型会追上来,中国的安全审计能力也会补上来。但防御者需要的不是追上攻击者的那一天——是攻击者还没动手的每一天。
跑得快不算赢。在对手发现你的漏洞之前发现它,才算。
写在最后
回到开头那个画面。Bessent和Powell把银行CEO们叫到财政部开会,不是因为他们听说了一个厉害的AI,而是因为他们意识到一件事:金融系统的安全,已经不再只取决于你雇了多少安全工程师、买了多少防火墙,而取决于你能调用的AI有多强,“用AI防御AI”会是下一个核心命题。而这个新变量,目前掌握在极少数人手里。对我们来说,最该记住的不是Mythos有多厉害,而是这条新规则本身。因为Mythos只是开始,更强的模型还在路上,留给没有准备的人的窗口期,可能比我们以为的短得多。
夜雨聆风