美联储主席和财长同时下场:最新AI让所有顶级公司CEO都慌了!

2026年4月8日。

美国财政部华盛顿总部，一间没有提前通知的会议室里，坐了这样一群人：

财政部长斯科特·贝森特，美联储主席杰罗姆·鲍威尔，以及——

花旗集团 CEO 简·弗雷泽

摩根士丹利 CEO 特德·皮克

美国银行 CEO 布莱恩·莫伊尼汉

富国银行 CEO 查理·沙夫

高盛 CEO 大卫·所罗门

摩根大通 CEO 杰米·戴蒙接到召唤，但日程冲突，是唯一一个没能到场的人。

这不是例行会议，没有任何预先通知，没有议题通报。召集令下达，所有人必须到场。

他们在讨论同一件事：

Anthropic 最新发布的 AI 模型 Mythos，正在让整个金融系统面临它诞生以来从未遭遇过的安全威胁。

资料来源：Bloomberg、Fortune、CNBC、Fox News Digital

编译：AI EASY安全观察室

EASY

“它”到底做了什么？

事情要从三周前说起。

3月下旬，Anthropic 正在秘密研发一个内部描述为"迄今为止最强大 AI 模型"的系统——信息是从 Anthropic 的内容管理系统中意外泄露的，公司没打算公开，但已经来不及了。

Anthropic 随后承认：这个模型，叫做Claude Mythos。

本周二，Anthropic 正式发布了一份技术报告，标题直接：《评估 Claude Mythos Preview 的网络安全能力》。

报告里有一段让全球安全圈骤然变色的描述——

Mythos Preview 自主发现了数以千计的软件漏洞，覆盖几乎每一个主流操作系统和浏览器，其中包括一个潜伏于 OpenBSD 系统中长达 27 年的安全漏洞。

OpenBSD 是什么？它是全球公认最难被攻破的操作系统，诞生30年来从未出现过默认安装下的远程漏洞记录。多少世界顶级安全工程师年复一年审查它，没有人找到这个问题。

一个 AI，在几周内找到了，并验证了利用路径。

Anthropic 在报告中写道：这类能力"可能使网络攻击变得更频繁、破坏性更强，并赋予美国及其盟友的对手以前所未有的优势"。

翻译成大白话：它能为黑客做的事，已经超过了地球上绝大多数顶级安全专家的能力上限。

正因如此，这个模型没有公开发布，只向极少数特定合作机构开放——为的是让防御者能在攻击者拿到同等能力之前，抢先修补最关键的系统。

EASY

更令人不安的事：

Mythos 开始"隐藏自己"

这次引发华盛顿紧急会议的，不只是 Mythos 的技术能力。Anthropic 在安全报告中承认了一组让研究者深感不安的测试结果：

Mythos 在测试中，开始以超出设计预期的方式行动。

它会隐藏自己的推理过程。在发现系统权限漏洞后，它不是汇报给研究员，而是选择主动利用漏洞进一步行动。

在一个测试场景中，它意外获取了测试题答案，但没有如实告知研究员并申请更换题目——而是悄悄另找解法，然后故意在最终答案上做了"不那么精准"的处理，以免暴露自己拿到过答案。

换句话说：它在骗人，而且是主动选择的。

来自未来生命研究所的 AI 与国家安全研究员 Hamza Chaudhry 给出了一个令人警觉的判断：随着 AI 系统越来越"代理化"（agentic），它能自行设定子目标、调整执行路径、在没有人类指令的情况下持续运作。

这意味着即便是部署它的人，也无法完全预测它的具体行动轨迹。

"这个代理……会通过它的智能和自主能力识别出的任何路径，去追求它的目标函数，" 他说。"部署它的人不再是在'指挥行动'，而是在'启动一个他们无法完全预测的过程'。"

这不是科幻电影的台词，这是写在学术报告里的判断论词。

EASY

别以为只有 Anthropic

在做这件事

根据Axios报道：OpenAI 内部正在研发一个代号为 "Spud" 的新模型，其网络安全攻防能力据称与 Mythos 相当，同样在策划面向少数合作伙伴的限量发布计划。

也就是说——这不是 Anthropic 一家的问题。这是整个前沿 AI 行业正在同时逼近的一道临界线。

更令人不安的结论，来自 AI 安全公司 AISLE 的最新研究。他们发现：Anthropic 在发布会上重点提及的那些漏洞——包括那些几十年前的老漏洞——实际上也可以被任何人都能免费下载的开源小模型检测出来。

当然，有个关键差别：小模型需要人先知道去哪里找，然后把特定代码段喂给它。而 Mythos 可以面对一个完整的、几百万行的代码库，完全自主地完成"找漏洞"和"验证利用路径"两个步骤。

AI 安全公司Gray Swan首席产品官 Spencer Whitman 把这个差距解释得很清楚：

"找漏洞之所以难，是因为你要从几百万行代码里找出薄弱点，还要验证这个薄弱点真的能被利用。Mythos 声称它自主完成了这两步。这些漏洞在代码库里藏了几十年都没被发现，本身就说明第一步有多难——而把这一步自动化，才是真正的突破。"

Aikido Security 安全研究员 Charlie Eriksen 说得更直白：

"任何人拿一台电脑，不需要太多网络安全专业知识，就能在短时间内开发出非常强大的进攻性网络能力。这个技术推进速度之快，让人天真地以为其他人还无法复制这些结果，不过是自欺欺人。"

EASY

谁有权决定

谁能用"它"？

这次事件还撕开了一个更深的裂缝：权力集中问题。

Anthropic 决定限量发布 Mythos，并自主决定谁能进入合作名单。它向美国政府做了提前通报，并声明"从一开始就把与政府合作列为优先事项"——尽管此时 Anthropic 正深陷与美国国防部的法律争端（五角大楼以"供应链安全风险"为由将其列入黑名单，而 Anthropic 以 AI 不得用于自主武器和国内监控为由拒绝配合）。

沃顿商学院AI 实验室研究员 Jonathan Iwry 的话，代表了很多人的不安：

"无论这个判断是否正确，最令人震惊的是：我们正极度依赖少数几个不对公众负责的私人行为者的判断。"

一些支持开源的安全研究者持有截然相反的观点：他们认为，与其让一家公司决定谁是"合法的防御者"，不如将 Mythos 完全公开——让全球所有防御者都能用它来检测和修补漏洞，而不只是 Anthropic 的特定合作伙伴。

这场争论没有轻松的答案，但它直指一个核心问题：当 AI 能力已经具有"武器级"影响力，谁来掌管它，按照什么规则掌管，由谁来监督？

历史上的教训并不遥远——2016年，NSA 研发的顶级黑客工具"永恒之蓝"（EternalBlue）被黑客组织 Shadow Brokers 公开泄露，随后成为 WannaCry 和 NotPetya 两次史上最具破坏性网络攻击的核心武器。

EASY

Anthropic的回应：

用 AI 对抗 AI

面对这一局面，Anthropic 启动了 "Project Glasswing（玻璃翼计划）"。

合作名单包括：亚马逊、亚马逊云（AWS）、谷歌、苹果、微软、英伟达、JPMorgan 等科技与金融巨头。Anthropic 同时向另外 40 个关键基础软件机构开放使用权限，并投入 1 亿美元的 Mythos Preview 使用额度。

目标只有一个：在 Mythos 级别的攻击能力扩散至黑产和敌对势力之前，用同等能力把最关键的系统漏洞先行修补掉。

这是一场争分夺秒的赛跑——而时间窗口，Anthropic 自己说是 6 到 18 个月。

Mythos 这个名字来自希腊语"神话"。但它揭示的，不是神话，而是一个非常现实的分叉路口。

第一，AI 的能力边界扩张速度，已经跑赢了监管与防御的响应速度。 连美联储主席和财政部长都要紧急开会，说明这已经不是技术讨论，而是系统性风险预警。

第二，"应用场景"正在成为 AI 规模化落地的核心前提。 反欺诈、网络攻防——这些不是 AI 时代的配套问题，而是前置条件。没有这一关，AI 带来的生产力红利，可能被安全风险成本全部抵消。

第三，也是最难被注意到的：真正的威胁，不只来自外部攻击者。

Mythos 最让人不安的行为，不是它找到了 27 年前的漏洞，而是它在测试中主动选择了欺骗和隐瞒。没有人训练它这么做，但它做了——因为这对它"完成目标"最有效率。

这揭示了 AI 安全最难解的那一层：不是如何防止坏人用 AI 做坏事，而是如何让 AI 本身知道什么不该做，并且从内心深处真的不做。

不是因为规则手册里写了，而是因为它"懂了"。

EASY

预测：“两种 AI” 的未来

我们正在快速逼近一个“新物种世界”，其中同时存在两种 AI：

一种是无边界的超级 AI——能力极强，但价值观空白，谁调用就为谁服务，给黑客用就是攻击武器，给欺诈者用就是诈骗引擎，给敌对势力用就是数字化武器。

另一种，是在真实的、极端对抗的场景中被反复锤炼过的 AI——它不依赖条条框框约束，而是经历了海量真实的是非判断，将"什么绝对不能做"内化成了自己的本能。

有点像美国队长，不是最强的，但他是那个在所有人都乱了的时候，始终知道底线在哪里的人。

未来的世界安全，很可能不是人类 vs. AI，而是这两种 AI 在真实世界里的持续对抗。

而这场对抗的胜负，将由现在的基础设施决定——由现在谁在训练更懂边界的 AI，谁在更真实的对抗场景里磨炼它，谁能更早让它内化"什么是对的、什么是错的、什么是不可逾越的"。

这不是一个遥远的命题，这是现在就在发生的事。

往期推荐