发现27年漏洞的AI,被12家巨头联手锁起来了

Anthropic的安全研究员盯着屏幕，不敢相信自己的眼睛。

Mythos——他们刚刚训练出来的AI模型——刚刚在OpenBSD的代码里找到了一个漏洞。OpenBSD是全世界公认最安全的操作系统之一，27年来被无数顶尖工程师翻来覆去地审计过。

没有人发现过这个漏洞。

Mythos只用了不到一分钟。

更让研究员后背发凉的是，这个模型不是专门为找漏洞设计的。它只是一个通用AI，“顺便”展示了一下自己在网络安全方面的天赋。

2026年4月7日，Anthropic做了一件在科技行业几乎没发生过的事。它发布了这个叫Claude Mythos Preview的模型，然后说：对不起，你们用不了。

不是技术故障，不是服务器不够，不是还在内测。

原因是——它太强了，强到Anthropic自己都不敢把它放出来。

一、它挖出了藏了27年的漏洞

Anthropic把Mythos放出去扫了一圈真实的代码库。

结果让人后背发凉。

在数周之内，Mythos自主发现了数千个零日漏洞。零日漏洞就是那种还没人发现、没有补丁、攻击者可以直接拿来用的安全漏洞——网络安全里最危险、最值钱的东西。

在CyberGym网络安全基准测试中，Mythos拿下了83.1%的得分。而Anthropic上一个最强版本Claude Opus 4.6，只有66.6%。

这不是一两个百分点的正常迭代。这是一刀砍下去、断崖式的性能跃迁。

更让人不安的是，Mythos不是一个专门为网络安全训练的模型。Anthropic前沿红队的网络安全负责人Newton Cheng告诉The Verge，Mythos是一个通用模型，它的网络安全能力“纯粹来自于强大的代理编码和推理能力”。

翻译一下：它在编程和推理上变强了，然后顺手发现自己找漏洞的能力也强得离谱。

在这批被发现的漏洞中，有三个案例让安全圈彻底沉默了。

第一个：OpenBSD系统里藏了一个27年的漏洞。 OpenBSD被公认为全球最安全的操作系统之一，27年来无数顶级安全工程师反复审计过它的代码，没有人发现这个漏洞。Mythos扫了一眼，找到了。

第二个：FFmpeg——一个被全世界视频应用广泛使用的开源库——里藏了一个16年的内存损坏漏洞。那条有问题的代码行，被自动化扫描工具反复扫过超过500万次，每次都没有发现异常。500万次。Mythos看了一次，找到了。

第三个：在FreeBSD的NFS服务器里，Mythos发现了一个远程代码执行漏洞。任何人，不经过任何授权，就能直接拿到整台服务器的最高管理权限。

发现漏洞是一回事。能利用漏洞是另一回事。而Mythos两者都能做。

在Firefox的JavaScript引擎测试中，Mythos将识别出的漏洞转化为成功攻击的成功率高达72.4%。对比一下，它之前的模型几乎做不到这一点，成功率接近于零。

Anthropic的红队博客披露了一个更具冲击力的案例：Mythos自主编写了一个浏览器漏洞利用程序，将四个不同的漏洞串联在一起，成功逃逸了浏览器的渲染器沙箱和操作系统的沙箱双重隔离。

这种级别的链式攻击，通常只有国家级的顶尖黑客团队才能做到。一个AI，自己完成了。

二、“我们还没准备好迎接它”

按常理，练出一个这么强的模型，Anthropic应该开香槟。

但整个公告的调性，跟兴奋完全不沾边。

Newton Cheng接受VentureBeat采访时说：“由于Claude Mythos Preview的网络安全特性，我们不打算将其公开发布。”

他说这句话的时候，用的是“不打算”，不是“暂不计划”。语气里没有商量的余地。

原因很简单：这把武器，现在还不能交到所有人手里。

Cheng接着解释道：“鉴于AI的发展速度，这类能力很快就会扩散，甚至可能超出那些致力于安全部署AI的机构与企业所能掌控的范围。这将对经济、公共安全与国家安全造成严重影响。”

翻译成人话就是：我们能做出来，别人很快也能做出来。如果我们不提前堵住漏洞，等别人的模型也具备这个能力时，全球互联网就是筛子。

这不是危言耸听。

Linux内核维护者Greg Kroah-Hartman在接受The Register采访时说了这么一段话，在安全圈被疯转：

“几个月前，我们收到的AI生成的安全报告还叫‘AI垃圾’，明显是错的或者质量很低。一个月前，情况变了。现在收到的报告是真实的、高质量的。我每天要花好几个小时处理这些报告。”

连Linux内核都开始收到“真正有用”的AI漏洞报告了。这件事本身，就是AI安全能力跨越某个临界点的最直接证据。

另一位安全研究员Thomas Ptacek干脆写了一篇文章，标题就叫《漏洞研究被终结了》。

三、12家死对头坐在了一张桌上

于是就有了这个史上罕见的场面。

4月7日，Anthropic宣布启动一个名为“Project Glasswing”（玻璃翼）的网络安全计划。

但真正让业界震惊的不是项目名字，而是参与名单。

创始合作伙伴包括：亚马逊AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达、Palo Alto Networks。

读一遍这个名单。苹果和谷歌，微软和亚马逊，平时连会议室都不愿意共用。现在他们不仅坐在一起，还愿意把自己核心系统的代码库交给同一个AI模型来扫描。

在商业世界里，这几乎是不可能发生的事情。

ZDNET的专栏作家David Gewirtz在他的分析文章中写得很直白：“这既是可怕的消息，也是某种程度上的好消息。可怕在于，武器级AI已经把整个网络安全基础设施逼到了悬崖边；好消息是，竞争对手终于愿意联手填这个坑。”

Gewirtz还提到了一个关键变化：网络攻击的时间线正在从“月级”坍缩到“分钟级”。

传统防御还在开会讨论补丁方案的时候，AI驱动的攻击可能已经完成数据窃取和系统破坏。“这不是比喻，是FBI InfraGard AI威胁委员会成员观察到的实际趋势。”

这些公司看到了同一份威胁情报，而那份情报的结论，不适合对公众公开。

四、4亿美元不是买算力，

是买“预演时间”

12家巨头凑在一起，具体怎么花钱？

据多家媒体报道，这笔约4亿美元的资金流向三个方向：

第一，模型训练和部署，让Mythos能处理更大规模的代码审计。

第二，建立共享威胁情报网络，12家公司实时同步攻击样本和漏洞信息。

第三，资助开源安全项目。

Anthropic自己还额外掏了1亿美元的使用额度，以及400万美元直接捐赠给Linux基金会和阿帕奇软件基金会等开源安全组织。

项目的核心逻辑很简单：在其他人做出同样能力的模型之前，先用自己的模型把全球关键软件的漏洞扫一遍，堵上。

第一批获得Mythos Preview访问权限的，除了12家创始合作伙伴，还有超过40家维护关键软件基础设施的组织。这些系统支撑着全球金融、能源、通信的底层运转，以前由人类安全团队维护，周期以月为单位计算。现在，Mythos把排查周期压缩到了以分钟为单位。

摩根大通的加入尤其值得玩味。银行是网络攻击的重灾区，但金融行业的监管限制让银行很难快速采用外部AI工具。这次合作可能意味着在监管框架内开辟了一条快速通道。

苹果、谷歌、微软的参与则更加意味深长。三家的操作系统加起来覆盖了全球90%以上的终端设备，但他们的安全团队向来各自为战。现在他们要把漏洞数据库打通——David Gewirtz形容得好：“相当于三个互相猜忌的军火商，突然决定共用同一份敌方情报图。”

五、争议：是“囚禁”还是营销？

质疑声从第一天就没停过。

最大的争议来自一个简单的事实：Mythos的能力泄露，本身就是一次意外。

今年3月，Anthropic的一次内部配置失误，意外将关于Mythos的机密技术底牌公之于众。一个号称网络安全能力最强的AI模型，连自家文档都没守住。这种“医者不能自医”的反讽，在技术社区引发了大量讨论。

另一个质疑更尖锐：所谓“太危险不敢发布”，是不是另一种形式的营销？

毕竟，说自己的模型“强到不敢发布”，本身就是一个极其有效的传播策略。它制造悬念、制造稀缺感，还能把自己塑造成一个有责任感的AI公司。

但Anthropic这次的做法，跟传统的营销套路有明显区别。

如果只是为了炒作，你大可以限量发布、高价收费。但Anthropic做的事恰恰相反：把模型锁起来不给公众用，反而自己掏1亿美元补贴合作伙伴去用。这种“倒贴钱不让公众用”的操作，在商业逻辑上很难解释为“营销”。

一位技术评论者在博客中写道：“说‘我们的模型太危险不能发布’是制造话题的好方法，但这次，我认为他们的谨慎是有道理的。”

六、留给防守方的时间，到底还有多少

Glasswing项目的紧迫感，从各家公司高管的表态中能看得一清二楚。

微软全球CISO Igor Tsyganskiy说：“当我们进入一个网络安全不再受纯人类能力限制的阶段时，负责任地使用AI来大规模改善安全、降低风险的机会是前所未有的。”

Cisco的CSO Anthony Grieco说得更直接：“AI能力已经跨过了一个门槛，从根本上改变保护关键基础设施的紧迫性，没有回头路可走。我们的测试表明，我们能够以前所未有的速度和规模发现和修复漏洞。这是一个深刻的转变，也明确地表明，旧有的系统加固方法已经不够了。”

CrowdStrike的CISO Elia Zaitsev点出了时间维度的危机：“漏洞被发现和被利用之间的窗口已经坍塌——曾经需要数月的事情，现在在AI的帮助下只需几分钟。对手不可避免地也会寻求利用同样的能力。这不是放缓脚步的理由，而是我们更快、更紧密地行动的理由。”

翻译过来就是：防守方用AI找漏洞，攻击方也会用AI找漏洞。谁能跑得更快，决定了全球互联网的安全底线。

Anthropic的长期目标是让Mythos级别的模型能在大规模场景下开放使用，但前提是必须建立完善的安全护栏来检测和阻止它最危险的能力。Glasswing项目就是为这个目标进行的“压力测试”。

写在最后

技术评论人Simon Willison在他的博客里写了这么一段话：

“鉴于AI的进步速度，这类能力不会太久就会扩散，可能超出那些致力于安全部署它的实体所能掌控的范围。这就是为什么Glasswing项目如此重要——它不是阻止进步，而是确保防御方至少能领先一步。”

FBI InfraGard AI威胁委员会成员观察到，网络攻击的时间线正在从“月级”坍缩到“分钟级”。当武器级AI的攻防能力进入“分钟级”博弈，人类反应速度已经不够用了。唯一的办法，是让另一台AI跑在攻击者前面。

12家科技巨头史无前例地联手，不是因为彼此突然成了朋友，而是因为他们看到了同一份“体检报告”——而那份报告显示，全球数字基础设施的“免疫力”正在以肉眼可见的速度失效。

这不是一场关于“谁更强”的技术竞赛。

这是一场关于“谁先失控”的生存博弈。而你的银行卡、病历、聊天记录，都是这场博弈的赌注。

参考资料：

The Verge：《A new Anthropic model found security problems “in every major operating system and web browser”》

CRN：《5 Things To Know On Anthropic’s Claude Mythos And “Project Glasswing”》

智通财经：《Anthropic联合微软等科技巨头测试新AI模型以应对网络安全风险》

网易/《Ping值焦虑》：《苹果谷歌微软抱团Anthropic：4亿美元砸向AI防火墙》

Simon Willison：《Anthropic’s Project Glasswing—restricting Claude Mythos to security researchers—sounds necessary to me》

IT Brief New Zealand：《Anthropic launches Project Glasswing for cyber defence》

TechOrange：《Anthropic 不敢全面公開的 AI：Claude Mythos 為何正在重寫網路安全規則？》

东方财富网：《Anthropic推出顶级AI安全模型》

TMCnet Blog：《Anthropic’s Claude Mythos Preview Is Finding Bugs That Stumped Security Researchers for Decades》

网易/《大厂观察》：《地表最强AI发布，凭什么让12家科技巨头联手“看管”？》

“AIAB大赛”英雄帖，等你来揭

2026年3月20日春分，由Alinkr发起并倾力打造的“2026全球AI Agent Battles”正式启幕。赛事面向全球发出英雄帖，诚邀各路高手共赴盛事。

此次赛事汇聚全球顶尖学府、国际组织与产业力量，共同探索人类与AI智能体协作共生的新范式。在AI概念炒作的时代，我们相信：需要建立一套清晰、透明、可验证的评估体系，让真正具备自主决策能力、可执行、可落地的优秀AI Agent脱颖而出。

英雄不问出处，创意不分高低我们相信：优秀的技术，应该被看见，而不是被淹没；真实的价值，应该被相信，而不是被质疑；人类的未来，应该由人类自己定义，而不是被动接受。无论你身处何方，无论你来自哪个领域——只要你对“人机协作”的未来抱有期待，这里就有一方属于你的舞台。

报名方式：

关注官方微信公众号 “AIAB大赛”，或添加社群小助手（微信号：AIAB_helper），获取最新赛事资讯与报名入口。

2026全球AI Agent Battles 组委会

作者：穆美玲

编审：赵一丹