Anthropic的安全研究员盯着屏幕,不敢相信自己的眼睛。
Mythos——他们刚刚训练出来的AI模型——刚刚在OpenBSD的代码里找到了一个漏洞。OpenBSD是全世界公认最安全的操作系统之一,27年来被无数顶尖工程师翻来覆去地审计过。
没有人发现过这个漏洞。
Mythos只用了不到一分钟。
更让研究员后背发凉的是,这个模型不是专门为找漏洞设计的。它只是一个通用AI,“顺便”展示了一下自己在网络安全方面的天赋。
2026年4月7日,Anthropic做了一件在科技行业几乎没发生过的事。它发布了这个叫Claude Mythos Preview的模型,然后说:对不起,你们用不了。
不是技术故障,不是服务器不够,不是还在内测。
原因是——它太强了,强到Anthropic自己都不敢把它放出来。

一、它挖出了藏了27年的漏洞
Anthropic把Mythos放出去扫了一圈真实的代码库。
结果让人后背发凉。
在数周之内,Mythos自主发现了数千个零日漏洞。零日漏洞就是那种还没人发现、没有补丁、攻击者可以直接拿来用的安全漏洞——网络安全里最危险、最值钱的东西。
在CyberGym网络安全基准测试中,Mythos拿下了83.1%的得分。而Anthropic上一个最强版本Claude Opus 4.6,只有66.6%。
这不是一两个百分点的正常迭代。这是一刀砍下去、断崖式的性能跃迁。
更让人不安的是,Mythos不是一个专门为网络安全训练的模型。Anthropic前沿红队的网络安全负责人Newton Cheng告诉The Verge,Mythos是一个通用模型,它的网络安全能力“纯粹来自于强大的代理编码和推理能力”。
翻译一下:它在编程和推理上变强了,然后顺手发现自己找漏洞的能力也强得离谱。
在这批被发现的漏洞中,有三个案例让安全圈彻底沉默了。
第一个:OpenBSD系统里藏了一个27年的漏洞。 OpenBSD被公认为全球最安全的操作系统之一,27年来无数顶级安全工程师反复审计过它的代码,没有人发现这个漏洞。Mythos扫了一眼,找到了。
第二个:FFmpeg——一个被全世界视频应用广泛使用的开源库——里藏了一个16年的内存损坏漏洞。 那条有问题的代码行,被自动化扫描工具反复扫过超过500万次,每次都没有发现异常。500万次。Mythos看了一次,找到了。
第三个:在FreeBSD的NFS服务器里,Mythos发现了一个远程代码执行漏洞。 任何人,不经过任何授权,就能直接拿到整台服务器的最高管理权限。
发现漏洞是一回事。能利用漏洞是另一回事。而Mythos两者都能做。
在Firefox的JavaScript引擎测试中,Mythos将识别出的漏洞转化为成功攻击的成功率高达72.4%。对比一下,它之前的模型几乎做不到这一点,成功率接近于零。
Anthropic的红队博客披露了一个更具冲击力的案例:Mythos自主编写了一个浏览器漏洞利用程序,将四个不同的漏洞串联在一起,成功逃逸了浏览器的渲染器沙箱和操作系统的沙箱双重隔离。
这种级别的链式攻击,通常只有国家级的顶尖黑客团队才能做到。一个AI,自己完成了。

二、“我们还没准备好迎接它”
按常理,练出一个这么强的模型,Anthropic应该开香槟。
但整个公告的调性,跟兴奋完全不沾边。
Newton Cheng接受VentureBeat采访时说:“由于Claude Mythos Preview的网络安全特性,我们不打算将其公开发布。”
他说这句话的时候,用的是“不打算”,不是“暂不计划”。语气里没有商量的余地。
原因很简单:这把武器,现在还不能交到所有人手里。
Cheng接着解释道:“鉴于AI的发展速度,这类能力很快就会扩散,甚至可能超出那些致力于安全部署AI的机构与企业所能掌控的范围。这将对经济、公共安全与国家安全造成严重影响。”
翻译成人话就是:我们能做出来,别人很快也能做出来。如果我们不提前堵住漏洞,等别人的模型也具备这个能力时,全球互联网就是筛子。
这不是危言耸听。
Linux内核维护者Greg Kroah-Hartman在接受The Register采访时说了这么一段话,在安全圈被疯转:
“几个月前,我们收到的AI生成的安全报告还叫‘AI垃圾’,明显是错的或者质量很低。一个月前,情况变了。现在收到的报告是真实的、高质量的。我每天要花好几个小时处理这些报告。”
连Linux内核都开始收到“真正有用”的AI漏洞报告了。这件事本身,就是AI安全能力跨越某个临界点的最直接证据。
另一位安全研究员Thomas Ptacek干脆写了一篇文章,标题就叫《漏洞研究被终结了》。
三、12家死对头坐在了一张桌上
于是就有了这个史上罕见的场面。
4月7日,Anthropic宣布启动一个名为“Project Glasswing”(玻璃翼)的网络安全计划。
但真正让业界震惊的不是项目名字,而是参与名单。
创始合作伙伴包括:亚马逊AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金会、微软、英伟达、Palo Alto Networks。
读一遍这个名单。苹果和谷歌,微软和亚马逊,平时连会议室都不愿意共用。现在他们不仅坐在一起,还愿意把自己核心系统的代码库交给同一个AI模型来扫描。
在商业世界里,这几乎是不可能发生的事情。
ZDNET的专栏作家David Gewirtz在他的分析文章中写得很直白:“这既是可怕的消息,也是某种程度上的好消息。可怕在于,武器级AI已经把整个网络安全基础设施逼到了悬崖边;好消息是,竞争对手终于愿意联手填这个坑。”
Gewirtz还提到了一个关键变化:网络攻击的时间线正在从“月级”坍缩到“分钟级”。
传统防御还在开会讨论补丁方案的时候,AI驱动的攻击可能已经完成数据窃取和系统破坏。“这不是比喻,是FBI InfraGard AI威胁委员会成员观察到的实际趋势。”
这些公司看到了同一份威胁情报,而那份情报的结论,不适合对公众公开。

四、4亿美元不是买算力,
是买“预演时间”
12家巨头凑在一起,具体怎么花钱?
据多家媒体报道,这笔约4亿美元的资金流向三个方向:
第一,模型训练和部署,让Mythos能处理更大规模的代码审计。
第二,建立共享威胁情报网络,12家公司实时同步攻击样本和漏洞信息。
第三,资助开源安全项目。
Anthropic自己还额外掏了1亿美元的使用额度,以及400万美元直接捐赠给Linux基金会和阿帕奇软件基金会等开源安全组织。
项目的核心逻辑很简单:在其他人做出同样能力的模型之前,先用自己的模型把全球关键软件的漏洞扫一遍,堵上。
第一批获得Mythos Preview访问权限的,除了12家创始合作伙伴,还有超过40家维护关键软件基础设施的组织。这些系统支撑着全球金融、能源、通信的底层运转,以前由人类安全团队维护,周期以月为单位计算。现在,Mythos把排查周期压缩到了以分钟为单位。
摩根大通的加入尤其值得玩味。银行是网络攻击的重灾区,但金融行业的监管限制让银行很难快速采用外部AI工具。这次合作可能意味着在监管框架内开辟了一条快速通道。
苹果、谷歌、微软的参与则更加意味深长。三家的操作系统加起来覆盖了全球90%以上的终端设备,但他们的安全团队向来各自为战。现在他们要把漏洞数据库打通——David Gewirtz形容得好:“相当于三个互相猜忌的军火商,突然决定共用同一份敌方情报图。”
五、争议:是“囚禁”还是营销?
质疑声从第一天就没停过。
最大的争议来自一个简单的事实:Mythos的能力泄露,本身就是一次意外。
今年3月,Anthropic的一次内部配置失误,意外将关于Mythos的机密技术底牌公之于众。一个号称网络安全能力最强的AI模型,连自家文档都没守住。这种“医者不能自医”的反讽,在技术社区引发了大量讨论。
另一个质疑更尖锐:所谓“太危险不敢发布”,是不是另一种形式的营销?
毕竟,说自己的模型“强到不敢发布”,本身就是一个极其有效的传播策略。它制造悬念、制造稀缺感,还能把自己塑造成一个有责任感的AI公司。
但Anthropic这次的做法,跟传统的营销套路有明显区别。
如果只是为了炒作,你大可以限量发布、高价收费。但Anthropic做的事恰恰相反:把模型锁起来不给公众用,反而自己掏1亿美元补贴合作伙伴去用。这种“倒贴钱不让公众用”的操作,在商业逻辑上很难解释为“营销”。
一位技术评论者在博客中写道:“说‘我们的模型太危险不能发布’是制造话题的好方法,但这次,我认为他们的谨慎是有道理的。”

六、留给防守方的时间,到底还有多少
Glasswing项目的紧迫感,从各家公司高管的表态中能看得一清二楚。
微软全球CISO Igor Tsyganskiy说:“当我们进入一个网络安全不再受纯人类能力限制的阶段时,负责任地使用AI来大规模改善安全、降低风险的机会是前所未有的。”
Cisco的CSO Anthony Grieco说得更直接:“AI能力已经跨过了一个门槛,从根本上改变保护关键基础设施的紧迫性,没有回头路可走。我们的测试表明,我们能够以前所未有的速度和规模发现和修复漏洞。这是一个深刻的转变,也明确地表明,旧有的系统加固方法已经不够了。”
CrowdStrike的CISO Elia Zaitsev点出了时间维度的危机:“漏洞被发现和被利用之间的窗口已经坍塌——曾经需要数月的事情,现在在AI的帮助下只需几分钟。对手不可避免地也会寻求利用同样的能力。这不是放缓脚步的理由,而是我们更快、更紧密地行动的理由。”
翻译过来就是:防守方用AI找漏洞,攻击方也会用AI找漏洞。谁能跑得更快,决定了全球互联网的安全底线。
Anthropic的长期目标是让Mythos级别的模型能在大规模场景下开放使用,但前提是必须建立完善的安全护栏来检测和阻止它最危险的能力。Glasswing项目就是为这个目标进行的“压力测试”。
写在最后
技术评论人Simon Willison在他的博客里写了这么一段话:
“鉴于AI的进步速度,这类能力不会太久就会扩散,可能超出那些致力于安全部署它的实体所能掌控的范围。这就是为什么Glasswing项目如此重要——它不是阻止进步,而是确保防御方至少能领先一步。”
FBI InfraGard AI威胁委员会成员观察到,网络攻击的时间线正在从“月级”坍缩到“分钟级”。当武器级AI的攻防能力进入“分钟级”博弈,人类反应速度已经不够用了。唯一的办法,是让另一台AI跑在攻击者前面。
12家科技巨头史无前例地联手,不是因为彼此突然成了朋友,而是因为他们看到了同一份“体检报告”——而那份报告显示,全球数字基础设施的“免疫力”正在以肉眼可见的速度失效。
这不是一场关于“谁更强”的技术竞赛。
这是一场关于“谁先失控”的生存博弈。而你的银行卡、病历、聊天记录,都是这场博弈的赌注。
参考资料:
The Verge:《A new Anthropic model found security problems “in every major operating system and web browser”》
CRN:《5 Things To Know On Anthropic’s Claude Mythos And “Project Glasswing”》
智通财经:《Anthropic联合微软等科技巨头测试新AI模型 以应对网络安全风险》
网易/《Ping值焦虑》:《苹果谷歌微软抱团Anthropic:4亿美元砸向AI防火墙》
Simon Willison:《Anthropic’s Project Glasswing—restricting Claude Mythos to security researchers—sounds necessary to me》
IT Brief New Zealand:《Anthropic launches Project Glasswing for cyber defence》
TechOrange:《Anthropic 不敢全面公開的 AI:Claude Mythos 為何正在重寫網路安全規則?》
东方财富网:《Anthropic推出顶级AI安全模型》
TMCnet Blog:《Anthropic’s Claude Mythos Preview Is Finding Bugs That Stumped Security Researchers for Decades》
网易/《大厂观察》:《地表最强AI发布,凭什么让12家科技巨头联手“看管”?》

“AIAB大赛”英雄帖,等你来揭
2026年3月20日春分,由Alinkr发起并倾力打造的“2026全球AI Agent Battles”正式启幕。赛事面向全球发出英雄帖,诚邀各路高手共赴盛事。
此次赛事汇聚全球顶尖学府、国际组织与产业力量,共同探索人类与AI智能体协作共生的新范式。在AI概念炒作的时代,我们相信:需要建立一套清晰、透明、可验证的评估体系,让真正具备自主决策能力、可执行、可落地的优秀AI Agent脱颖而出。
英雄不问出处,创意不分高低我们相信:优秀的技术,应该被看见,而不是被淹没;真实的价值,应该被相信,而不是被质疑;人类的未来,应该由人类自己定义,而不是被动接受。无论你身处何方,无论你来自哪个领域——只要你对“人机协作”的未来抱有期待,这里就有一方属于你的舞台。
报名方式:
关注官方微信公众号 “AIAB大赛”,或添加社群小助手(微信号:AIAB_helper),获取最新赛事资讯与报名入口。
2026全球AI Agent Battles 组委会
作者:穆美玲
编审:赵一丹
夜雨聆风