AI揪出一个藏了27年的系统漏洞,然后事情开始失控
OpenBSD,公认全球最安全的操作系统之一,被用于防火墙和关键基础设施。它有一个漏洞——藏了27年,没有任何人发现过。
上个月,一个AI模型找到了它。
不是安全专家,不是 fuzzing 工具,是 Anthropic 还没发布的前沿模型 Claude Mythos Preview。它还顺手发现了 Linux 内核里一条完整的提权攻击链,以及 FFmpeg 里一个经受了500万次自动化测试都没被发现的缺陷。
而且,这一切都是它自己干的。没有人给它提示。
“外星科技”
先说说 Mythos 到底是什么。
4月7日,Anthropic发布了一篇不同寻常的公告。不是产品发布会,不是新模型上线——而是一份近乎紧急的网络安全倡议书。
公告的核心内容:Anthropic训练出了一个前沿模型 Claude Mythos Preview,它在代码安全和漏洞发现方面的能力远远超过了之前的任何AI模型。在几乎所有主流操作系统和浏览器中,它自主发现了数千个高危零日漏洞。
这个模型目前不会公开发布。Anthropic把它定性为”AI对齐评估最好的模型”,同时也是”对齐风险最高的模型”。两个标签贴在同一样东西上。
27年,500万次,都没发现
三个具体案例能让你感受这个模型的能力边界。
OpenBSD的27年老漏洞。 Mythos发现了一个远程崩溃漏洞——攻击者只要连上目标机器,就能让整个系统崩溃。OpenBSD以安全著称,全球的防火墙和关键基础设施都在用它。这个bug从1999年就存在了,二十多年里无数安全专家审查过代码,没找到。
FFmpeg的500万次盲区。 这个被无数软件用来处理视频的库,有一行有缺陷的代码。自动化测试工具触达了这行代码500万次——一次都没报错。Mythos发现了。
Linux内核攻击链。 Mythos不只是找到一个漏洞,它自主地把多个漏洞串联成了一条完整的攻击链:从普通用户权限,一路提权到完全控制整台机器。全球大多数服务器跑的都是Linux。
注意,这些漏洞已经全部被报告给了维护者,目前已修复。但Anthropic手里还有大量未公开的漏洞——他们只公布了已经打补丁的部分,其他的给了加密哈希,等修复后再公开细节。
12家巨头连夜组队
发现漏洞是一回事,怎么处理是另一回事。Anthropic选择了一种罕见的应对方式:不发布模型,直接拉一支”联盟军”。
4月7日同一天,Anthropic宣布了 Project Glasswing(玻璃翼计划)。参与方名单读起来像是科技行业的一次”复仇者联盟”集结:
Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux基金会、Microsoft、NVIDIA、Palo Alto Networks。
AWS、苹果、谷歌、微软、英伟达——平时在云计算、AI芯片、操作系统领域打得头破血流的对手,在这个问题上坐到了同一张桌子前。
Anthropic承诺投入1亿美元的模型使用额度,外加400万美元直接捐赠给开源安全组织(包括Linux基金会的Alpha-Omega和OpenSSF、Apache软件基金会)。这些资金专门用来帮助开源维护者——过去他们基本是在没有资源的情况下独自扛安全这面旗。
Project Glasswing的逻辑很简单但很残酷:攻击者迟早会拿到类似Mythos的能力。区别在于,谁先找到漏洞——是防守方还是攻击方。
CrowdStrike的CEO说得更直白:”漏洞被发现到被利用之间的窗口已经崩溃了——过去要几个月的事,现在AI几分钟就能干完。”
一个模型引发的市场震荡
Mythos带来的影响已经超出了技术圈。
软件股和加密货币下跌。 市场担心AI大幅降低网络攻击门槛后,现有软件的安全价值会被重新定价。比特币在消息传出后出现波动。
多国政府紧急评估。 据Axios报道,美国、英国、德国的政府机构都在紧急评估Mythos的影响。美国财政部和央行官员已经发布了网络安全预警。36氪的报道标题直接用了”外星科技”——中国媒体也注意到了这个事件的分量。
白宫顶着争议也要部署。 CNBC报道,白宫正在推动让美国联邦机构获得Mythos的使用权限。一些机构已经开始把这类模型视为”新的安全基础设施”。CNN更早的报道把Mythos称为网络安全的”分水岭时刻”。
同一周,Anthropic还干了什么
就在Mythos搅动全球网络安全格局的同一周,Anthropic还做了几件值得放在一起看的事。
4月16日,Claude Opus 4.7正式发布。 这个模型是Mythos的”安全版替代”。Anthropic在公告里明确说了:Opus 4.7的网络攻击能力被有意降低了(在训练过程中尝试差异化削减这些能力),同时部署了自动检测和拦截高风险网络安全请求的安全机制。定位很清楚——你想用强力模型写代码?用Opus 4.7。你想挖漏洞?走Project Glasswing的审核通道。
Opus 4.7本身的升级也不小:编程能力提升13%,视觉分辨率提高3倍(最高支持3.75百万像素图片),新增xhigh推理强度档位,新tokenizer让长文本处理更高效。价格不变——输入$5/百万token,输出$25/百万token。
Anthropic还同时发布了Claude Design(设计工具)、/ultrareview命令(代码审查)、task budgets(token预算控制)等一系列开发者功能。这些升级背后有一个清晰的信号:Anthropic正在把产品线分层——通用能力走公开发布路线,危险能力走受控通道。
Qwen同一天开源了3B参数打27B的性能怪兽。 阿里Qwen团队4月16日发布了Qwen3.6-35B-A3B——35B总参数,只有3B激活参数的MoE模型,Apache 2.0开源。SWE-bench Verified拿到73.4,Terminal-Bench 2.0拿到51.5,多项指标超过27B的密集模型。它还能直接接入Claude Code使用。
Google在4月2日发布了Gemma 4系列(26B-A4B、31B、E2B、E4B多个变体),智谱AI发布了GLM-5.1,Meta发布了Muse Spark。4月前两周,主流AI实验室密集发布了至少10个新模型。
真正的问题不是技术
回到Mythos。这个事件最值得深思的地方,不是模型有多强——而是Anthropic自己说的那句话:
“AI模型已经达到了一种编码能力水平,在发现和利用软件漏洞方面,它们可以超越除最顶尖人类之外的所有人。”
翻译一下:安全这个行业的门槛,被AI从”少数精英”拉到了”任何有API的人”。
过去发现零日漏洞需要顶级安全专家数周甚至数月的工作。现在一个模型,自主地、不需要人类引导地,批量发现数百个。随着AI能力继续提升(可能就在未来几个月),这类能力会扩散到更多参与者手中。Anthropic自己也承认了这一点——Project Glasswing本质上就是在和这个扩散赛跑。
90天后,Anthropic会公开第一份进展报告:修复了哪些漏洞、学到了什么、安全实践该怎么变。
但赛跑已经开始。问题是,防守方能跑多快。
数据来源:Anthropic官方公告(Project Glasswing、Claude Opus 4.7)、Cyber News Centre、36氪、CNBC、CNN、Axios、Fortune、Bloomberg。
你觉得AI发现漏洞这把双刃剑,最终会利好攻击方还是防守方?评论区聊聊。
夜雨聆风