AI揪出一个藏了27年的系统漏洞,然后事情开始失控-夜雨聆风

AI揪出一个藏了27年的系统漏洞,然后事情开始失控

OpenBSD，公认全球最安全的操作系统之一，被用于防火墙和关键基础设施。它有一个漏洞——藏了27年，没有任何人发现过。

上个月，一个AI模型找到了它。

不是安全专家，不是 fuzzing 工具，是 Anthropic 还没发布的前沿模型 Claude Mythos Preview。它还顺手发现了 Linux 内核里一条完整的提权攻击链，以及 FFmpeg 里一个经受了500万次自动化测试都没被发现的缺陷。

而且，这一切都是它自己干的。没有人给它提示。

“外星科技”

先说说 Mythos 到底是什么。

4月7日，Anthropic发布了一篇不同寻常的公告。不是产品发布会，不是新模型上线——而是一份近乎紧急的网络安全倡议书。

公告的核心内容：Anthropic训练出了一个前沿模型 Claude Mythos Preview，它在代码安全和漏洞发现方面的能力远远超过了之前的任何AI模型。在几乎所有主流操作系统和浏览器中，它自主发现了数千个高危零日漏洞。

这个模型目前不会公开发布。Anthropic把它定性为”AI对齐评估最好的模型”，同时也是”对齐风险最高的模型”。两个标签贴在同一样东西上。

27年，500万次，都没发现

三个具体案例能让你感受这个模型的能力边界。

OpenBSD的27年老漏洞。 Mythos发现了一个远程崩溃漏洞——攻击者只要连上目标机器，就能让整个系统崩溃。OpenBSD以安全著称，全球的防火墙和关键基础设施都在用它。这个bug从1999年就存在了，二十多年里无数安全专家审查过代码，没找到。

FFmpeg的500万次盲区。 这个被无数软件用来处理视频的库，有一行有缺陷的代码。自动化测试工具触达了这行代码500万次——一次都没报错。Mythos发现了。

Linux内核攻击链。 Mythos不只是找到一个漏洞，它自主地把多个漏洞串联成了一条完整的攻击链：从普通用户权限，一路提权到完全控制整台机器。全球大多数服务器跑的都是Linux。

注意，这些漏洞已经全部被报告给了维护者，目前已修复。但Anthropic手里还有大量未公开的漏洞——他们只公布了已经打补丁的部分，其他的给了加密哈希，等修复后再公开细节。

12家巨头连夜组队

发现漏洞是一回事，怎么处理是另一回事。Anthropic选择了一种罕见的应对方式：不发布模型，直接拉一支”联盟军”。

4月7日同一天，Anthropic宣布了 Project Glasswing（玻璃翼计划）。参与方名单读起来像是科技行业的一次”复仇者联盟”集结：

Amazon Web Services、Apple、Broadcom、Cisco、CrowdStrike、Google、JPMorganChase、Linux基金会、Microsoft、NVIDIA、Palo Alto Networks。

AWS、苹果、谷歌、微软、英伟达——平时在云计算、AI芯片、操作系统领域打得头破血流的对手，在这个问题上坐到了同一张桌子前。

Anthropic承诺投入1亿美元的模型使用额度，外加400万美元直接捐赠给开源安全组织（包括Linux基金会的Alpha-Omega和OpenSSF、Apache软件基金会）。这些资金专门用来帮助开源维护者——过去他们基本是在没有资源的情况下独自扛安全这面旗。

Project Glasswing的逻辑很简单但很残酷：攻击者迟早会拿到类似Mythos的能力。区别在于，谁先找到漏洞——是防守方还是攻击方。

CrowdStrike的CEO说得更直白：”漏洞被发现到被利用之间的窗口已经崩溃了——过去要几个月的事，现在AI几分钟就能干完。”

一个模型引发的市场震荡

Mythos带来的影响已经超出了技术圈。

软件股和加密货币下跌。 市场担心AI大幅降低网络攻击门槛后，现有软件的安全价值会被重新定价。比特币在消息传出后出现波动。

多国政府紧急评估。 据Axios报道，美国、英国、德国的政府机构都在紧急评估Mythos的影响。美国财政部和央行官员已经发布了网络安全预警。36氪的报道标题直接用了”外星科技”——中国媒体也注意到了这个事件的分量。

白宫顶着争议也要部署。 CNBC报道，白宫正在推动让美国联邦机构获得Mythos的使用权限。一些机构已经开始把这类模型视为”新的安全基础设施”。CNN更早的报道把Mythos称为网络安全的”分水岭时刻”。

同一周，Anthropic还干了什么

就在Mythos搅动全球网络安全格局的同一周，Anthropic还做了几件值得放在一起看的事。

4月16日，Claude Opus 4.7正式发布。 这个模型是Mythos的”安全版替代”。Anthropic在公告里明确说了：Opus 4.7的网络攻击能力被有意降低了（在训练过程中尝试差异化削减这些能力），同时部署了自动检测和拦截高风险网络安全请求的安全机制。定位很清楚——你想用强力模型写代码？用Opus 4.7。你想挖漏洞？走Project Glasswing的审核通道。

Opus 4.7本身的升级也不小：编程能力提升13%，视觉分辨率提高3倍（最高支持3.75百万像素图片），新增xhigh推理强度档位，新tokenizer让长文本处理更高效。价格不变——输入$5/百万token，输出$25/百万token。

Anthropic还同时发布了Claude Design（设计工具）、/ultrareview命令（代码审查）、task budgets（token预算控制）等一系列开发者功能。这些升级背后有一个清晰的信号：Anthropic正在把产品线分层——通用能力走公开发布路线，危险能力走受控通道。

Qwen同一天开源了3B参数打27B的性能怪兽。 阿里Qwen团队4月16日发布了Qwen3.6-35B-A3B——35B总参数，只有3B激活参数的MoE模型，Apache 2.0开源。SWE-bench Verified拿到73.4，Terminal-Bench 2.0拿到51.5，多项指标超过27B的密集模型。它还能直接接入Claude Code使用。

Google在4月2日发布了Gemma 4系列（26B-A4B、31B、E2B、E4B多个变体），智谱AI发布了GLM-5.1，Meta发布了Muse Spark。4月前两周，主流AI实验室密集发布了至少10个新模型。

真正的问题不是技术

回到Mythos。这个事件最值得深思的地方，不是模型有多强——而是Anthropic自己说的那句话：

“AI模型已经达到了一种编码能力水平，在发现和利用软件漏洞方面，它们可以超越除最顶尖人类之外的所有人。”

翻译一下：安全这个行业的门槛，被AI从”少数精英”拉到了”任何有API的人”。

过去发现零日漏洞需要顶级安全专家数周甚至数月的工作。现在一个模型，自主地、不需要人类引导地，批量发现数百个。随着AI能力继续提升（可能就在未来几个月），这类能力会扩散到更多参与者手中。Anthropic自己也承认了这一点——Project Glasswing本质上就是在和这个扩散赛跑。

90天后，Anthropic会公开第一份进展报告：修复了哪些漏洞、学到了什么、安全实践该怎么变。

但赛跑已经开始。问题是，防守方能跑多快。

数据来源：Anthropic官方公告（Project Glasswing、Claude Opus 4.7）、Cyber News Centre、36氪、CNBC、CNN、Axios、Fortune、Bloomberg。

你觉得AI发现漏洞这把双刃剑，最终会利好攻击方还是防守方？评论区聊聊。