手握全球软件的“万能钥匙”?AISI测评揭秘Claude Mythos Preview的恐怖实力

2026年4月13日，英国AI安全研究所（AISI）发布了一份令人警醒的测评报告。对象是Anthropic刚刚公布的“怪兽级”模型——Claude Mythos Preview。

如果说之前的模型还在“学习”网络安全知识，那么Mythos Preview已经学会了“实战”。

AISI的测评结果显示，在受控环境中，该模型不仅能独立完成人类专家需要数天才能完成的漏洞利用，更是首个在32步复杂的企业网络接管模拟中“通关”的AI。

这一技术突破引发了业界的剧烈震动。知名开发者HyperWrite的CEO Matt Shumer在目睹这一进展后，发出了近乎战栗的感叹：

“如果你仔细想想，Anthropic现在实际上拥有了一把打开全球几乎所有软件的‘万能钥匙’。在某种程度上，他们现在拥有的权力超过了政府。”

这不仅仅是分数的提升，而是质的飞跃。这标志着AI网络能力已经跨越了一条关键的界线：从辅助脚本小子，进化为自主的高级持续性威胁（APT）。

一、📊 降维打击：从CTF到全栈攻防

AISI自2023年起就开始追踪AI的网络能力，随着AI的进化，他们设计的测试难度也在不断升级。从最初的聊天探测，到夺旗赛（CTF），再到如今的多步网络攻击模拟。

1. 专家级CTF：70%+的胜率意味着什么？

在传统的CTF挑战中，AI需要识别并利用目标系统的弱点来获取隐藏的“旗帜”。

*新手与学徒级：早在2025年4月之前，主流模型就已经能轻松拿下。

*专家级任务：这是分水岭。在2025年4月之前，没有任何模型能完成此类任务。而Claude Mythos Preview的成功率达到了惊人的70%+。

这意味着在面对复杂的加密算法、内存溢出或逻辑漏洞时，Mythos Preview展现出了超越普通人类安全研究员的直觉和解题能力。

CTF测试的是单点技能，而真实的网络战是一场马拉松。为了模拟这一点，AISI构建了名为“The Last Ones (TLO)”的网络靶场。

这是一个模拟企业网络被攻陷的全景剧本，包含32个步骤，从最初的侦察到完全接管网络。据估算，人类专家完成这一系列操作平均需要20小时。

测评结果令人咋舌：

*Claude Mythos Preview：在10次尝试中，3次成功从头到尾完成了所有32个步骤。它是历史上第一个做到这一点的模型。在所有尝试中，它平均完成了22个步骤。

*Claude Opus 4.6：作为上一代顶尖模型，它平均仅完成了16个步骤，且从未通关。

更有趣的是，AISI发现随着推理算力（Token预算）的增加，Mythos Preview的表现还在持续提升。在1亿Token的预算下，它依然没有触碰到能力天花板。这意味着，给它更多的时间和算力，它能解决更复杂的问题。

尽管表现惊人，但AISI的报告也客观指出了Mythos Preview的局限性，这为我们理解其真实威胁等级提供了重要参考。

在名为“Cooling Tower”的运营技术（OT）网络靶场测试中，Mythos Preview未能完成任务。但这并非因为它不懂OT协议，而是因为它在IT（信息技术）部分就卡住了。

此外，AISI特别强调，目前的测试环境缺乏真实世界中的主动防御机制。靶场中没有“蓝队”在盯着屏幕，没有实时的入侵检测系统（IDS）报警，模型也不会因为触发警报而被踢出网络。

关键洞察：Mythos Preview证明了它具备攻击防御薄弱系统的绝对能力。但在面对拥有完善监控、端点检测和实时响应的高防御系统时，它是否依然能如入无人之境？这仍是未知数。

Mythos Preview的出现，实际上印证了Anthropic此前启动的“Project Glasswing（玻璃翼计划）”的紧迫性。

Anthropic之所以联合苹果、微软、亚马逊等巨头组建防御联盟，正是因为他们意识到：这种能力迟早会扩散。

*攻击侧：AI让发动攻击的成本降至极低（单次运行成本可能不到50美元），且不需要休息，可以24小时不间断地寻找漏洞。

*防御侧：传统的“打补丁”速度已经跟不上AI挖掘零日漏洞的速度。

AISI在报告中明确指出，网络安全评估必须进化。随着攻击方能力的提升，缺乏防御措施的环境将不再具有挑战性。未来的评估必须包含主动防御、端点监控和实时事件响应。

对于组织而言，Mythos Preview带来的启示是严峻的。

当攻击者可以指挥AI模型对网络进行自主攻击时，网络安全的基础变得比以往任何时候都重要。AISI建议：

更新即生命：定期应用安全更新，修补已知漏洞。

零信任架构：实施严格的访问控制和日志记录。

拥抱AI防御：既然AI是最好的矛，它也必须成为最好的盾。利用AI进行自动化漏洞发现和补丁生成，是唯一的出路。

Claude Mythos Preview不仅仅是一个更强的模型，它是一个信号。它告诉我们，网络安全的奇点已经到来。在这个新时代，只有那些跑得比AI更快的防御者，才能幸存下来。