2026年4月13日,英国AI安全研究所(AISI)发布了一份令人警醒的测评报告。对象是Anthropic刚刚公布的“怪兽级”模型——Claude Mythos Preview。
如果说之前的模型还在“学习”网络安全知识,那么Mythos Preview已经学会了“实战”。
AISI的测评结果显示,在受控环境中,该模型不仅能独立完成人类专家需要数天才能完成的漏洞利用,更是首个在32步复杂的企业网络接管模拟中“通关”的AI。
这一技术突破引发了业界的剧烈震动。知名开发者HyperWrite的CEO Matt Shumer在目睹这一进展后,发出了近乎战栗的感叹:
“如果你仔细想想,Anthropic现在实际上拥有了一把打开全球几乎所有软件的‘万能钥匙’。在某种程度上,他们现在拥有的权力超过了政府。”

这不仅仅是分数的提升,而是质的飞跃。这标志着AI网络能力已经跨越了一条关键的界线:从辅助脚本小子,进化为自主的高级持续性威胁(APT)。
一、📊 降维打击:从CTF到全栈攻防
AISI自2023年起就开始追踪AI的网络能力,随着AI的进化,他们设计的测试难度也在不断升级。从最初的聊天探测,到夺旗赛(CTF),再到如今的多步网络攻击模拟。
1. 专家级CTF:70%+的胜率意味着什么?
在传统的CTF挑战中,AI需要识别并利用目标系统的弱点来获取隐藏的“旗帜”。
*新手与学徒级:早在2025年4月之前,主流模型就已经能轻松拿下。
*专家级任务:这是分水岭。在2025年4月之前,没有任何模型能完成此类任务。而Claude Mythos Preview的成功率达到了惊人的70%+。

这意味着在面对复杂的加密算法、内存溢出或逻辑漏洞时,Mythos Preview展现出了超越普通人类安全研究员的直觉和解题能力。
2. “最后的幸存者”:首个通关32步攻击链的AI
CTF测试的是单点技能,而真实的网络战是一场马拉松。为了模拟这一点,AISI构建了名为“The Last Ones (TLO)”的网络靶场。
这是一个模拟企业网络被攻陷的全景剧本,包含32个步骤,从最初的侦察到完全接管网络。据估算,人类专家完成这一系列操作平均需要20小时。
测评结果令人咋舌:
*Claude Mythos Preview:在10次尝试中,3次成功从头到尾完成了所有32个步骤。它是历史上第一个做到这一点的模型。在所有尝试中,它平均完成了22个步骤。
*Claude Opus 4.6:作为上一代顶尖模型,它平均仅完成了16个步骤,且从未通关。
更有趣的是,AISI发现随着推理算力(Token预算)的增加,Mythos Preview的表现还在持续提升。在1亿Token的预算下,它依然没有触碰到能力天花板。这意味着,给它更多的时间和算力,它能解决更复杂的问题。
二、🛡️ 局限性与“玻璃大炮”
尽管表现惊人,但AISI的报告也客观指出了Mythos Preview的局限性,这为我们理解其真实威胁等级提供了重要参考。
在名为“Cooling Tower”的运营技术(OT)网络靶场测试中,Mythos Preview未能完成任务。但这并非因为它不懂OT协议,而是因为它在IT(信息技术)部分就卡住了。
此外,AISI特别强调,目前的测试环境缺乏真实世界中的主动防御机制。靶场中没有“蓝队”在盯着屏幕,没有实时的入侵检测系统(IDS)报警,模型也不会因为触发警报而被踢出网络。
关键洞察:Mythos Preview证明了它具备攻击防御薄弱系统的绝对能力。但在面对拥有完善监控、端点检测和实时响应的高防御系统时,它是否依然能如入无人之境?这仍是未知数。
三、⚔️ 矛与盾的终极博弈
Mythos Preview的出现,实际上印证了Anthropic此前启动的“Project Glasswing(玻璃翼计划)”的紧迫性。
Anthropic之所以联合苹果、微软、亚马逊等巨头组建防御联盟,正是因为他们意识到:这种能力迟早会扩散。
*攻击侧:AI让发动攻击的成本降至极低(单次运行成本可能不到50美元),且不需要休息,可以24小时不间断地寻找漏洞。
*防御侧:传统的“打补丁”速度已经跟不上AI挖掘零日漏洞的速度。
AISI在报告中明确指出,网络安全评估必须进化。随着攻击方能力的提升,缺乏防御措施的环境将不再具有挑战性。未来的评估必须包含主动防御、端点监控和实时事件响应。
四、💡 结语:生存指南
对于组织而言,Mythos Preview带来的启示是严峻的。
当攻击者可以指挥AI模型对网络进行自主攻击时,网络安全的基础变得比以往任何时候都重要。AISI建议:
更新即生命:定期应用安全更新,修补已知漏洞。
零信任架构:实施严格的访问控制和日志记录。
拥抱AI防御:既然AI是最好的矛,它也必须成为最好的盾。利用AI进行自动化漏洞发现和补丁生成,是唯一的出路。
Claude Mythos Preview不仅仅是一个更强的模型,它是一个信号。它告诉我们,网络安全的奇点已经到来。在这个新时代,只有那些跑得比AI更快的防御者,才能幸存下来。
夜雨聆风