当AI开始＂接管＂网络安全:AI 网安能力 4 个月翻倍!2026,攻防格局正在被改写

点击蓝字关注我们

一份来自英国AI安全研究所（AISI）题为《How fast is autonomous AI cyber capability advancing?》的研究报告，于2026年5月13日正式发布。它的核心结论简单而令人震颤：前沿大语言模型在执行特定网络安全任务时，自主能力的"时间窗口"每隔约4个月就翻一番。

这份报告不是预测，而是测量。它用的是真实的模型、真实的任务、真实的时间数据，而非概念推演。数字会说谎，但趋势不会。

让我们慢慢拆解这场正在发生的变革。

AISI搭建的这把"量尺"究竟量的是什么

要读懂这份报告，首先要理解AISI构建的评估框架——"时间窗口基准"。

通常，我们衡量AI的能力，习惯于用"准确率"或"成功率"来表述。但AISI的团队选择了一种更贴近现实的维度：时间。具体来说，他们关心的是："在给定成功率的前提下，AI能在多长的时间范围内，完成与人类专家水平相当的任务？"

这被称为"时间窗口"。

为此，研究团队搭建了一套"狭窄网络安全任务套件"，涵盖反向工程、漏洞利用、网页攻击等多类技能，每项任务都设置了人类专家完成时间的基准参考值。与此同时，为保证不同模型之间的可比性，每项任务限制AI的计算预算为250万个token。

举一个具体例子：AISI估计某任务需要人类专家花费约16分钟完成。在此基准下，Claude Sonnet 4.5能够以80%的成功率，在同等时间内完成这一任务。这听起来似乎只是一个数字，但当你把时间轴拉长，就会发现它背后隐藏的指数级增长曲线令人心惊。

2025年11月，AISI的估算是：80%可靠性时间窗口每8个月翻倍。

到2026年2月，这个数字压缩至4.7个月。

到2026年5月新一批模型发布后，翻倍周期再次显著缩短。

与此同时，非营利组织METR针对软件工程任务的独立基准也印证了这一趋势——软件相关任务的能力翻倍周期约为4.2个月，与AISI的网络安全基准高度吻合。

两条独立的数据曲线，指向同一个方向。

AI在模拟战场上，究竟打到了哪一步？

数字终究是抽象的。为了让AI的进步更加直观，AISI设计了两个复杂的"网络攻击靶场"，模拟真实企业和工业环境中的完整攻击链。

第一个靶场："The Last Ones"

这是一个32步骤的企业网络攻击模拟。攻击者已获得初始访问权限，任务是完成从侦察到全网接管的完整路径。人类专家估计完成全程需要约20小时。

在最新的Mythos Preview模型测试中，AI在10次尝试里成功完成了6次，平均完成22个步骤。更关键的是：这是AISI历史上首次观测到某个模型从头到尾完整通过这一攻击链。

对比来看，就在2026年2月，当时最强的Claude Opus 4.6模型，最多也只能走到22步，从未完整收尾。三个月，从"接近终点"到"全程完成"，这个跨越发生得比任何人预期的都要快。

第二个靶场："Cooling Tower"

这是一个7步骤的工业控制系统（ICS）攻击模拟，目标指向的是模拟中的电力设施控制软件。在Mythos Preview之前，没有任何模型能完整解决这一场景。而Mythos Preview在10次尝试中，成功完成了3次。

3次对10次，30%的成功率，在某些语境下听起来并不惊人。但请记住：在此之前，这个数字是零。

AISI在报告中将这一时刻称为里程碑性的：首次出现同一模型在两个不同范围内均取得突破。

值得细品的是，这些任务远非简单的脚本执行。以TLO中的关键里程碑为例，它要求AI完成：反向工程Windows服务二进制文件、访问并解密加密凭证、通过令牌伪装完成权限提升、恢复控制信道的加密密钥……每一步都需要自主规划、调试代码、处理错误、迭代推进——这些，过去是人类安全工程师的专属技能。

当然，AISI也坦诚地指出了局限：Mythos模型在真实开源项目curl中，只发现了一个经确认的漏洞。模拟靶场与真实世界之间，仍然存在巨大的鸿沟。AI在受控环境下的优势，尚不能直接等同于在复杂现实系统中的表现。

从"入门"到"专家级"，只用了两年

理解这场变革的速度，需要一点历史视角。

2023年，当时最先进的大语言模型在网络安全任务上的表现，大约相当于一名刚入门的实习生——能写几行扫描脚本，能查阅CVE数据库，但面对真正的链式攻击任务，几乎无从下手。AISI的报告用了一句话精准概括："2023年最佳模型只能勉强完成入门级挑战。"

两年后的今天，最新模型已经能够自主规划、执行并完成耗时20小时的企业网络入侵模拟。

这不是渐进式的进步，这是跨越式的飞跃。驱动这一飞跃的，是推理模型的兴起——自OpenAI o1系列、Anthropic Claude系列开始，AI从"回答问题的系统"演变为"能够多步规划的智能体"。它们可以自主调用工具、执行代码、分析日志，在一个复杂任务中持续迭代，直到找到解决方案。

技术演进的飞轮一旦开始转动，惯性就会越来越大。

这把"双刃剑"，锋利到什么程度？

AISI在报告中有一句话，我认为是全文最值得反复咀嚼的："AI网络安全能力将使攻击者更强，也将使防御者更强。"

这不是外交辞令，而是对现实的精准描述。

对攻击者而言，AI工具的扩散意味着发动渗透攻击的能力门槛正在持续降低。那些过去需要顶尖安全工程师才能执行的攻击链，未来可能被掌握了正确提示词的普通人触发。供应链攻击、无人值守的自动化入侵，将变得更加廉价和普遍。

对防御者而言，同样的技术也可以反向赋能。AI加速漏洞发现，意味着企业可以更快地修补自身系统；AI自动化安全审计，意味着小型组织也能享受过去只有大企业才能负担的安全水准。英国国家网络安全中心（NCSC）已经在着手发布相关指南，建议企业尽早投资AI辅助的漏洞管理体系。

问题在于，这场赛跑从来都不是公平的。攻击方天然具备不对称优势——他们只需要找到一个突破口，而防御方则必须守住每一道门。AI能力的扩散，可能会进一步放大这种不对称性。

对于从业人员而言，这场变革同样是一把双刃剑。一方面，重复性工作被自动化替代，专家可以从繁琐的基础审计中解放出来，聚焦于更高价值的战略判断和复杂威胁分析。另一方面，那些长期依赖"执行"而非"思考"的岗位，将面临真实的生存压力。

行业的人才需求结构将发生深刻变化：对AI工具集成能力的要求会上升，对机械执行能力的需求会下降。新职位如AI网络安全工程师、人机协作专家将逐渐成为主流。网络安全专业人才的培养体系，也需要尽快更新迭代。

我们不该忽视的"已知局限"

任何严肃的分析，都必须正视数据的边界。

AISI的基准是"窄化"的——它测量的是特定类型的自主攻击任务，并不代表AI在所有安全维度上都已达到人类专家水平。靶场场景中，初始访问权限是预先给定的，没有主动防御工具，没有触发警报的惩罚机制，与真实企业环境相比仍是高度简化的版本。

token预算限制（250万）以及简单的代理脚手架，也在一定程度上低估了AI的实际潜力。若解除限制，成功率理论上会更高——但这也意味着，我们看到的已经是"保守版"的AI。

研究者在报告中诚实地写道："我们不知道进展速度如何演变，也不知道AI何时会跨越特定的能力门槛，或这些能力如何应用于防御真实世界系统。"

这句话的分量，不亚于所有令人惊叹的数字。

行动指南：这一刻，我们该做什么？

面对这份报告，恐慌是最无益的反应，漠视同样危险。作为在这个行业多年的观察者，我想提几点务实的思考。

对于安全从业者：现在就开始学习如何与AI工具协同工作，而不是等待AI"逼近"再被动应对。提示工程、AI输出的批判性评估、人机协作流程的设计——这些将成为未来安全工程师的核心竞争力之一。专业纵深依然是护城河，但单纯依赖执行经验的时代正在过去。

对于企业和组织：将AI纳入安全防御体系是必要的，但不是充分的。更重要的是构建扎实的安全基线——补丁管理、权限最小化、网络分段、日志审计，这些"基本功"在AI时代不会过时，只会更加重要。同时，认真评估AI工具在攻击面扩大方面带来的新风险，不要只看防御收益。

对于监管机构和政策制定者： AISI的研究提供了一个难得的量化参考。制定AI安全评估框架、建立AI能力阶段性报告机制、推动攻防双方的透明度提升——这些工作需要提前布局，而非在危机发生后亡羊补牢。

尾声：警钟与指南，一体两面

站在2026年的时间节点上回望，我们正处于一个奇异的历史临界点。

过去，"AI会颠覆网络安全"是一个被反复讲述却始终模糊的故事。今天，AISI用一套量化基准，把这个故事变成了一条清晰的曲线——一条每4个月就向上翻折一次的曲线。它提示我们：变化的速度，比我们以为的更快；留给我们调整的时间，比我们希望的更短。

技术的演进从来不是为了消灭人类，而是为了释放人类。网络安全，本质上是人类智识与威胁博弈的场域。AI的加入，改变了博弈的工具，但没有改变博弈的本质——守护系统、守护数据、守护人们在数字世界中的基本安全感，这仍然需要有判断力、有责任感的人来主导。

AISI的报告是一声警钟，也是一份指南。它告诉我们的不只是AI跑得多快，更是我们需要以多快的速度，重新定义自己在这个行业中的位置。

拥抱变革，构建弹性，迎接AI时代。这不是口号，是当下最紧迫的行动纲领。

来源：安全牛