英国 AI 安全研究机构刚刚发现,Claude Mythos Preview 和 GPT-5.5 在自主网络安全任务上冲破了原有趋势线。一个模型能在 10 次里 6 次完成 32 步模拟企业网络攻击,另一个也能完成 3 次。Google 还说,AI 辅助的网络攻击不是快来了,而是已经开始了。说白了,这不是 AI 行业又发明了一个吓人的词,而是攻击门槛正在被真实拉低。
英国 AI Security Institute 做了一个网络靶场。
别想得太玄乎。
就是把一个小型、没怎么防守的企业网络摆在那里,让模型自己进去,自己找路,自己推进任务。像游戏副本,但目标不是刷怪,是模拟多阶段攻击。
然后事情开始不对劲。
Anthropic 的 Claude Mythos Preview,一个更新后的 checkpoint,在 10 次尝试里,6 次完成了一个叫 “The Last Ones” 的 32 步模拟企业网络攻击任务。
32 步。不是让它回答“什么是 SQL 注入”。不是让它写一段漏洞解释。是让它沿着任务链往前走,像一个知道自己要干什么的网络攻击执行者。
更扎眼的是,另一个叫 “Cooling Tower” 的工业控制系统攻击任务,之前没有任何模型能完成。Claude Mythos Preview 这回 10 次里完成了 3 次。
OpenAI 的 GPT-5.5 也没闲着。它在 “The Last Ones” 里 10 次完成了 3 次。
这叫什么?这叫 AI 已经不是站在门口问路了。它开始会推门了。
最吓人的不是强,是变强的速度
这条新闻真正让人后背发凉的地方,不是某个模型赢了某个榜。
榜太多了。今天你第一,明天我第一,AI 圈每天都像小学生抢红花。
真正的问题是速度。
AISI 原本估算,前沿模型在“80% 可靠性网络安全时间跨度”这个指标上,大概每 4.7 个月翻一倍。再往前看,2025 年 11 月他们估的是 8 个月。
也就是说,研究人员已经把预期从 8 个月压到 4.7 个月了。
结果 Claude Mythos Preview 和 GPT-5.5 又把这条线打穿了。
AISI 自己说:前沿 AI 的自主网络和软件能力正在快速推进,模型能独立完成的网络任务长度,是按月翻倍,不是按年。
说白了就是,安全团队原本以为自己在看一辆越来越快的车。现在发现那玩意儿可能不是车,是贴地飞行。
别急着说“这只是靶场”。当然是靶场。现实世界有防御,有日志,有权限,有补丁,有乱七八糟的旧系统,还有人类安全团队半夜被告警吵醒后的低血压。
但你看问题不能只看现在能不能直接打穿真实世界。
你要看门槛正在往哪里移动。
以前一个攻击链,需要有经验的人一点点试。
以后可能变成:人负责给目标,AI 负责跑路径,人再挑能用的结果。
这不是科幻。
这是成本结构变了。
网络攻击最贵的东西从来不只是工具,而是熟练劳动力。会找洞、会串链、会判断下一步怎么走的人,不便宜,也不多。
如果模型开始吃掉这部分工作,攻击者就不用人人都是高手。
他只需要会问,会筛,会等。
笑吧,AI 普惠来了。
网络靶场里,AI 已经不只是“解释漏洞”,而是在走任务链。
Google 那句话,比发布会都难听
同一天,Google Threat Intelligence Group 也抛了一桶冷水。
他们说,犯罪组织和中俄朝相关的国家背景攻击者,已经在把 AI 接进网络行动里。
这不是“未来风险”。
Google 的 John Hultquist 说得更直:
“有一种误解,认为 AI 漏洞竞赛即将到来。现实是,它已经开始了。”
这句话很硬。
因为它把行业里最舒服的那层窗户纸捅破了。
很多人讲 AI 安全,喜欢讲成哲学问题。什么失控,什么对齐,什么超级智能。听起来很宏大,也很方便装深沉。
但网络安全这边没那么优雅。
它不是问 AI 会不会有一天统治人类。
它问的是:今晚有没有人用 AI 扫你的系统?有没有人用 AI 写 exploit?有没有人用 AI 改 malware?有没有人用 AI 批量试你的员工账号?
Google 提到一个案例:一个和犯罪活动有关的零日利用,针对一个常用的开源 Web 系统管理工具,漏洞能绕过双因素认证,但仍然需要有效凭据。代码里出现了一些很像 AI 生成的痕迹:教学式注释、幻觉出来的 CVSS 分数、整齐得过分的 Python 结构。
有意思的是,攻击者写得还不够好。实现里的错误降低了大规模利用成功率。
听起来像好消息?
不。
这只是第一批拿刀的人还不太会磨刀。
真正的问题是,下一批会更熟。
OpenAI 和 Anthropic 都在做一件尴尬的事:把刀递给“好人”
OpenAI 推了 GPT-5.5-Cyber。
不是公开给所有人,而是有限预览,给经过审核的网络安全团队。
CNBC 的报道里说,这个版本并不是单纯能力大升级,而是对安全相关任务更“放得开”。比如漏洞识别、漏洞分诊、补丁验证、恶意软件分析。
Anthropic 的 Claude Mythos Preview 也类似。
它通过 Project Glasswing 限制访问,优先给防御方。此前 Anthropic 还把 Mythos 说得很重:太强,不适合直接放给公众,因为黑客可能用它以惊人速度利用网络漏洞。
这件事很别扭。
一边是模型公司告诉你:我们的东西太危险,所以不能随便给。
另一边是模型公司又告诉你:但我们会给一些我们认为可靠的人。
听起来像什么?像军火商开了个道德委员会。
当然,我不是说 OpenAI 或 Anthropic 不该这么做。更现实一点讲,不限访问才是真疯了。
但这里有一个更大的问题:谁来定义“可靠的人”?
美国公司定义?政府定义?几个头部云厂商和安全公司定义?还是说,谁跟它们关系好,谁就先拿到下一代网络安全外挂?
别装天真。
这东西一旦能显著提高漏洞发现效率,它就不是普通产品。它会影响企业防御,影响攻击能力,影响国家之间的安全差距。
以前大家争的是芯片。
现在还要争模型访问权。
企业真正该害怕的,不是 AI 攻击者,是自己还在用旧脑子防守
很多企业看到这种新闻,第一反应会是:那我是不是也要上 AI 安全工具?
要。
但别把这事想简单。
不是买一个“AI 安全平台”,PPT 上画几个发光盾牌,事情就结束了。
AI 攻击变快之后,企业最先暴露的不是技术短板,而是组织短板。
你的补丁流程是不是还要走三层审批?
你的资产清单是不是连自己有多少台暴露服务器都说不清?
你的安全告警是不是一天几千条,没人知道哪条该先看?
你的开发团队是不是觉得安全团队只会卡上线?
如果这些问题还在,AI 只会把差距撕得更大。
因为攻击者用 AI 提速,防守方还在开会。
这画面很难看:一边是模型几分钟跑完一条攻击路径,另一边是公司群里还在问“这个系统负责人是谁”。
想想也是。
安全行业喊了这么多年基础建设,资产管理、权限治理、日志留存、漏洞修复、分级响应,听起来都不性感。
现在好了,AI 把不性感的东西变成生死线。
你欠下的基础债,最后都会变成攻击者的提示词。
这次不是“AI 取代安全工程师”那么简单
有人会把这件事写成“AI 要取代网络安全专家”。
这说法太懒。
真正会发生的,是安全工作的分层重组。
低水平、重复性的扫描、归类、初步分析,会被模型吃掉一大块。
中间层的漏洞验证、路径分析、修复建议,会变成 AI 和人混合完成。
高水平的安全判断、攻击面设计、应急决策、跨团队协调,反而更值钱。
但问题来了。
如果一个行业底层训练场被 AI 吃掉,新人怎么成长?
以前安全新人从看告警、复现漏洞、写报告开始练。脏活累活虽然烦,但那是基本功。
以后如果这些都交给模型,人类只负责看结果,那几年后我们可能得到一批“会管理 AI 安全平台,但不懂系统怎么坏掉”的安全经理。
这很危险。
因为 AI 会犯错。
靶场会误导。
模型会幻觉。
攻击者会反过来骗模型。
如果人只会点确认,不会判断确认背后是什么,那防守不是自动化,是自动投降。
别把这事写成末日,也别当成营销
我不想把这篇写成“AI 马上毁灭网络世界”。
那太廉价。
但更廉价的是另一种口吻:哎呀,新技术都有两面性,我们要拥抱变化,加强治理。
这种话看起来稳,其实什么都没说。
这次真正该下的判断是:AI 正在把网络攻防从“专家对专家”的游戏,推向“系统对系统”的游戏。
以前攻击者强,靠人强。
以后攻击者强,可能靠流程强,靠模型强,靠自动化强。
防守方也一样。
谁的响应链路更短,谁的权限边界更清楚,谁的资产更透明,谁能把 AI 放进正确的位置,谁活得久一点。
不是谁买了最贵模型,谁就安全。
安全从来不是买来的,是堆出来的。
一层一层堆。
资产、权限、日志、补丁、隔离、演练、响应。
以前这些东西像老生常谈。
现在它们像防洪堤。
水已经涨起来了。
这把刀不会自己变钝
最讽刺的是,AI 网络安全能力越强,大家越不能不用它。
攻击者用,你不用,你慢。
防守者用,攻击者也会学。
模型公司限制访问,迟早有人绕过去。
开源模型追上来,门槛还会继续降。
最后我们会进入一个很拧巴的时代:
每家公司都在说自己用 AI 保护你。
每个攻击者也在用 AI 更快地接近你。
同一把刀,白天挂在安全展台上,晚上出现在黑产群里。
说白了就是,AI 没有让网络世界更安全。它只是让攻防双方都换上了电动车。问题是,你的刹车还停在自行车时代。
参考资料
CyberScoop:Researchers say AI just broke every benchmark for autonomous cyber capability,2026-05-13
The Register:AI models are getting better at replacing cybersecurity pros on certain tasks,2026-05-14
SecurityBrief Asia:Google says AI-powered cyberattacks are already here,2026-05-14
CNBC:OpenAI rolls out GPT-5.5-Cyber to vetted cybersecurity teams,2026-05-07

夜雨聆风