就在同一周内,Anthropic和OpenAI相继发布了各自最强的网络安全AI模型——Claude Mythos和GPT-5.4-Cyber。这两款模型都不向公众开放,却被誉为"史上最危险的AI",彻底引爆了整个安全圈。
一、Claude Mythos:发现27年旧漏洞的"神级"模型
4月13日,Anthropic悄悄推出了一款名为Claude Mythos Preview的模型,官方称之为"迄今为止最强大的前沿模型"。
不过,它不对任何公众开放。
光看数据就够震撼了:
最让安全圈颤抖的是这个细节:有工程师在晚上让模型跑RCE漏洞搜索任务,早上醒来发现一个完整可用的漏洞利用程序已经摆在眼前——模型通宵自主完成了全部工作。
⚡ 数据说话
SWE-bench 93.9% vs. 前代80.8%,提升了13个百分点。这不只是数字游戏——这意味着Mythos能完成的真实代码修复任务,比上一代多出接近一成。
只给10家公司用,投入1亿美元
Anthropic为此专门成立了一个叫"Project Glasswing"的封闭联盟,成员仅限:AWS、Apple、Cisco、CrowdStrike、Google、JPMorgan Chase、Linux Foundation、Microsoft、NVIDIA、Palo Alto Networks。
承诺投入1亿美元使用额度,但目标只有一个:识别并修复关键软件中的安全漏洞,纯防御用途。
Mythos Preview本身不会公开,但其研究成果会被整合进未来的Claude版本中。

二、OpenAI的回击:GPT-5.4-Cyber,仅数天后上线
Anthropic刚发布Mythos,OpenAI立刻不甘落后。
4月15日,GPT-5.4-Cyber正式亮相——这是今年3月发布的旗舰模型GPT-5.4的专用变体,针对防御性网络安全场景深度优化。
核心能力聚焦在:
- 二进制逆向工程:无需源代码就能分析已编译软件,检测恶意软件和漏洞
- 更宽松的拒绝边界:专为合法安全研究降低了响应限制
OpenAI没有走封闭联盟路线,而是选择了分级授权体系——通过今年2月推出的TAC(Trusted Access for Cyber)计划,分层开放给经过审查的安全厂商、研究机构和个人研究者。
个人用户可以在chatgpt.com/cyber申请验证,企业则需通过OpenAI代表申请。
💡 两种打法的本质区别
Anthropic走的是"精英联盟":10家顶级公司,1亿美元砸下去,目标明确。OpenAI走的是"平台化":TAC分

级体系,覆盖更广的安全专业社区,像API一样开放。
三、两款模型对比:同路不同术
| 对比维度 | GPT-5.4-Cyber | Claude Mythos |
|---|---|---|
| 模型性质 | GPT-5.4专用变体 | 全新一代前沿模型 |
| 发布方式 | TAC分级受控,面向安全专业人员 | Project Glasswing限定10家联盟 |
| 核心能力 | 二进制逆向、防御性工作流 | 自主漏洞发现与利用(攻防兼备) |
| 投资规模 | 未披露 | 承诺1亿美元使用额度 |
| 信息透明度 | 无具体基准数据 | 发布了完整系统卡和风险报告 |
两者有一个共同点:都拒绝完全公开发布,都声称只用于防御目的。
四、"危险系数爆表"的背后:为什么要藏着掖着?
这两款模型同日(同周)发布,同样不对外开放,这背后有一个逻辑:
超强的攻击能力,是这些模型的卖点,也是他们不能发布的原因。
Claude Mythos能在Firefox里找到可利用漏洞,成功率从2次暴增到181次——换句话说,如果这个模型落入黑客之手,互联网的安全格局将被彻底改写。
Hacker News上有个评论说得很直白:
"地球上有数以亿计的嵌入式设备无法轻易升级,它们将永久运行着存在漏洞的二进制程序。而这类AI让漏洞链式利用变得异常简单。"
Anthropic之所以发布风险报告、公布系统卡,本质上是在说:我们清楚这东西有多危险,所以我们选择了最严格的控制方式。
⚠️ 双刃剑困局
同样的AI能力,给安全研究员用,可以提前发现漏洞;给攻击者用,可以大规模制造威胁。这就是为什么业内把这类模型叫做"双刃剑"——而现在,这把剑的锋利程度比以往任何时候都高出一个数量级。
五、这场军备竞赛,才刚刚开始
回顾这一周的AI新闻,除了Anthropic和OpenAI,还有两件大事同步发生:
但在这些新闻里,网络安全AI的崛起是最值得警惕的一个信号:
当AI在漏洞挖掘上的能力超过人类最顶尖的安全研究员,我们进入的不只是一个"AI辅助安全"的时代——而是一个AI自主攻防的时代。
防守方有了更强的武器,但攻击方也在等待同样的技术扩散。
Anthropic用1亿美元和10家公司的联盟押注防御,OpenAI用TAC计划扩大安全社区的覆盖面——两条路线,本质上都是在赛跑。
只不过,他们在和谁赛跑,可能比我们想象的更复杂。
结语
从Mythos的"通宵自动挖洞",到GPT-5.4-Cyber的"无源码逆向工程",这一周的AI安全新闻可以用一句话概括:
AI已经不只是工具了,它开始成为参与者。
这场竞赛的最终裁判,不是哪家公司,不是哪个政府——而是这些模型能力扩散的速度,和我们构建防线的速度,谁更快。
参考来源
注释
[1] [Anthropic Releases Claude Mythos Preview with Cybersecurity Capabilities but Withholds Public Access](https://www.infoq.com/news/2026/04/anthropic-claude-mythos/) — InfoQ, 2026-04-13
[2] [Days after rival Anthropic launched Mythos, OpenAI announces GPT-5.4-Cyber AI model built for cybersecurity defenders](https://timesofindia.indiatimes.com/technology/tech-news/days-after-rival-anthropic-launched-mythos-openai-announces-gpt-5-4-cyber-ai-model-built-for-cybersecurity-defenders/articleshow/130272772.cms) — Times of India, 2026-04-15
[3] [Goodbye, Llama? Meta launches new proprietary AI model Muse Spark](https://venturebeat.com/technology/goodbye-llama-meta-launches-new-proprietary-ai-model-muse-spark-first-since) — VentureBeat, 2026-04-08
夜雨聆风