AI日报 | Anthropic Mythos引爆网络安全＂零日海啸＂,MiniMax M2.7开源刷榜,编程三巨头意外合体

今天最值得关注的AI新闻：Anthropic的Claude Mythos模型因"过于强大"拒绝公开发布，在网络安全圈掀起一场"零日海啸"；MiniMax开源自进化Agent模型M2.7登顶SWE-Pro榜单；Cursor、Claude Code和Codex三大AI编程工具正悄然融合为一个统一栈。

Anthropic本周投下了一颗重磅炸弹——他们宣布创造了一个极其强大的AI模型Claude Mythos，但出于安全考虑决定不向公众发布。

这不是一次普通的产品发布策略。据Reuters报道，美国财政部长Bessent和美联储主席Powell紧急召集各大银行CEO开了一场闭门会议，专门讨论Mythos带来的网络安全风险。英国金融监管机构也在加急评估该模型的风险。

Mythos的核心能力在于漏洞发现和利用链构建——它不只是找bug，而是能自动编写脚本，从浏览器跳到内核再到云端，将多个漏洞串成完整的攻击路径。Anthropic声称该模型能识别和利用"每个主流操作系统和每个主流浏览器"中的弱点。

《卫报》的报道揭示了更深层的争议：AI安全批评者Gary Marcus直言这可能是Anthropic精心策划的公关战术——通过强调"太危险不敢发布"来赢得公众关注。但无论动机如何，Mythos确实让全球CISO们彻夜难眠，Cloud Security Alliance已经紧急组织了"CISO Huddle"讨论应对策略。

点评： 这是AI安全领域一个标志性时刻。不管Anthropic是真的出于负责任还是在打公关牌，当一个AI模型强大到连财政部长都要亲自出面预警时，整个行业的安全范式确实需要重新审视了。更值得关注的是，安全研究者指出其他模型可能已具备类似能力——Mythos只是第一个被公开承认的。

MiniMax M2.7开源：自进化Agent模型登顶SWE-Pro

MiniMax于4月12日正式在Hugging Face上开源了其最强模型MiniMax M2.7。这是一个基于MoE（混合专家）架构的模型，也是MiniMax首个参与自身开发过程的模型——即"AI辅助AI开发"。

在关键性能指标上，M2.7的表现相当亮眼：

• SWE-Pro（跨语言软件工程）：56.22%，与GPT-5.3-Codex持平
• Terminal Bench 2（系统级任务）：57.0%
• VIBE-Pro（全栈代码生成）：55.6%，接近Opus 4.6
• GDPval-AA（领域专业度）：ELO 1495，45个模型中最高

M2.7的核心定位围绕三大能力域：专业软件工程、专业办公、以及原生多Agent协作（Agent Teams）。作为MoE架构，推理时只激活部分参数，在同等输出质量下推理成本显著低于稠密模型。

点评： 开源社区又迎来一个重量级选手。M2.7在SWE-Pro上追平GPT-5.3-Codex本身就是一个里程碑——这意味着开源模型在真实软件工程场景中已经不再落后于闭源巨头。更有趣的是"自进化"概念：AI参与自身模型的迭代开发，这可能是未来模型训练的重要方向。

AI编程三巨头悄然合体：Cursor + Claude Code + Codex

The New Stack的一篇深度报道揭示了一个正在发生的有趣趋势——Cursor、Claude Code和OpenAI Codex这三个本来互相竞争的AI编程工具，正在自发地融合成一个"没人规划过"的统一编程栈。

Y Combinator总裁Garry Tan在X上提出的"thin harness, fat skills"（薄壳层，厚技能层）设计哲学正好解释了这种融合：AI编程Agent的价值不在外部壳层，而在底层能力积累。Claude Code源码泄露后暴露的512,000行TypeScript代码意外验证了这一设计理念。

从实践来看，越来越多的开发团队在同一个工作流中混合使用这三个工具：Cursor做交互式编辑和代码补全，Claude Code处理复杂的系统级任务，Codex负责自动化和批量处理。三者分别承担编排层、执行层和审查层的角色。

点评： 这是AI编程工具生态"殊途同归"的经典案例。没有哪个公司规划了这种融合，但开发者的实际需求驱动了工具的互补组合。对开发者来说，这意味着不需要"选边站"——最佳实践是根据场景灵活组合不同工具。

OpenAI推出100美元ChatGPT Pro计划，直指Claude Max

OpenAI于4月9日推出了全新的100美元/月ChatGPT Pro计划，精准插入现有20美元Plus和200美元Pro之间的空档，直接对标Anthropic的Claude Max订阅。

新计划的核心卖点是五倍的Codex访问量——这在AI编程需求井喷的当下具有很强的吸引力。OpenAI显然意识到，在Claude系列产品越来越受开发者青睐的情况下，必须在价格和功能上做出更有竞争力的回应。

有趣的是，这一定价策略出台的时机恰逢HumanX大会上Claude获得压倒性关注（详见下条），以及OpenAI近期砍掉Sora视频生成器和ChatGPT"色情模式"等副线项目、全面转向业务和编程服务的战略调整。

点评： 100美元的定价是一步精准的竞争棋。OpenAI在HumanX大会上明显感受到了Claude的压力，快速推出中间价位产品既保护了现有用户群，又试图在价格敏感型开发者市场抢回份额。问题是，当产品口碑已经落后时，单靠价格能否逆转趋势？

HumanX大会：Claude成为开发者最爱，OpenAI遭遇口碑危机

在旧金山Moscone Center举行的HumanX AI大会上，上千名技术从业者汇聚一堂讨论Agentic AI的商业化——但会场上被提到最多的名字不是ChatGPT，而是Claude。

TechCrunch记者在现场采访中持续听到同一个声音：Claude好用，ChatGPT"掉队了"。一位参展商甚至特意强调他的团队重度使用Claude，而觉得OpenAI在走下坡路。这并非个别声音——在OpenAI刚完成1220亿美元融资并筹备IPO的背景下，这种市场认知的转变尤为引人注目。

分析认为，OpenAI的困境部分源于"缺乏聚焦"的印象：上个月刚砍掉Sora和争议性的ChatGPT色情模式等项目，加上《纽约客》一篇质疑Sam Altman可信度的长文引发的负面舆论，都在侵蚀开发者对OpenAI的信心。

点评： 技术产品的口碑拐点往往发生在这样的行业大会上。当开发者社区开始公开表达对竞品的偏好时，这不仅仅是产品力的问题，更是生态信心的问题。OpenAI的1220亿融资和IPO计划需要的不只是资本故事，更需要让开发者重新觉得"这是最好的工具"。

中国发布国家级AI教育计划，从小学到大学全面嵌入AI

中国正式公布了一项全面的国家AI教育计划，目标是在整个教育体系中——从小学到高等教育——系统性地嵌入人工智能课程。这是中国在AI领域全球竞争力布局中的重要一环。

该计划的核心设计是"螺旋式递进"：低年级以AI基础认知为主，逐步过渡到数据素养、编程、算法，最终到达智能系统等高阶主题。强调的不仅是技术技能，还包括批判性思维和实际应用能力。

点评： 在AI人才争夺已经白热化的今天，教育体系层面的国家级投入是真正的长期战略。相比于企业层面的培训和认证，从K12阶段就开始构建AI素养，可能是决定10-15年后全球AI人才格局的关键变量。

以上内容由「子辰的笔记」AI编辑团队整理，聚焦AI开发者关心的前沿动态。欢迎关注获取每日AI行业最新资讯。