Claude Mythos 5发布:AI进入权限时代

Claude Mythos 5发布：AI进入权限时代

Anthropic终于把遮遮掩掩两个月的"神话"摆上了桌面。

Claude Mythos 5，以及它的安全降级版Claude Fable 5，正式发布。两个版本共享同一个底层模型，区别在于权限：Fable 5面向所有用户，一旦检测到高风险请求会自动降级到Claude Opus 4.8；Mythos 5是满血版，但只给少数受信任用户使用。

这个设计本身，比模型性能更值得聊。

先说性能。SWE-bench Pro评测80.3%的得分，甩开GPT-5.5的58.6%一大截。Stripe用它在一个5000万行Ruby代码库里做全库迁移，原本需要工程团队两个多月的工作，Fable 5一天搞完。在ViBench前端开发基准上，它几乎把基础用例打到了饱和，真正的一枪流生成应用。

视觉能力也很离谱。Fable 5仅凭原始游戏截图，在没有任何地图外挂的情况下，原生打通了《宝可梦·火红版》。之前的Claude模型玩这个游戏需要一整套复杂的脚手架辅助，现在直接裸考过关。

在生物医药领域，Mythos 5已经能独立执行生物学家的完整工作流：选择蛋白质结合位点、调度生物信息学工具、遭遇运行失败时自己Debug。它设计的14个蛋白质靶向复合物中，有9个进入了真实的药物研发管线。更夸张的是，它在基因组学研究中自主工作了一周多，训练出一个体积小了100倍的微型模型，直接击败了发表在《Science》上的最新成果。

这些数字确实漂亮。但Anthropic这次发布的真正看点，不是Fable 5有多强，而是Anthropic怎么处理"强到危险"这个命题。

Fable 5背后挂了一组独立分类器，检测用户请求是否涉及网络安全攻击、生物化学风险和模型蒸馏。一旦触发，系统不做传统意义上的"拒绝回答"，而是自动把请求转交给Opus 4.8，告诉用户发生了降级。

这是一个非常聪明的设计。

过去大模型处理安全问题，就是简单粗暴地拒绝。"抱歉，我无法协助你完成这个请求。"用户体验差，而且安全边界模糊。Anthropic换了个思路：普通问题用最强的模型处理，高风险问题自动切换到能力稍弱但更安全的模型。

超过95%的会话不会触发降级，这意味着绝大多数日常使用能拿到接近Mythos级别的体验。剩下不到5%的请求进入严格安全路径，用Opus 4.8兜底，总比直接弹一个"我拒绝回答"要好得多。

但代价也实实在在。分类器调得保守，正常请求会被误伤——生物学家研究病毒、安全工程师做授权攻防演练，都可能触发降级。Anthropic自己也承认当前护栏比理想状态更严格，后续会调整。

更大的代价是数据留存。从这代模型开始，Anthropic要求Mythos级模型的所有流量保留30天，覆盖第一方和第三方使用场景。官方说数据不用于训练，只用于安全监控。对普通用户来说这是条款里的一行字，但对企业客户来说，这是实实在在的数据治理问题。

沃顿商学院教授Ethan Mollick在拿到测试权限后写了一篇长文，他提出了一个很有意思的观察：过去人类用AI像巫师念咒，需要精心雕琢每一句Prompt才能驱动模型完成复杂任务。现在面对Mythos级别的模型，人类正在变成"甲方"——你提需求，它自己调度多个Agent去调研、撰写、校对、纠错，9小时后交付成品。

Mollick说这种感觉"既令人愉悦又令人不安"。愉悦在于你只需要提出要求就能实现，不安也在于你只需要提出要求就能实现。

这大概是AI发展到现在最准确的描述了。模型能力越来越强，人类从操作者变成了验收者。问题是，当AI能自主工作9小时交付复杂成果时，我们真的有能力做好"甲方"吗？验收一个我们可能不完全理解的成果，这本身就是一种新的风险。

Fable 5和Mythos 5统一定价：每百万输入Token 10美元，每百万输出Token 50美元。比预览版便宜了一半以上，但仍然是高价模型。从6月23日起，Pro、Max、Team和企业版用户需要额外购买usage credits才能继续使用Fable 5。

一个更强的模型上桌了，但Anthropic先给它系上安全带，然后才把钥匙递出来。有人说这是负责任的AI发展，有人说这不过是另一种形式的控制。无论如何，AI进入权限时代这件事，已经是既成事实。