Claude Mythos 5发布:AI进入权限时代
Anthropic终于把遮遮掩掩两个月的"神话"摆上了桌面。
Claude Mythos 5,以及它的安全降级版Claude Fable 5,正式发布。两个版本共享同一个底层模型,区别在于权限:Fable 5面向所有用户,一旦检测到高风险请求会自动降级到Claude Opus 4.8;Mythos 5是满血版,但只给少数受信任用户使用。
这个设计本身,比模型性能更值得聊。
先说性能。SWE-bench Pro评测80.3%的得分,甩开GPT-5.5的58.6%一大截。Stripe用它在一个5000万行Ruby代码库里做全库迁移,原本需要工程团队两个多月的工作,Fable 5一天搞完。在ViBench前端开发基准上,它几乎把基础用例打到了饱和,真正的一枪流生成应用。
视觉能力也很离谱。Fable 5仅凭原始游戏截图,在没有任何地图外挂的情况下,原生打通了《宝可梦·火红版》。之前的Claude模型玩这个游戏需要一整套复杂的脚手架辅助,现在直接裸考过关。
在生物医药领域,Mythos 5已经能独立执行生物学家的完整工作流:选择蛋白质结合位点、调度生物信息学工具、遭遇运行失败时自己Debug。它设计的14个蛋白质靶向复合物中,有9个进入了真实的药物研发管线。更夸张的是,它在基因组学研究中自主工作了一周多,训练出一个体积小了100倍的微型模型,直接击败了发表在《Science》上的最新成果。
这些数字确实漂亮。但Anthropic这次发布的真正看点,不是Fable 5有多强,而是Anthropic怎么处理"强到危险"这个命题。
Fable 5背后挂了一组独立分类器,检测用户请求是否涉及网络安全攻击、生物化学风险和模型蒸馏。一旦触发,系统不做传统意义上的"拒绝回答",而是自动把请求转交给Opus 4.8,告诉用户发生了降级。
这是一个非常聪明的设计。
过去大模型处理安全问题,就是简单粗暴地拒绝。"抱歉,我无法协助你完成这个请求。"用户体验差,而且安全边界模糊。Anthropic换了个思路:普通问题用最强的模型处理,高风险问题自动切换到能力稍弱但更安全的模型。
超过95%的会话不会触发降级,这意味着绝大多数日常使用能拿到接近Mythos级别的体验。剩下不到5%的请求进入严格安全路径,用Opus 4.8兜底,总比直接弹一个"我拒绝回答"要好得多。
但代价也实实在在。分类器调得保守,正常请求会被误伤——生物学家研究病毒、安全工程师做授权攻防演练,都可能触发降级。Anthropic自己也承认当前护栏比理想状态更严格,后续会调整。
更大的代价是数据留存。从这代模型开始,Anthropic要求Mythos级模型的所有流量保留30天,覆盖第一方和第三方使用场景。官方说数据不用于训练,只用于安全监控。对普通用户来说这是条款里的一行字,但对企业客户来说,这是实实在在的数据治理问题。
沃顿商学院教授Ethan Mollick在拿到测试权限后写了一篇长文,他提出了一个很有意思的观察:过去人类用AI像巫师念咒,需要精心雕琢每一句Prompt才能驱动模型完成复杂任务。现在面对Mythos级别的模型,人类正在变成"甲方"——你提需求,它自己调度多个Agent去调研、撰写、校对、纠错,9小时后交付成品。
Mollick说这种感觉"既令人愉悦又令人不安"。愉悦在于你只需要提出要求就能实现,不安也在于你只需要提出要求就能实现。
这大概是AI发展到现在最准确的描述了。模型能力越来越强,人类从操作者变成了验收者。问题是,当AI能自主工作9小时交付复杂成果时,我们真的有能力做好"甲方"吗?验收一个我们可能不完全理解的成果,这本身就是一种新的风险。
Fable 5和Mythos 5统一定价:每百万输入Token 10美元,每百万输出Token 50美元。比预览版便宜了一半以上,但仍然是高价模型。从6月23日起,Pro、Max、Team和企业版用户需要额外购买usage credits才能继续使用Fable 5。
一个更强的模型上桌了,但Anthropic先给它系上安全带,然后才把钥匙递出来。有人说这是负责任的AI发展,有人说这不过是另一种形式的控制。无论如何,AI进入权限时代这件事,已经是既成事实。
夜雨聆风