引言:一个模型,两个神话
2026年6月9日深夜,AI圈被一颗重磅炸弹惊醒。
Anthropic正式发布Claude Fable 5和Claude Mythos 5——这不仅是两款新模型,更是一种全新的AI发布范式。
Fable 5面向公众,是Anthropic有史以来公开发布的最强模型;Mythos 5则面向受信合作伙伴,解除了部分安全限制,用于高敏感度科研与网络安全防御。
但它们本质上是同一个模型。
Anthropic通过一种创新的安全分类器系统,将同一个强大的AI底座,分成了两个不同安全级别的"神话"——一个普惠大众,一个守卫尖端。
这种"同一底座,分级安全"的策略,正在重新定义前沿AI的发布方式。
一、模型定位:神话级(Mythos-class)的诞生
从Opus到Mythos:能力层级的跃迁
在Claude的模型体系中,Opus一直是顶级存在。但Fable 5和Mythos 5的出现,标志着Anthropic正式引入了一个新的能力层级——Mythos级。
| 模型层级 | 代表模型 | 定位 |
|---|---|---|
| Sonnet | Sonnet 4.8 | 均衡型,日常使用 |
| Opus | Opus 4.8 | 顶级推理,复杂任务 |
| Mythos | Fable 5 / Mythos 5 | 超越Opus的神话级能力 |
Mythos级的首个模型是2026年4月通过Project Glasswing发布的Claude Mythos Preview。而今天的Fable 5和Mythos 5,则是这一层级的正式商用化。
Fable与Mythos:同一底座,不同护栏
Fable 5和Mythos 5共享同一个基础模型,区别仅在于安全防护策略:
Fable 5:配备安全分类器,高风险查询(网络安全、生物化学、蒸馏攻击)会回退到Opus 4.8处理 Mythos 5:解除部分安全限制,允许在网络防御、生物研究等领域充分发挥模型能力
这种设计的精妙之处在于:99%的用户感受不到任何差异——因为只有不到5%的会话会触发安全分类器。
二、为什么这么强?六大维度深度解析
维度一:软件工程——一天完成两个月的代码迁移
Stripe的实测数据震惊行业:
在一个5000万行Ruby代码库中,Fable 5一天内完成了原本需要整个团队两个月手动完成的代码迁移。
这不是简单的代码转换,而是涉及复杂依赖分析、测试覆盖、性能优化的系统性工程。
Cognition的FrontierCode评估进一步证实:在测试模型能否在高质量生产代码标准下完成困难编码任务时,Fable 5在中等努力水平下即获得前沿模型最高分。
Cursor CEO Michael Truell的评价更为直接:
"Fable 5在CursorBench上是state-of-the-art模型,开启了一类此前模型无法触及的长期问题。"
关键突破:Fable 5的自主运行时间比以往任何Claude模型都长,能够在数小时甚至数天的连续工作中保持专注和一致性。
维度二:知识工作——首个突破90%的模型
Hex的测试提供了一个清晰的里程碑:
Fable 5是首个在核心分析基准测试中突破90%的模型,比Opus 4.8提高了10个百分点。
Hebbia Finance Benchmark(高级推理基准)中,Fable 5获得所有模型的最高分,在文档推理、图表解释和问题解决方面有显著提升。
IMC(交易公司)的评估显示:在交易分析测试中几乎全面获胜,包括事实查询、概念推理、根本原因分析和期望值分析。
这意味着什么?
AI终于能够胜任高级分析师、研究科学家、投资顾问级别的复杂知识工作,而不仅仅是辅助工具。
维度三:视觉能力——仅凭截图重建整个Web应用
Fable 5是视觉任务的新state-of-the-art模型,其能力已经超越"看图说话"的阶段,进入"看图重建"的境界。
三个震撼的测试用例:
宝可梦FireRed测试:以往Claude模型即使有复杂辅助工具也难以通关,Fable 5仅使用最小化的纯视觉工具就完成了游戏,无需地图、导航辅助或额外游戏状态信息
截图重建Web应用:Fable 5能够仅凭截图重建整个Web应用的源代码——这不是简单的逆向工程,而是理解UI结构、交互逻辑、样式系统的综合能力
科学图表精确提取:能从详细的科学图表中提取精确数字,理解复杂的图表语义
视觉能力的跃迁,意味着Fable 5可以胜任UI/UX设计审查、科学论文分析、复杂界面自动化等高级任务。
维度四:记忆与长上下文——专注力的质的飞跃
在处理数百万tokens的长期任务时,Fable 5能够保持专注——这是此前所有模型都无法稳定做到的。
《杀戮尖塔》(Slay the Spire)测试提供了一个量化指标:
使用持久文件记忆后,Fable 5的性能提升是Opus 4.8的三倍,进入最终关卡的概率也是Opus的三倍。
这意味着什么?
AI终于具备了真正的长期项目管理能力——可以在数天、数周的任务中持续跟踪进度、反思决策、调整策略,而不是每次都"失忆"。
维度五:生命科学与药物设计——加速10倍,9/14靶点产生强候选
这是Fable 5/Mythos 5最令人震撼的能力领域。
Anthropic内部团队使用Mythos 5进行蛋白质设计,将药物设计过程的某些方面加速约10倍。
关键数据:
在14个蛋白质靶点中,9个产生了强候选药物,目前正在研究中 靶点包括:免疫检查点、生长因子与受体信号、神经退行性疾病、肌肉疾病等 在自主蛋白设计中,Mythos 5的表现匹敌甚至超越熟练的人类操作者
更震撼的发现:
Mythos 5是首个持续产生新颖、有说服力科学假设的模型。在科学家的盲选对比中,约80%的情况下更喜欢Mythos的假设。
一个关于大肠杆菌蛋白新机制的假设,已被独立实验室的研究所证实。
这意味着什么?
AI已经开始能够独立提出科学假设、设计实验、分析数据、产出可验证的理论——这不仅是工具能力的提升,更是科学研究范式的潜在变革。
维度六:科学研究——超越《科学》期刊的模型
在基因组学研究中,Mythos 5在超过一周的自主工作中:
组装了跨越138个动物物种的数百万个单细胞数据 设计并训练了定制机器学习模型 该模型性能超越了《科学》期刊上发表的模型,且体积小100倍
这个对比极其关键:
一个AI自主完成的模型,超越了人类科学家在顶级期刊上发表的成果,而且效率高出两个数量级。
三、安全策略创新:分类器系统的精妙设计
为什么需要分级发布?
Anthropic在发布声明中直言:
"发布如此强大的模型伴随着风险。在没有防护措施的情况下,Fable 5在网络安全等领域的能力可能被滥用以造成严重损害。"
核心风险领域:
网络安全:漏洞发现与利用、代理黑客行为 生物化学:高风险生物研究的滥用 蒸馏攻击:提取Claude能力用于训练竞争模型
分类器系统:AI守护AI
Fable 5配备了新的分类器系统——独立的AI系统,用于检测潜在的滥用(包括越狱尝试),并阻止主模型响应。
工作流程:
用户请求进入 → 分类器检测 判定为安全 → Fable 5处理 判定为高风险 → 回退到Opus 4.8处理
关键数据:
只有少于5%的会话会触发安全分类器 超过95%的Fable会话完全没有回退 在这些会话中,Fable 5的性能与Mythos 5实际相同
越狱防护:目前最强的防线
测试结果:
内部红队测试:Fable 5的安全防护比此前任何通用模型都更抗越狱 外部漏洞赏金:超过1000小时测试,未发现通用越狱方法 外部红队组织:在长期代理任务上至今未找到通用越狱方法 有害请求测试:对有害单轮请求的合规率为零,无论是否使用30种公开越狱技术
四、定价策略:比Mythos Preview便宜一半
API定价:
输入:$10/百万tokens 输出:$50/百万tokens
对比:不到Claude Mythos Preview价格的一半。
这个定价策略非常明确:让更多开发者能够用上神话级模型。
五、客户反馈:行业巨头的真实评价
| 公司 | 代表 | 评价 |
|---|---|---|
| Cursor | Michael Truell (CEO) | CursorBench上的SOTA模型,开启了新一类问题 |
| GitHub | Mario Rodriguez (CPO) | 复杂长期任务的自主性和可靠性前所未有 |
| Replit | Matt Colyer (产品总监) | 测试过的最强Claude模型 |
| Hex | Izzy Miller (AI研究负责人) | 首个突破90%核心分析基准的模型 |
| Bloomberg | Damian Miraglia | 测试过的最强金融领域模型 |
| Anaconda | Peter Wang (首席科学官) | 每次努力水平都击败Opus 4.8,速度快25-30% |
六、深度思考:这意味着什么?
AI能力的临界点已经到来
Fable 5/Mythos 5的发布,标志着AI能力达到了一个新的临界点:
软件工程:从"辅助编码"到"自主完成复杂项目" 科学研究:从"数据分析"到"提出假设、设计实验" 知识工作:从"信息整理"到"独立分析、得出结论"
"同一底座,分级安全"将成为新范式
Anthropic通过分类器系统实现的"同一底座,分级安全"策略,很可能被行业广泛采用:
普惠版:面向公众,带安全防护 专业版:面向受信用户,解除部分限制 研究版:面向科研机构,最大限度释放能力
这种方式既保证了安全性,又最大化了AI能力的价值。
数据保留政策:30天删除,不用于训练
Anthropic同时公布了新的数据保留政策:
保留期限:30天(所有第一方和第三方平台流量) 用途限制:仅用于安全目的,不用于训练新模型 隐私保护:记录所有对数据的人类访问,30天后在几乎所有情况下删除
七、如何获取Fable 5?
Claude Fable 5(面向公众):
API和消费型企业计划:即日起完全可用 Pro、Max、Team、坐席型企业计划:即日起至6月22日免费包含 6月23日起:需要使用使用额度 未来:当容量允许时,计划将Fable 5恢复为订阅计划的标准部分
Claude Mythos 5(受信访问):
现有Mythos Preview用户:即日起可升级 网络安全组织:通过受信访问计划逐步扩展 生物医学研究人员:即将开放生物学受信访问计划
结语:神话之后,是什么?
Claude Fable 5和Mythos 5的发布,不仅是两款新模型的诞生,更是一个新时代的开始。
当AI能够一天完成两个月的工作、提出可验证的科学假设、仅凭截图重建整个应用时,我们面对的已经不是"更好的工具",而是"不同的智能"。
Anthropic在发布声明中写道:
"随着未来几个月更强大模型的到来,我们将继续改进安全防护并减少误报。"
更强大的模型已经在路上。
神话之后,或许还有神话。
夜雨聆风