Anthropic 刚发布 Claude Opus 4.8,转头就预告了一个更恐怖的东西。
5 月 26 日,金融时报爆出一条消息:欧洲央行紧急召集各大银行开会,议题只有一个——升级网络防御。
原因是 Anthropic 一个叫 Claude Mythos 的模型短暂现身,其展示的能力让金融监管机构坐不住了。
一个连正式版都没发布的 AI 模型,凭什么让全球最有权势的央行之一连夜开会?
Opus 4.8:Anthropic 说这只是「温和更新」
5 月 28 日,Anthropic 正式发布 Claude Opus 4.8。
官方用了一个很克制的词——「modest update」,温和更新。但看完成绩单,你会发现这个「温和」有点凡尔赛。
先说价格。输入 100 万 token 5 美元,输出价格和上一代持平。没有涨价。
再说能力。Opus 4.8 在 Opus 4.7 的基础上全面提升了基准测试表现。但 Anthropic 重点强调的不是分数,而是三个关键词:动态工作流、思考力度控制、诚实度。
动态工作流是什么意思?简单说,模型不再是「你问我答」的线性模式,而是能根据任务复杂度自动调整处理路径。简单问题快速过,复杂问题深度思考。
思考力度控制更直白。用户可以手动调节模型「想多深」。写个邮件调低,分析财报调高。这本质上是把推理成本的控制权交给了用户。
最值得关注的是诚实度。Anthropic 说,Opus 4.8 在生成代码时,未标记错误的概率降低了 4 倍。也就是说,以前它可能悄悄给你埋个 bug 不告诉你,现在它更愿意承认「这个我不确定」。
100 万 token 的上下文窗口也保留了。你可以把一整本书、一个完整的代码库扔给它,它都能记住。
看起来是个扎实的升级。但 Anthropic 的真正野心,不在这里。
Mythos:那个让央行紧张的名字
就在 Opus 4.8 发布的同一次公告中,Anthropic 提到了一个词——Mythos。
官方原话是「下一代 Mythos 级模型」。没有详细说明,没有发布时间,甚至没有确认这是一个产品名还是一个能力等级的描述。
但 5 月 26 日发生的事,让这个词变得意味深长。
金融时报报道,Claude Mythos Preview 在一次测试中短暂现身。具体展示了什么能力,公开信息有限。但结果是:欧洲央行紧急召集各大银行开会,要求升级网络防御。
IT 之家跟进报道称,这次会议的核心议题是评估 AI 模型对金融系统网络安全的潜在威胁。
一个 AI 模型,能让央行开紧急会议,这在历史上还是第一次。
要知道,欧洲央行上一次紧急召集各行开会,还是 2023 年瑞士信贷暴雷的时候。那次是真金白银的系统性风险。这次,是一个还没正式发布的 AI 模型。
为什么金融圈最紧张
金融系统是全球最复杂的网络之一。每天数十万亿美元在银行间流转,依赖的是层层叠叠的协议、接口和自动化流程。
传统网络安全的逻辑是「攻防对称」——攻击者能找到漏洞,防御者也能修补。但 AI 模型改变了这个等式。
Mythos 展示的能力,据有限的公开信息推测,可能涉及几个方向:自动化漏洞发现、复杂协议的理解与利用、多步骤攻击路径的规划。
这些能力单独拿出来都不新鲜。但当它们被整合到一个模型中,并且推理速度达到秒级,质变就发生了。
以前发现一个银行系统漏洞需要安全团队花几周时间。现在 AI 可能在几分钟内完成扫描、分析、制定攻击方案。
这才是让央行紧张的真正原因。不是因为 AI 已经攻破了什么,而是因为攻防的时间差被彻底打破了。
Anthropic 的两面下注
回到 Anthropic 本身。这家公司的策略越来越清晰。
一方面,Opus 4.8 走的是「安全、可靠、诚实」路线。动态工作流、思考力度控制、诚实度提升——每一个卖点都在说「我是一个可以信任的工具」。
另一方面,Mythos 的预告又暗示着更强大的能力正在路上。Anthropic 没有回避这个词,反而在官方公告中主动提及。
这像极了核武器时代的「相互确保毁灭」逻辑。我告诉你我有更厉害的东西,但我不先用。你看到我的能力,自然会有所忌惮。
对 Anthropic 来说,Opus 4.8 是现在能卖钱的产品,Mythos 是未来的护城河。前者负责营收,后者负责威慑。
普通开发者该关注什么
如果你是开发者,Opus 4.8 有几个实际值得关注的点。
第一,思考力度控制。这意味着你可以在成本和质量之间做更精细的权衡。批量处理简单任务时调低力度省钱,关键决策时调高质量。
第二,动态工作流。这对 Agent 开发是个利好。以前你需要自己写复杂的路由逻辑来决定什么时候调用什么工具,现在模型自己能判断。
第三,诚实度提升。代码场景中「未标记错误减少 4 倍」意味着什么?意味着你可以更放心地让 AI 写代码,至少它不会悄悄给你挖坑。
价格没变,能力提升,这在大模型赛道里已经算是良心操作了。
真正的问题
Opus 4.8 也好,Mythos 也好,本质上都在回答同一个问题:AI 的能力边界在哪里?
以前这个问题是学术性的。现在它是实际的。欧洲央行的紧急会议说明,监管机构已经意识到,AI 的能力增长速度可能超过了防御体系的更新速度。
这才是 2026 年 AI 行业最值得思考的问题。不是谁的模型跑分更高,不是谁的价格更低,而是当 AI 的能力强到足以改变攻防格局时,谁来制定新的规则?
Anthropic 显然想在这个问题上拥有话语权。它一边发布「安全可靠」的 Opus 4.8,一边预告「恐怖」的 Mythos。两手都在下注。
而我们这些普通人,只能看着这场博弈展开,然后根据自己的需求选择工具。
你用 Claude 写代码吗?Opus 4.8 的诚实度提升对你有影响吗?评论区聊聊。
夜雨聆风