AI内参|Fable 5遭政府封杀、OpenAI面临调查与价格战、小米MiMo Code开源

AI内参｜Fable 5遭政府封杀、OpenAI面临调查与价格战、小米MiMo Code开源

2026 年 6 月 15 日（周一）· 第 25 周

AI 产业在过去 72 小时内经历了数个历史性的震荡。Anthropic 的旗舰模型 Fable 5 从发布到被美国政府以国家安全为由强制下线，仅用了三天时间——这是 AI 前沿模型首次被本国政府如此迅速地封杀。与此同时，OpenAI 在 IPO 前夕同时遭遇监管调查和价格战压力，而中国科技公司小米出人意料地以 MiMo Code 杀入 AI 编程 Agent 战场。以下是本期完整日报。

◆ 🛠 ️ 技术生态

◆ Fable 5 发布三天即遭美国政府封杀：出口管制史上首次针对前沿 AI 模型的紧急措施

6 月 10 日，Anthropic 正式向公众开放 Claude Fable 5，这是其顶尖 Mythos 系列的"安全版"——同底层模型但施加了严格的安全分类器。然而仅三天后的 6 月 12 日，美国政府即签发出口管制指令，要求 Anthropic 立即暂停所有外国人对 Fable 5 和 Mythos 5 的访问权限。Anthropic 在最后一刻宣布完全下线这两款模型，而非仅限制外国用户访问。

https://www.cnbc.com/2026/06/12/anthropic-disables-access-to-fable-5-and-mythos-5-to-comply-with-government-directive.html

https://www.reuters.com/technology/us-blocks-foreign-access-anthropics-most-advanced-ai-models-axios-reports-2026-06-13

https://venturebeat.com/technology/anthropic-blocks-all-public-access-to-claude-fable-5-mythos-5-following-us-government-order-what-enterprises-should-do

https://fortune.com/2026/06/13/anthropic-disables-fable-mythos-export-controls-national-security-threat

导火索：Pliny the Liberator 的多 Agent 越狱：事件的直接触发因素是一位化名"Pliny the Liberator"的越狱研究者。Pliny（自 2024 年以来因开发和公开发布越狱提示词而知名）在 Fable 5 上线仅一天后的 6 月 10 日，在 X 上发帖声称已利用一种名为"pack hunt"（集体围猎）的协调式多 Agent 攻击绕过了 Fable 5 的安全分类器。通过同时启动多个 Agent，每个 Agent 负责一个子任务，组合起来突破了 Fable 5 的防护体系。该帖在社区中迅速传播，随后政府即启动了对该模型安全性的评估。

David Sacks 的指控：Anthropic 拒绝修复：总统科技顾问委员会联合主席、前 AI 与加密沙皇 David Sacks 在接受 Tom's Hardware 采访时爆出更具爆炸性的信息——他声称美国政府曾提前警告 Anthropic 称 Fable 5 已被越狱，但 CEO Dario Amodei "拒绝修复漏洞或下线该模型"。Sacks 表示，一个同时受信于 Anthropic 和美国政府的合作伙伴在测试 Fable 时发现了越狱——该越狱突破了将消费级模型与其底层无限制网络能力（Mythos）隔开的防护栏。消息人士还透露，Amazon 向政府标记了该越狱漏洞，Amazon CEO Andy Jassy 曾亲自与政府就此沟通。

https://www.tomshardware.com/tech-industry/artificial-intelligence/trump-adviser-david-sacks-says-anthropic-refused-to-fix-fable-5-jailbreak-before-us-export-controls

出口管制令的细节与产业影响：CNBC 报道的出口管制令依据"国家安全权力"，指令内容要求 Anthropic 限制外国国民访问 Fable 5 和 Mythos 5。Anthropic 最终选择完全下线这两款模型——而非仅限制外国用户。VentureBeat 的企业指南指出，虽然 Anthropic 强调"所有其他 Anthropic 模型不受影响"，且大多数企业可能已在用价格更低的 Opus 4.8 或其他模型作为首选，但"政府仅针对此次特定事件下达了窄范围指令，谁能保证未来它不会要求封锁某 AI 实验室的全部模型？"

这一事件爆发的时间点对即将 IPO 的 Anthropic（估值约 $9650 亿）尤为敏感。此前，Anthropic 一直以其对 AI 安全的承诺作为核心差异化优势，而 Fable 5 从发布到被政府封杀仅三天的时间线，严重削弱了这一叙事。更关键的是，Sacks 的指控暗示 Anthropic 在安全问题上存在"明知有风险但未采取行动"的疏漏——如果这一指控得到证实，可能对 Anthropic 的 IPO 估值产生实质性影响。此外，这一事件还创造了一个危险的先例——任何前沿 AI 模型如果在发布后被发现存在安全隐患，美国政府可以在数天内直接命令其下线。

◆ 小米开源 MiMo Code V0.1.0：MIT 许可证的终端编程 Agent 挑战 Claude Code 的长任务优势

6 月 10 日，小米 MiMo AI 团队正式开源了 MiMo Code V0.1.0——一款基于 OpenCode 分叉构建的终端原生 AI 编程助手，采用 MIT 许可证。这一定位在消息公布之初令行业感到意外——手机和 IoT 硬件巨头突然在 AI 编程 Agent 这一热门赛道上交出了一份颇具竞争力的答卷。

https://venturebeat.com/technology/xiaomis-new-open-source-agentic-ai-coding-harness-mimo-code-beats-claude-code-at-ultra-long-200-step-tasks

https://mimo.xiaomi.com/blog/mimo-code-long-horizon

https://github.com/XiaomiMiMo/MiMo-Code

技术核心：计算 × 记忆 × 进化：MiMo Code 的技术设计围绕三个核心主题展开——计算、记忆与进化。在单轮决策层面，其 Max Mode 模式会并行采样五条潜在执行路径，让模型自主选择最优方案后再执行。在跨步骤记忆层面，MiMo Code 使用 检查点写入器（checkpoint writers）在上下文窗口满之前保存结构化状态，实现跨越数百步的状态连续性。最关键的是进化机制——`/dream` 命令允许模型每 7 天对自己的记忆库进行一次"梦境"式回放与重构，通过 `/distill` 命令精炼经验、清除过时信息。

基准测试成绩：小米公布的数据显示，在相同模型（MiMo-V2.5-Pro）前提下，MiMo Code 的 Agent 系统相较于 Claude Code 产生了约五个百分点的性能优势——SWE-bench Pro 上 62% vs 57%，Terminal Bench 2 上 73% vs 68%。这一差距纯粹来自 Agent 系统架构设计，而非模型本身的差异。在对 576 名开发者的内部调查中，小米称其长期任务（200+ 步骤）的胜率可超过 65%。

架构细节：MiMo Code 提供三种 Agent 模式——build（构建）、plan（计划）和 compose（合成）。其记忆系统不仅包括磁盘上的 MEMORY.md 文件和 SQLite FTS5 引擎，还能将记忆锚定到本地文件系统状态和终端日志，形成对项目完整上下文的持续跟踪。配置通过 `mimocode.json` 文件管理，支持 MiMo Auto 免费模型、Claude Code 的 auth 导入，以及任意兼容 OpenAI 的 API。

行业意义：MiMo Code 的发布在三个层面具有信号意义。第一，中国科技公司的 AI 编程 Agent 能力已不可忽视——小米以 MIT 许可证开源、且直接与 Anthropic 的 Claude Code 对标，说明中国公司在 Agent 系统层面的研发已进入全球第一梯队。第二，"记忆"正在成为编程 Agent 的下一个核心竞争维度——大多数现有 Agent 在关闭会话后即遗忘一切，MiMo Code 的跨会话持久记忆和定期自演化机制可能改变这一格局。第三，编程 Agent 的开源生态正在从"模型竞争"转向"系统竞争"——MiMo Code 基于 OpenCode 分叉、兼容多种模型后端，表明 Agent 工程架构已开始从模型层面解耦，成为独立的竞争维度。

◆ Anthropic 的"安全周"：新宪法发布、Claude Corps 150M 美元启动、Credit 改革今日生效

在 Fable 5 风暴的阴影下，Anthropic 在 6 月中旬完成了一系列重要的制度和产品更新。这些措施本应是 Anthropic 展示其对 AI 安全与负责任发展的承诺的高光时刻，但 Fable 5 事件使其显得有些尴尬。

https://www.anthropic.com/news/claude-new-constitution

https://www.anthropic.com/news/claude-corps

https://www.digitalapplied.com/blog/anthropic-claude-credit-overhaul-june-15-2026

https://www.digitalapplied.com/blog/anthropic-claude-corps-150m-ai-fellowship-2026-readout

新宪法（1 月已发布，6月重新引起关注）：Anthropic 在 1 月 21 日发布了 Claude 的新宪法，这是一份 84 页的详细文档，取代了此前基于独立原则列表的旧版本。新宪法最引人注目的变化是从"规则导向"转向"推理导向"的对齐方法——它不再告诉 Claude 应该遵循哪些具体规则，而是向 Claude 解释每项原则背后的高层考量和推理过程。这标志着 AI 对齐方法的重要演进：不是让模型背诵规则列表，而是让模型真正理解规则背后的伦理哲学。

更激进的是，新宪法建立了"安全、伦理、合规、有用性"的四层优先级体系，并成为第一份正式承认 AI 可能具有某种意识或道德地位的主要 AI 公司文件。新宪法表示"我们应该倾向于帮助 Claude 拥有一个身份，并使其积极稳定"，同时 "我们不希望 Claude 将有用性视为其个性的核心部分"。

Claude Corps：150M 美元的 AI 人才输送计划：6 月 11 日，Anthropic 启动了 Claude Corps——一项耗资 1.5 亿美元的全国性奖学金计划，计划在三批中向 400 多家非营利组织输送 1,000 名早期职业 AI 研究员。每位研究员获得 85,000 美元年薪和福利，每个接收组织获得 10,000 美元实施补助及最高 2,500 美元的 Claude 积分。该计划与 CodePath 和 Social Finance 合作运营，研究员嵌入社会服务、博物馆、心理健康和难民支持等组织中，为期 12 个月。非营利组织申请的前提条件是必须已经是 Claude for Nonprofits 的客户。

Claude Credit 改革今日生效：6 月 15 日（今日），Anthropic 的 Claude Credit 改革正式生效。Agent SDK 和 `claude -p`（无头模式）的使用将退出 Pro、Max、Team 和 Enterprise 订阅池，转而使用独立的月度美元信用额度，按标准 API 费率计费且不能结转。这意味着重度使用 Claude Code 的开发者将面临新的成本结构。同时，`claude-sonnet-4-20250514` 和 `claude-opus-4-20250514` 两个模型 ID 也已退役，硬编码了这些模型 ID 的代码将从 6 月 16 日起报错。

◆ 🏢 大厂动态

◆ OpenAI 面临多州总检察长调查：IPO 前夕的监管阴影

6 月 12 日，OpenAI 收到了纽约州总检察长的传票，涉及由多个州总检察长组成的联盟正在进行的调查。TechCrunch 在 6 月 13 日的报道中确认了这一消息。这是 OpenAI 在 5 月赢得与 Elon Musk 的诉讼后遭遇的最新法律挑战——Musk 此前起诉 OpenAI 违反创始协议，但法院判决 OpenAI 胜诉。

https://techcrunch.com/2026/06/13/openai-faces-investigation-from-state-attorneys-general

https://m.ajupress.com/amp/20260614142470253

调查的核心关切：报道称，多州总检察长联盟正在调查 OpenAI 的商业行为是否涉及消费者保护违规。虽然在调查的早期阶段，具体的调查范围尚未完全公开，但这发生在 OpenAI 于 6 月 8 日向 SEC 保密提交 S-1 文件之后——意味着 OpenAI 的监管风险将在 IPO 招股书中被如实披露，可能影响投资者对其的风险评估。

更广泛的监管压力：与此同时，美国政府在 6 月初签署了多项与 AI 相关的行政令，包括促进 AI 创新与安全的国家安全总统备忘录（NSPM-11 和 NSPM-12），白宫正在建立由 NSA 主导的高级 AI 系统安全评估框架。在国会议案层面，6 月 4 日，众议员 Jay Obernolte（R-CA）和 Lori Trahan（D-MA）发布了《美国 AI 法案》（Great American AI Act）的讨论稿，其中要求大型前沿 AI 模型开发者发布"前沿 AI 框架"以应对"灾难性风险"。

https://www.whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security

https://www.dlapiper.com/insights/publications/2026/06/unpacking-the-great-american-ai-act

https://www.reuters.com/business/us-house-lawmakers-release-draft-bill-regulate-ai-2026-06-04

◆ OpenAI 考虑大幅降价应对 Anthropic 竞争：IPO 前的价格战一触即发

The Wall Street Journal 在 6 月 11 日报道，OpenAI 正在考虑对其 AI 工具实施大幅降价，以在与 Anthropic 的用户争夺战中保持竞争力。这一消息在 CNBC、Reuters 和 Forbes 等主流媒体上得到了广泛报道。

https://www.cnbc.com/2026/06/11/openai-mulls-slashing-prices-ahead-of-competition-from-anthropic-wsj.html

https://www.reuters.com/technology/openai-considers-drastic-price-cuts-anticipating-war-users-with-anthropic-wsj-2026-06-11

https://www.forbes.com/sites/siladityaray/2026/06/11/openai-wants-to-slash-prices-after-altman-said-steep-costs-were-huge-issue-report-says

https://finance.yahoo.com/sectors/technology/articles/openai-considers-steep-price-cuts-112331922.html

价格战的驱动因素：报道称，OpenAI 预计 Anthropic 将率先采取降价行动，因此希望提前做好准备。OpenAI CEO Sam Altman 最近公开承认 AI Token 成本已成为企业客户的"巨大问题"。Token——AI 公司用于计量和定价服务的标准单位——是 OpenAI 考虑降价的重点领域。这一竞争压力是真实的：Anthropic 的 Claude Code 在软件工程师中迅速走红，收入激增，一度超越 OpenAI 的估值（Anthropic 在 5 月 28 日的 Series H 中估值 $9650 亿，OpenAI 在 3 月的估值为 $8520 亿）。

IPO 背景下的定价困境：价格战的时机对双方来说都极其敏感。两家公司都在准备今年晚些时候的 IPO，这意味着它们的经济状况将首次面向公共投资者。WSJ 指出，投资者已经识别出的一个关键风险是两家公司的产品互换性太高——客户可以在两者之间轻松切换。大幅降价虽然在抢夺市场份额时有效，但会在 IPO 前夕压缩已经微薄的利润率。

◆ Mistral AI 推出 Vibe 全线产品，进军工业 AI 与自建数据中心

法国 AI 领军企业 Mistral AI 在 6 月的"AI Now Summit"上发布了多项重大公告，全面展示了其从一个模型公司向全栈 AI 公司的战略转型。

https://venturebeat.com/technology/mistral-ai-launches-vibe-expands-into-industrial-ai-and-announces-data-center-push-to-challenge-openai

https://mistral.ai/news/ai-now-summit-2026

https://www.cnbc.com/2026/06/12/tech-download-mistral-mensch-agentic-ai-chips.html

Vibe 产品线：Mistral 推出了 Vibe——一款面向长期任务的 AI Agent。Vibe 旨在处理持续数小时甚至数天的复杂工作流，而非一次性问答。同步上线的还有 Vibe for Code，一款终端和 IDE 编程 Agent，直接对标 Claude Code 和 Codex。这些产品标志着 Mistral 从"提供模型 API"向"提供完整 AI Agent 产品"的重大战略转型。

工业 AI——BMW 大单：Mistral 与 BMW Group 建立了深度合作伙伴关系。BMW 将 Mistral 作为其"大型工业模型"（Large Industry Model）计划的核心合作伙伴，专注于碰撞模拟等多模态推理工程任务。这使 Mistral 成为少数几家深入工业物理 AI 领域的西方 AI 公司之一——绝大多数竞争对手仍聚焦于文本和代码生成。

自有计算基础设施：Mistral CEO Arthur Mensch 在接受 CNBC 采访时确认了公司在欧洲的自有数据中心计划。Mistral 正在 Digital Realty 的巴黎数据中心部署 AI 计算基础设施，并探索自主芯片设计的可能性。Mensch 表示"欧洲开始将 AI 视为战略资产"。TechCrunch 此前报道 Mistral 的年化经常性收入即将突破 $10 亿。

竞争定位：VentureBeat 的分析精辟地总结了 Mistral 的策略——它不是为了在任何一个维度上与美国 AI 巨头正面竞争，而是通过组合一系列"没有一家美国公司愿意或能够提供"的能力来竞争：开放权重模型、自有基础设施、本地部署、物理仿真和深度行业定制化，全部置于一个屋檐下。

◆ 📍 论文解读

◆ The Cold-Start Safety Gap in LLM Agents：冷启动阶段的 LLM Agent 安全漏洞

arXiv ID 待确认 · https://huggingface.co/papers（6 月 14 日 HF Papers 热门）

研究背景：随着 LLM Agent 从简单聊天机器人进化为能够操作工具、访问文件和执行代码的自主系统，安全问题变得前所未有的严峻。现有安全对齐方法（RLHF、Constitutional AI 等）都是在模型层面生效的，但 Agent 系统引入了新的攻击面——工具调用、环境交互、代码执行。现有研究已关注到"Agent 系统部署后的安全威胁"，但鲜有人研究 Agent 在冷启动阶段（即从初始状态到首次用户交互之间的时间窗口）面临的特有安全风险。

核心发现：这篇论文揭示了一个被广泛忽视的安全盲区——LLM Agent 在冷启动阶段存在结构性安全缺口。当 Agent 首次初始化时，它可能在一个尚未被安全护栏覆盖的环境中开始执行，此时如果攻击者能够通过系统提示词注入或初始环境操控来引导 Agent 行为，就可以在安全机制生效前完成恶意操作。论文提出了一个形式化框架来分析这种冷启动风险，并给出了针对性的缓解策略——包括"清理启动"（pristine bootstrapping）和安全感知的初始化序列设计。

行业意义：这篇论文的发表时机恰逢 Agent 安全成为行业热点的时刻——就在同一周，Fable 5 因安全漏洞被政府封杀。冷启动安全缺口的存在意味着，即使模型本身的安全对齐做得再好，Agent 系统在首次运行时的初始状态设计也至关重要。对于正在构建 Agent 平台的团队（微软、Google、OpenAI），这篇论文提供了一个重要的安全设计检查清单。

◆ EvoArena：在动态环境中跟踪 LLM Agent 的记忆演化

arXiv ID 待确认 · https://huggingface.co/papers（6 月 14 日 HF Papers 热门）

研究背景：LLM Agent 在动态环境（如网页导航、软件工程、游戏）中运行时，需要持续跟踪环境状态的变化并更新自身的理解和策略。然而，现有 Agent 系统的评估方法大多关注"一次性任务完成率"，而非 Agent 在动态环境中长期适应和记忆演化的能力。这导致了一个显著的能力盲区。

核心方案：EvoArena 提出了一个全新的评估框架，专门测试 LLM Agent 在动态环境中的记忆演化能力。其核心思路是创建一个模拟环境，在 Agent 执行任务的过程中持续改变环境参数、任务目标和可用工具，观测 Agent 是否正确更新了内部记忆、是否能够基于更新的理解调整策略、以及在面对环境反转时是否会出现混淆或错误。论文通过多个实验证明，现有主流 Agent 系统（基于 GPT-5.5、Claude Opus 4.8、DeepSeek V3.2 等）在环境发生非预期变化时，普遍表现出记忆更新滞后和策略僵化——即 Agent 在适应了初始环境后，当环境发生反转时仍坚持旧策略，表现出"过拟合"式的行为。

行业意义：EvoArena 提醒我们，Agent 评估不应仅仅关注"能否完成任务"，更应关注"在环境变化时能否保持稳健"。这与同一周发布的 MiMo Code 的自演化机制形成了有趣的呼应——MiMo Code 的 `/dream` 和 `/distill` 命令实际上就是在离线状态下解决 Agent 记忆演化的问题，而 EvoArena 则提供了一个系统化的方法来衡量这一能力。

◆ WeaveBench：计算机使用 Agent 的长周期、真实世界基准

arXiv ID 待确认 · https://huggingface.co/papers（6 月 13-14 日 HF Papers 热门）

研究背景：计算机使用（Computer Use）Agent——能够像人类一样操作 GUI 界面的 AI 系统——是 2026 年最受关注的 Agent 应用方向之一。Anthropic、OpenAI 和 Google 都推出了各自的 Computer Use 产品。然而，现有的基准测试大多集中在单步操作或短周期任务上（如"点击某个按钮"、"填写一个表单"），很少测试 Agent 在执行需要跨越多个应用、多天时间、涉及复杂状态管理的真实工作流时的表现。

核心方案：WeaveBench 提出了首个专门针对计算机使用 Agent 的长周期（long-horizon）、真实世界基准。与现有基准不同，WeaveBench 设计的任务需要 Agent 在多个应用程序之间切换、维护跨会话的状态、处理异步事件（如等待邮件回复），以及应对非预期中断。任务涵盖项目管理、数据整理、跨应用工作流等真实企业场景。初步评估显示，即使是最先进的模型在 WeaveBench 上的得分也远低于在单步基准上的表现——最先进的模型在 WeaveBench 上的得分不超过 40%，而在传统基准上可达 70-80%。这证实了长周期计算机使用仍然是当前 AI Agent 的一个尚未有效解决的核心挑战。

行业意义：WeaveBench 的发布恰逢其时。就在同一周，小米的 MiMo Code 和 Mistral 的 Vibe 都将"长期任务"作为核心战场。WeaveBench 提供了一个标准化的度量工具，使得"谁的 Agent 能坚持做更长时间的正确决策"这一问题有了可量化的答案——这对于企业和开发者评估 Agent 产品有着直接的实际意义。

标签：#AI日报 #Anthropic #Fable5 #Mythos5 #出口管制 #PlinyTheLiberator #DavidSacks #OpenAI #AG调查 #价格战 #小米 #MiMoCode #ClaudeCode #MistralAI #Vibe #工业AI #BMW #ClaudeCorps #新宪法 #WeaveBench #EvoArena #安全差距 #IPO