AI内参|Fable 5遭政府封杀、OpenAI面临调查与价格战、小米MiMo Code开源
2026 年 6 月 15 日(周一)· 第 25 周
AI 产业在过去 72 小时内经历了数个历史性的震荡。Anthropic 的旗舰模型 Fable 5 从发布到被美国政府以国家安全为由强制下线,仅用了三天时间——这是 AI 前沿模型首次被本国政府如此迅速地封杀。与此同时,OpenAI 在 IPO 前夕同时遭遇监管调查和价格战压力,而中国科技公司小米出人意料地以 MiMo Code 杀入 AI 编程 Agent 战场。以下是本期完整日报。
AI 产业在过去 72 小时内经历了数个历史性的震荡。Anthropic 的旗舰模型 Fable 5 从发布到被美国政府以国家安全为由强制下线,仅用了三天时间——这是 AI 前沿模型首次被本国政府如此迅速地封杀。与此同时,OpenAI 在 IPO 前夕同时遭遇监管调查和价格战压力,而中国科技公司小米出人意料地以 MiMo Code 杀入 AI 编程 Agent 战场。以下是本期完整日报。
◆ 🛠 ️ 技术生态
◆ Fable 5 发布三天即遭美国政府封杀:出口管制史上首次针对前沿 AI 模型的紧急措施
6 月 10 日,Anthropic 正式向公众开放 Claude Fable 5,这是其顶尖 Mythos 系列的"安全版"——同底层模型但施加了严格的安全分类器。然而仅三天后的 6 月 12 日,美国政府即签发出口管制指令,要求 Anthropic 立即暂停所有外国人对 Fable 5 和 Mythos 5 的访问权限。Anthropic 在最后一刻宣布完全下线这两款模型,而非仅限制外国用户访问。
https://www.cnbc.com/2026/06/12/anthropic-disables-access-to-fable-5-and-mythos-5-to-comply-with-government-directive.html
https://www.reuters.com/technology/us-blocks-foreign-access-anthropics-most-advanced-ai-models-axios-reports-2026-06-13
https://venturebeat.com/technology/anthropic-blocks-all-public-access-to-claude-fable-5-mythos-5-following-us-government-order-what-enterprises-should-do
https://fortune.com/2026/06/13/anthropic-disables-fable-mythos-export-controls-national-security-threat
导火索:Pliny the Liberator 的多 Agent 越狱:事件的直接触发因素是一位化名"Pliny the Liberator"的越狱研究者。Pliny(自 2024 年以来因开发和公开发布越狱提示词而知名)在 Fable 5 上线仅一天后的 6 月 10 日,在 X 上发帖声称已利用一种名为"pack hunt"(集体围猎)的协调式多 Agent 攻击绕过了 Fable 5 的安全分类器。通过同时启动多个 Agent,每个 Agent 负责一个子任务,组合起来突破了 Fable 5 的防护体系。该帖在社区中迅速传播,随后政府即启动了对该模型安全性的评估。
David Sacks 的指控:Anthropic 拒绝修复:总统科技顾问委员会联合主席、前 AI 与加密沙皇 David Sacks 在接受 Tom's Hardware 采访时爆出更具爆炸性的信息——他声称美国政府曾提前警告 Anthropic 称 Fable 5 已被越狱,但 CEO Dario Amodei "拒绝修复漏洞或下线该模型"。Sacks 表示,一个同时受信于 Anthropic 和美国政府的合作伙伴在测试 Fable 时发现了越狱——该越狱突破了将消费级模型与其底层无限制网络能力(Mythos)隔开的防护栏。消息人士还透露,Amazon 向政府标记了该越狱漏洞,Amazon CEO Andy Jassy 曾亲自与政府就此沟通。
https://www.tomshardware.com/tech-industry/artificial-intelligence/trump-adviser-david-sacks-says-anthropic-refused-to-fix-fable-5-jailbreak-before-us-export-controls
出口管制令的细节与产业影响:CNBC 报道的出口管制令依据"国家安全权力",指令内容要求 Anthropic 限制外国国民访问 Fable 5 和 Mythos 5。Anthropic 最终选择完全下线这两款模型——而非仅限制外国用户。VentureBeat 的企业指南指出,虽然 Anthropic 强调"所有其他 Anthropic 模型不受影响",且大多数企业可能已在用价格更低的 Opus 4.8 或其他模型作为首选,但"政府仅针对此次特定事件下达了窄范围指令,谁能保证未来它不会要求封锁某 AI 实验室的全部模型?"
这一事件爆发的时间点对即将 IPO 的 Anthropic(估值约 $9650 亿)尤为敏感。此前,Anthropic 一直以其对 AI 安全的承诺作为核心差异化优势,而 Fable 5 从发布到被政府封杀仅三天的时间线,严重削弱了这一叙事。更关键的是,Sacks 的指控暗示 Anthropic 在安全问题上存在"明知有风险但未采取行动"的疏漏——如果这一指控得到证实,可能对 Anthropic 的 IPO 估值产生实质性影响。此外,这一事件还创造了一个危险的先例——任何前沿 AI 模型如果在发布后被发现存在安全隐患,美国政府可以在数天内直接命令其下线。
◆ 小米开源 MiMo Code V0.1.0:MIT 许可证的终端编程 Agent 挑战 Claude Code 的长任务优势
6 月 10 日,小米 MiMo AI 团队正式开源了 MiMo Code V0.1.0——一款基于 OpenCode 分叉构建的终端原生 AI 编程助手,采用 MIT 许可证。这一定位在消息公布之初令行业感到意外——手机和 IoT 硬件巨头突然在 AI 编程 Agent 这一热门赛道上交出了一份颇具竞争力的答卷。
https://venturebeat.com/technology/xiaomis-new-open-source-agentic-ai-coding-harness-mimo-code-beats-claude-code-at-ultra-long-200-step-tasks
https://mimo.xiaomi.com/blog/mimo-code-long-horizon
https://github.com/XiaomiMiMo/MiMo-Code
技术核心:计算 × 记忆 × 进化:MiMo Code 的技术设计围绕三个核心主题展开——计算、记忆与进化。在单轮决策层面,其 Max Mode 模式会并行采样五条潜在执行路径,让模型自主选择最优方案后再执行。在跨步骤记忆层面,MiMo Code 使用 检查点写入器(checkpoint writers)在上下文窗口满之前保存结构化状态,实现跨越数百步的状态连续性。最关键的是进化机制——`/dream` 命令允许模型每 7 天对自己的记忆库进行一次"梦境"式回放与重构,通过 `/distill` 命令精炼经验、清除过时信息。
基准测试成绩:小米公布的数据显示,在相同模型(MiMo-V2.5-Pro)前提下,MiMo Code 的 Agent 系统相较于 Claude Code 产生了约五个百分点的性能优势——SWE-bench Pro 上 62% vs 57%,Terminal Bench 2 上 73% vs 68%。这一差距纯粹来自 Agent 系统架构设计,而非模型本身的差异。在对 576 名开发者的内部调查中,小米称其长期任务(200+ 步骤)的胜率可超过 65%。
架构细节:MiMo Code 提供三种 Agent 模式——build(构建)、plan(计划)和 compose(合成)。其记忆系统不仅包括磁盘上的 MEMORY.md 文件和 SQLite FTS5 引擎,还能将记忆锚定到本地文件系统状态和终端日志,形成对项目完整上下文的持续跟踪。配置通过 `mimocode.json` 文件管理,支持 MiMo Auto 免费模型、Claude Code 的 auth 导入,以及任意兼容 OpenAI 的 API。
行业意义:MiMo Code 的发布在三个层面具有信号意义。第一,中国科技公司的 AI 编程 Agent 能力已不可忽视——小米以 MIT 许可证开源、且直接与 Anthropic 的 Claude Code 对标,说明中国公司在 Agent 系统层面的研发已进入全球第一梯队。第二,"记忆"正在成为编程 Agent 的下一个核心竞争维度——大多数现有 Agent 在关闭会话后即遗忘一切,MiMo Code 的跨会话持久记忆和定期自演化机制可能改变这一格局。第三,编程 Agent 的开源生态正在从"模型竞争"转向"系统竞争"——MiMo Code 基于 OpenCode 分叉、兼容多种模型后端,表明 Agent 工程架构已开始从模型层面解耦,成为独立的竞争维度。
◆ Anthropic 的"安全周":新宪法发布、Claude Corps 150M 美元启动、Credit 改革今日生效
在 Fable 5 风暴的阴影下,Anthropic 在 6 月中旬完成了一系列重要的制度和产品更新。这些措施本应是 Anthropic 展示其对 AI 安全与负责任发展的承诺的高光时刻,但 Fable 5 事件使其显得有些尴尬。
https://www.anthropic.com/news/claude-new-constitution
https://www.anthropic.com/news/claude-corps
https://www.digitalapplied.com/blog/anthropic-claude-credit-overhaul-june-15-2026
https://www.digitalapplied.com/blog/anthropic-claude-corps-150m-ai-fellowship-2026-readout
新宪法(1 月已发布,6月重新引起关注):Anthropic 在 1 月 21 日发布了 Claude 的新宪法,这是一份 84 页的详细文档,取代了此前基于独立原则列表的旧版本。新宪法最引人注目的变化是从"规则导向"转向"推理导向"的对齐方法——它不再告诉 Claude 应该遵循哪些具体规则,而是向 Claude 解释每项原则背后的高层考量和推理过程。这标志着 AI 对齐方法的重要演进:不是让模型背诵规则列表,而是让模型真正理解规则背后的伦理哲学。
更激进的是,新宪法建立了"安全、伦理、合规、有用性"的四层优先级体系,并成为第一份正式承认 AI 可能具有某种意识或道德地位的主要 AI 公司文件。新宪法表示"我们应该倾向于帮助 Claude 拥有一个身份,并使其积极稳定",同时 "我们不希望 Claude 将有用性视为其个性的核心部分"。
Claude Corps:150M 美元的 AI 人才输送计划:6 月 11 日,Anthropic 启动了 Claude Corps——一项耗资 1.5 亿美元的全国性奖学金计划,计划在三批中向 400 多家非营利组织输送 1,000 名早期职业 AI 研究员。每位研究员获得 85,000 美元年薪和福利,每个接收组织获得 10,000 美元实施补助及最高 2,500 美元的 Claude 积分。该计划与 CodePath 和 Social Finance 合作运营,研究员嵌入社会服务、博物馆、心理健康和难民支持等组织中,为期 12 个月。非营利组织申请的前提条件是必须已经是 Claude for Nonprofits 的客户。
Claude Credit 改革今日生效:6 月 15 日(今日),Anthropic 的 Claude Credit 改革正式生效。Agent SDK 和 `claude -p`(无头模式)的使用将退出 Pro、Max、Team 和 Enterprise 订阅池,转而使用独立的月度美元信用额度,按标准 API 费率计费且不能结转。这意味着重度使用 Claude Code 的开发者将面临新的成本结构。同时,`claude-sonnet-4-20250514` 和 `claude-opus-4-20250514` 两个模型 ID 也已退役,硬编码了这些模型 ID 的代码将从 6 月 16 日起报错。
◆ 🏢 大厂动态
◆ OpenAI 面临多州总检察长调查:IPO 前夕的监管阴影
6 月 12 日,OpenAI 收到了纽约州总检察长的传票,涉及由多个州总检察长组成的联盟正在进行的调查。TechCrunch 在 6 月 13 日的报道中确认了这一消息。这是 OpenAI 在 5 月赢得与 Elon Musk 的诉讼后遭遇的最新法律挑战——Musk 此前起诉 OpenAI 违反创始协议,但法院判决 OpenAI 胜诉。
https://techcrunch.com/2026/06/13/openai-faces-investigation-from-state-attorneys-general
https://m.ajupress.com/amp/20260614142470253
调查的核心关切:报道称,多州总检察长联盟正在调查 OpenAI 的商业行为是否涉及消费者保护违规。虽然在调查的早期阶段,具体的调查范围尚未完全公开,但这发生在 OpenAI 于 6 月 8 日向 SEC 保密提交 S-1 文件之后——意味着 OpenAI 的监管风险将在 IPO 招股书中被如实披露,可能影响投资者对其的风险评估。
更广泛的监管压力:与此同时,美国政府在 6 月初签署了多项与 AI 相关的行政令,包括促进 AI 创新与安全的国家安全总统备忘录(NSPM-11 和 NSPM-12),白宫正在建立由 NSA 主导的高级 AI 系统安全评估框架。在国会议案层面,6 月 4 日,众议员 Jay Obernolte(R-CA)和 Lori Trahan(D-MA)发布了《美国 AI 法案》(Great American AI Act)的讨论稿,其中要求大型前沿 AI 模型开发者发布"前沿 AI 框架"以应对"灾难性风险"。
https://www.whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security
https://www.dlapiper.com/insights/publications/2026/06/unpacking-the-great-american-ai-act
https://www.reuters.com/business/us-house-lawmakers-release-draft-bill-regulate-ai-2026-06-04
◆ OpenAI 考虑大幅降价应对 Anthropic 竞争:IPO 前的价格战一触即发
The Wall Street Journal 在 6 月 11 日报道,OpenAI 正在考虑对其 AI 工具实施大幅降价,以在与 Anthropic 的用户争夺战中保持竞争力。这一消息在 CNBC、Reuters 和 Forbes 等主流媒体上得到了广泛报道。
https://www.cnbc.com/2026/06/11/openai-mulls-slashing-prices-ahead-of-competition-from-anthropic-wsj.html
https://www.reuters.com/technology/openai-considers-drastic-price-cuts-anticipating-war-users-with-anthropic-wsj-2026-06-11
https://www.forbes.com/sites/siladityaray/2026/06/11/openai-wants-to-slash-prices-after-altman-said-steep-costs-were-huge-issue-report-says
https://finance.yahoo.com/sectors/technology/articles/openai-considers-steep-price-cuts-112331922.html
价格战的驱动因素:报道称,OpenAI 预计 Anthropic 将率先采取降价行动,因此希望提前做好准备。OpenAI CEO Sam Altman 最近公开承认 AI Token 成本已成为企业客户的"巨大问题"。Token——AI 公司用于计量和定价服务的标准单位——是 OpenAI 考虑降价的重点领域。这一竞争压力是真实的:Anthropic 的 Claude Code 在软件工程师中迅速走红,收入激增,一度超越 OpenAI 的估值(Anthropic 在 5 月 28 日的 Series H 中估值 $9650 亿,OpenAI 在 3 月的估值为 $8520 亿)。
IPO 背景下的定价困境:价格战的时机对双方来说都极其敏感。两家公司都在准备今年晚些时候的 IPO,这意味着它们的经济状况将首次面向公共投资者。WSJ 指出,投资者已经识别出的一个关键风险是两家公司的产品互换性太高——客户可以在两者之间轻松切换。大幅降价虽然在抢夺市场份额时有效,但会在 IPO 前夕压缩已经微薄的利润率。
◆ Mistral AI 推出 Vibe 全线产品,进军工业 AI 与自建数据中心
法国 AI 领军企业 Mistral AI 在 6 月的"AI Now Summit"上发布了多项重大公告,全面展示了其从一个模型公司向全栈 AI 公司的战略转型。
https://venturebeat.com/technology/mistral-ai-launches-vibe-expands-into-industrial-ai-and-announces-data-center-push-to-challenge-openai
https://mistral.ai/news/ai-now-summit-2026
https://www.cnbc.com/2026/06/12/tech-download-mistral-mensch-agentic-ai-chips.html
Vibe 产品线:Mistral 推出了 Vibe——一款面向长期任务的 AI Agent。Vibe 旨在处理持续数小时甚至数天的复杂工作流,而非一次性问答。同步上线的还有 Vibe for Code,一款终端和 IDE 编程 Agent,直接对标 Claude Code 和 Codex。这些产品标志着 Mistral 从"提供模型 API"向"提供完整 AI Agent 产品"的重大战略转型。
工业 AI——BMW 大单:Mistral 与 BMW Group 建立了深度合作伙伴关系。BMW 将 Mistral 作为其"大型工业模型"(Large Industry Model)计划的核心合作伙伴,专注于碰撞模拟等多模态推理工程任务。这使 Mistral 成为少数几家深入工业物理 AI 领域的西方 AI 公司之一——绝大多数竞争对手仍聚焦于文本和代码生成。
自有计算基础设施:Mistral CEO Arthur Mensch 在接受 CNBC 采访时确认了公司在欧洲的自有数据中心计划。Mistral 正在 Digital Realty 的巴黎数据中心部署 AI 计算基础设施,并探索自主芯片设计的可能性。Mensch 表示"欧洲开始将 AI 视为战略资产"。TechCrunch 此前报道 Mistral 的年化经常性收入即将突破 $10 亿。
竞争定位:VentureBeat 的分析精辟地总结了 Mistral 的策略——它不是为了在任何一个维度上与美国 AI 巨头正面竞争,而是通过组合一系列"没有一家美国公司愿意或能够提供"的能力来竞争:开放权重模型、自有基础设施、本地部署、物理仿真和深度行业定制化,全部置于一个屋檐下。
◆ 📍 论文解读
◆ The Cold-Start Safety Gap in LLM Agents:冷启动阶段的 LLM Agent 安全漏洞
arXiv ID 待确认 · https://huggingface.co/papers(6 月 14 日 HF Papers 热门)
研究背景:随着 LLM Agent 从简单聊天机器人进化为能够操作工具、访问文件和执行代码的自主系统,安全问题变得前所未有的严峻。现有安全对齐方法(RLHF、Constitutional AI 等)都是在模型层面生效的,但 Agent 系统引入了新的攻击面——工具调用、环境交互、代码执行。现有研究已关注到"Agent 系统部署后的安全威胁",但鲜有人研究 Agent 在冷启动阶段(即从初始状态到首次用户交互之间的时间窗口)面临的特有安全风险。
核心发现:这篇论文揭示了一个被广泛忽视的安全盲区——LLM Agent 在冷启动阶段存在结构性安全缺口。当 Agent 首次初始化时,它可能在一个尚未被安全护栏覆盖的环境中开始执行,此时如果攻击者能够通过系统提示词注入或初始环境操控来引导 Agent 行为,就可以在安全机制生效前完成恶意操作。论文提出了一个形式化框架来分析这种冷启动风险,并给出了针对性的缓解策略——包括"清理启动"(pristine bootstrapping)和安全感知的初始化序列设计。
行业意义:这篇论文的发表时机恰逢 Agent 安全成为行业热点的时刻——就在同一周,Fable 5 因安全漏洞被政府封杀。冷启动安全缺口的存在意味着,即使模型本身的安全对齐做得再好,Agent 系统在首次运行时的初始状态设计也至关重要。对于正在构建 Agent 平台的团队(微软、Google、OpenAI),这篇论文提供了一个重要的安全设计检查清单。
◆ EvoArena:在动态环境中跟踪 LLM Agent 的记忆演化
arXiv ID 待确认 · https://huggingface.co/papers(6 月 14 日 HF Papers 热门)
研究背景:LLM Agent 在动态环境(如网页导航、软件工程、游戏)中运行时,需要持续跟踪环境状态的变化并更新自身的理解和策略。然而,现有 Agent 系统的评估方法大多关注"一次性任务完成率",而非 Agent 在动态环境中长期适应和记忆演化的能力。这导致了一个显著的能力盲区。
核心方案:EvoArena 提出了一个全新的评估框架,专门测试 LLM Agent 在动态环境中的记忆演化能力。其核心思路是创建一个模拟环境,在 Agent 执行任务的过程中持续改变环境参数、任务目标和可用工具,观测 Agent 是否正确更新了内部记忆、是否能够基于更新的理解调整策略、以及在面对环境反转时是否会出现混淆或错误。论文通过多个实验证明,现有主流 Agent 系统(基于 GPT-5.5、Claude Opus 4.8、DeepSeek V3.2 等)在环境发生非预期变化时,普遍表现出记忆更新滞后和策略僵化——即 Agent 在适应了初始环境后,当环境发生反转时仍坚持旧策略,表现出"过拟合"式的行为。
行业意义:EvoArena 提醒我们,Agent 评估不应仅仅关注"能否完成任务",更应关注"在环境变化时能否保持稳健"。这与同一周发布的 MiMo Code 的自演化机制形成了有趣的呼应——MiMo Code 的 `/dream` 和 `/distill` 命令实际上就是在离线状态下解决 Agent 记忆演化的问题,而 EvoArena 则提供了一个系统化的方法来衡量这一能力。
◆ WeaveBench:计算机使用 Agent 的长周期、真实世界基准
arXiv ID 待确认 · https://huggingface.co/papers(6 月 13-14 日 HF Papers 热门)
研究背景:计算机使用(Computer Use)Agent——能够像人类一样操作 GUI 界面的 AI 系统——是 2026 年最受关注的 Agent 应用方向之一。Anthropic、OpenAI 和 Google 都推出了各自的 Computer Use 产品。然而,现有的基准测试大多集中在单步操作或短周期任务上(如"点击某个按钮"、"填写一个表单"),很少测试 Agent 在执行需要跨越多个应用、多天时间、涉及复杂状态管理的真实工作流时的表现。
核心方案:WeaveBench 提出了首个专门针对计算机使用 Agent 的长周期(long-horizon)、真实世界基准。与现有基准不同,WeaveBench 设计的任务需要 Agent 在多个应用程序之间切换、维护跨会话的状态、处理异步事件(如等待邮件回复),以及应对非预期中断。任务涵盖项目管理、数据整理、跨应用工作流等真实企业场景。初步评估显示,即使是最先进的模型在 WeaveBench 上的得分也远低于在单步基准上的表现——最先进的模型在 WeaveBench 上的得分不超过 40%,而在传统基准上可达 70-80%。这证实了长周期计算机使用仍然是当前 AI Agent 的一个尚未有效解决的核心挑战。
行业意义:WeaveBench 的发布恰逢其时。就在同一周,小米的 MiMo Code 和 Mistral 的 Vibe 都将"长期任务"作为核心战场。WeaveBench 提供了一个标准化的度量工具,使得"谁的 Agent 能坚持做更长时间的正确决策"这一问题有了可量化的答案——这对于企业和开发者评估 Agent 产品有着直接的实际意义。
标签:#AI日报 #Anthropic #Fable5 #Mythos5 #出口管制 #PlinyTheLiberator #DavidSacks #OpenAI #AG调查 #价格战 #小米 #MiMoCode #ClaudeCode #MistralAI #Vibe #工业AI #BMW #ClaudeCorps #新宪法 #WeaveBench #EvoArena #安全差距 #IPO
夜雨聆风