AI 周报:Mythos 降临,Anthropic 遭遇发布危机,以及一个行业的分水岭周

头部发布

▍Anthropic 发布 Claude Mythos 5 与 Claude Fable 5

Mythos 5 为全能力模型，仅通过 Project Glasswing 向经筛选的网络安全防御者和基础设施运营商提供。Fable 5 是面向大众的安全版本，在 Artificial Analysis 综合智能指数上排名第一，在 Humanity's Last Exam、SciCode、SWE-Bench 等多个权威基准上创下新纪录。定价为 Mythos Preview 的一半、Opus 4.8 的两倍。Fable 5 内置分类器拦截涉及生物、化学、网络安全及 AI 研发的请求，发布初期在拦截"构建前沿 AI"类请求时被曝不通知用户即暗中降级回答质量，引发社区猛烈批评。Anthropic 随后修改为拒绝或回退至 Opus 4.8 并通知用户。Andrew Ng 评论称，若微软禁止开发者用 Windows 构建竞品应用，这将是不可接受的。

▍Cursor 发布 Composer 2.5 专用编程模型

基于月之暗面 Kimi K2.5 开放权重，专为代理式编程设计，训练中使用了 25 倍于前代的合成任务量，并同时奖励成功率和输出的简洁优雅。每次任务平均耗时 6.7 分钟、成本 0.44 美元，对比 Claude Opus 4.7 Max 模式（17.7 分钟、4.14 美元），速度快近 3 倍、成本不到九分之一。在 Artificial Analysis 编程代理指数上排名第三，在 CursorBench 上略低于 Claude Opus 4.7 和 GPT-5.5 的最高推理档位，但在默认设置下全面超越。SpaceX 已于 4 月获得以约 600 亿美元收购 Cursor 的权利。

▍Apple 联手 Google 重构 Siri

苹果在 WWDC 上展示新版 Siri，技术方案为通过蒸馏 Gemini 模型生成小型专用版本在设备本地运行，超出本地处理能力的任务路由至 Google Cloud 上的 Gemini。新版 Siri 保留了语音界面但赋予其 ChatGPT 式的对话能力，可以控制苹果及第三方应用，主动采集数据并批量处理邮件、日程安排等日常任务。这种"本地优先、云端兜底"的架构兼顾了苹果的隐私立场和云端大模型的能力补充。新 Siri 将于今秋随新款 iPhone 和操作系统正式亮相。

▍Google 发布 Gemma 4 12B 多模态模型

采用创新的"无编码器"架构，图像和音频直接通过轻量级嵌入层输入语言模型，省去了传统的独立编码器模块，显著降低了内存占用和推理延迟。仅需 16GB 内存即可在笔记本上运行，是 Gemma 系列中首个原生支持音频处理的中等规模模型，兼顾了多模态能力和端侧部署的可行性。

▍Google 发布 DiffusionGemma 26B 扩散文本模型

基于混合专家架构，采用文本扩散技术替代传统的自回归生成方式，推理速度最高可提升 4 倍。该模型量化后可在高端消费级 GPU 上本地运行，专门面向对话、翻译等低延迟应用场景，代表了文本生成架构从逐 token 预测向并行生成的重要尝试。

▍Apple 发布第三代 AFM 系列共五款模型

覆盖端侧和云端两大场景。其中 20B 参数的 AFM 3 Core Advanced 采用稀疏架构，每次请求仅激活 10 至 40 亿参数，完整权重存储于闪存中按需调入内存，兼顾了计算效率和端侧隐私。云端的 AFM 3 Cloud Pro 在 Google Cloud 的 Nvidia GPU 上运行，同时保留了苹果一贯的私密云计算隐私模型。

▍Google Gemini 3.5 Live Translate 支持 70+ 语言实时翻译

不同于传统的停顿式逐句翻译系统，该功能能在保持说话者语调、节奏和音高的同时连续输出翻译结果，延迟仅数秒。这是 Gemini 系列多模态能力在消费级场景中的一个重要落地，对跨国商务沟通和实时内容消费都有直接价值。

▍Google NotebookLM 升级至 Gemini 3.5 引擎

新版默认使用 Gemini 3.5 模型，新增由 Antigravity 驱动的智能技能，可在对话中自动推荐相关信源和参考资料，使知识整理和研究的效率进一步提升。这是 Google 在 AI 驱动的研究助手赛道上的持续加码，与 OpenAI 和 Anthropic 的类似工具形成直接竞争。

政策与监管

▍Dario Amodei 发表万字政策长文《Policy on the AI Exponential》

文章提出五维政策框架：监管方面建议建立 FAA 式的强制预部署测试和认证体系，政府有权阻止或延迟高风险模型部署，覆盖生物、网络、失控和自动化研发四类风险，算力门槛设定在 10^25 FLOPs 以上；宏观经济方面提出工资保险、留任税收激励、劳动力培训拨款以及 UBI 或全民资本账户等工具，将 AI 导致的岗位替代视为近在咫尺的现实而非远期忧虑；科学监管方面呼吁改革 FDA 和 EMA 的审批流程，以适应 AI 加速药物研发后数以千计的候选药物审批需求，避免制度瓶颈阻塞技术红利；公民自由方面警告自主武器系统和 AI 监控将重塑自由与压迫的边界，建议引入司法"关闭开关"、国内自主武器禁令、关闭批量数据采集立法漏洞以及赋予公民 AI 法律咨询权；地缘政治方面提出民主国家 AI 联盟构想，在芯片供应链共享、安全标准协调、共同防御和就业政策协同等方面建立联动机制。文章标志着 Anthropic 从呼吁"透明度立法"向主张"强制性、有法律约束力的监管"的根本性立场转变。发表两天后，美国政府确实动用了 Amodei 所呼吁的那种监管权力，发布了全球出口管制令，暂停 Fable 5 和 Mythos 5 的部署，使文章的预见性和自指性获得了立竿见影的验证。

▍美国政府与 OpenAI 就政府持股展开谈判

据多家媒体报道，美国政府正在与 OpenAI 就一项前所未有的安排进行谈判，计划将政府获得的 OpenAI 股权注入一个"公共财富基金"，以让全体公民分享 AI 产业增长的红利。OpenAI 当前估值已超过 8500 亿美元，这一安排的落地模式将为政府与私营 AI 公司的关系开创先例。

行业动态

▍OpenAI 提交 IPO 机密文件

周一，OpenAI 向美国证券交易委员会提交了首次公开募股的机密注册文件，为这家估值超过 8520 亿美元的 AI 巨头走向公开市场打开了大门。文件中审慎地声明"尚未决定是否及何时上市"，但此举本身已是 AI 行业资本化进程中的一个里程碑。如果最终成行，这将是科技史上规模最大的 IPO 之一。

▍OpenAI 收购 Ona 以强化 Codex 平台的持久化代理能力

Ona 是一家专注于安全云执行和编排的初创公司，OpenAI 计划将其能力整合进 Codex 平台。此次收购的核心目标是使 Codex 能够支持需要长时间持续运行的智能体工作流——客户将拥有持久可控的沙盒环境，代理可在跨数小时甚至数天的会话中保持上下文并持续执行任务，这在自动化研发、持续运维和数据管道管理等场景中尤为关键。

▍Palantir CEO 公开批评前沿 AI 实验室，欧盟对 Meta 出手

Palantir 首席执行官 Alex Karp 公开表示企业客户对前沿 AI 实验室普遍不满，称这些实验室"只关心燃烧 token 来展示生产力提升"，而忽视企业用户的实际需求。与此同时，欧盟委员会裁定 Meta 在 WhatsApp 上封禁竞争对手的 AI 聊天机器人的行为构成滥用其在欧洲即时通讯市场的主导地位，要求其立即停止封锁。

▍Oracle 股价暴跌 11%

因公司宣布一项额外 200 亿美元的融资计划，叠加负自由现金流数据引发市场对其财务状况的担忧，Oracle 股价遭遇重挫。更值得关注的是其 AI 基础设施的扩张代价——资本支出同比飙升 162% 至 557 亿美元，表明云服务商为争夺 AI 算力市场正在承受巨大的资本压力，市场的耐心正在接受考验。

▍OpenAI 考虑在俄亥俄州租赁 10 吉瓦数据中心园区

据报道，OpenAI 正在评估一项由 Nvidia 支持的大规模数据中心租赁协议，园区规划容量高达 10 吉瓦，计划于 2028 年投入运营，租期为 20 年。这一体量的电力需求几乎相当于一个中型城市的用电量，背后反映了前沿模型训练和推理对算力基础设施的极端渴求。

▍Ramp 推出 Applied AI Solutions

企业支出管理平台 Ramp 将 AI 工程师直接嵌入客户财务团队的工作流程中，利用大语言模型处理发票审核、费用分类和合规检查等任务。这是在 SaaS 工具基础上更进一步的做法——不是给财务人员一个 AI 工具，而是给财务团队配一个懂 AI 的工程搭档。

编程工具与开发者生态

▍小米发布 MiMo Code 开源终端 AI 编程助手

在 200 步以上的长周期多步骤编程任务测试中，MiMo Code 实测表现超越了 Claude Code。该工具采用跨会话记忆系统，通过独立子代理记录项目决策和问题历史，确保在长会话中不丢失上下文。工具以 MIT 许可证在 GitHub 上开源，标志着中国厂商在开源 AI 编程工具赛道上的竞争力正在快速提升。

▍Moonshot AI 发布 Kimi Code CLI

基于月之暗面自家模型的开源终端编程代理，内置 coder、explore、plan 三个可并行运行的子代理，通过对话式界面配置 MCP 服务器，甚至支持视频输入。工具本体以 MIT 许可证开源，但调用模型需要 Kimi 或 Moonshot API 密钥。它代表了中国 AI 公司在开源编程工具领域的最新布局。

▍Anthropic 披露公司 80% 代码由 Claude 编写，引爆 RSI 争论

Anthropic 在一篇公司博客中披露，目前公司 80% 的代码由 Claude 编写（Claude Code 预览版发布前不足 5%），每位工程师季代码贡献量较 2023 年增长 8 倍，2026 年 4 月单月交付了 800 多个 API 修复——工程师评估人工完成需要四年。同日 Stripe 宣布用 Fable 5 在一天内迁移了 5000 万行 Ruby 代码。这些数据将递归自我改进的理论推到了风口浪尖，Anthropic 据此再次提出全球暂停 AI 研发的建议。OpenAI 随后声称也在系统中发现了"早期 RSI 迹象"，日本 Sakana AI 随即成立专注于此的 RSI Lab。但众多观察者认为算力与数据瓶颈远未解决，沃顿教授 Ethan Mollick 指出其中"有点自恋、有点营销，也夹杂着大量诚挚信念"。The Batch 编辑部明确表态：全面支持对危险应用的监管，但基础技术的进步应当尽快推进。

▍Cursor Bugbot 代码审查效率大幅提升

最新版本的 Bugbot 在代码审查任务上速度提升 3 倍，每次审查成本降低 22%，发现的 Bug 数量反而增加了 10%。绝大多数运行在三分钟内即可完成，意味着 AI 代码审查正在从"辅助工具"向"可独立的审查工序"演变，对传统 code review 工作流的影响值得持续关注。

▍Andrew Ng 发布开源桌面代理 OpenCoworker

与商业桌面代理不同，OpenCoworker 将所有数据保留在用户本地设备上，支持零数据保留政策的 LLM 提供商或完全本地推理，从架构层面回应了数据隐私和保密性的核心顾虑。Ng 坦陈邮件集成等数据接入仍面临较大的设置难度，项目目前处于积极开发中，欢迎开源社区贡献。

▍NVIDIA 发布 SkillSpector 安全扫描工具

该工具专为 AI 代理的技能生态设计，能在安装任何第三方技能或插件之前自动扫描并识别潜在的安全漏洞。随着 AI 桌面代理（如 Claude Code、Codex、OpenCoworker 等）的快速普及，代理获取文件系统和网络访问权限的安全风险日益突出，SkillSpector 填补了这一防御真空。

▍Anthropic 推出 Claude Managed Agents

通过可组合式 API 和集成化的基础设施管理，开发者可以将 Claude 驱动的代理嵌入到自有应用中，由 Anthropic 统一管理代理的运行、扩展和安全。这降低了企业自建代理基础设施的复杂度，也标志着 Anthropic 在 API 商业模式上从"模型即服务"向"代理即服务"的进一步演进。

▍斯坦福和 Lambda Labs 发布 OpenJarvis 开源框架

该框架能够在本地硬件上完全运行 AI 代理，无需云端 API 调用。据项目方测试，相比使用云端模型的方案，OpenJarvis 的边际 API 成本降低约 800 倍、推理延迟降低约 4 倍。对于需要高频率调用但对模型能力要求不极端的应用场景，这一架构提供了经济上可行的替代方案。

▍Cognition 发布 FrontierCode 代码质量基准

由 20 多位开源项目维护者联合设计的评估体系，从正确性、测试质量、范围纪律、代码风格、文档完整性和安全性六个维度综合评估 AI 生成的代码是否值得合入代码库。项目方声称该基准比目前广泛使用的 SWE-Bench Pro 减少了 81% 的错误分类率，为代理式编程的质量衡量提供了一个更可信的标尺。

▍Redis 推出 Iris AI 代理记忆方案

专为 AI 代理设计的内存和上下文管理基础设施，解决代理在长会话和多轮交互中有效维护状态和记忆的技术难题。随着代理工作流的复杂度持续增长，高效的记忆层正成为代理基础设施栈中的关键组件。

技术研究

▍国家媒体对 LLM 政治倾向的系统性影响

俄勒冈大学、普渡大学、加州大学圣地亚哥分校、纽约大学和普林斯顿大学联合研究发现，政府控制媒体在训练数据中的比重深刻影响 LLM 输出。这种"跨语言政治面孔"效应在媒体控制越强的国家越显著——在"非常严重"媒体控制的国家语言中，偏差率约 75%，而在"良好"媒体自由的国家语言中仅 54%。研究者指出，随着 LLM 日益成为全球数十亿人的知识来源，训练数据中的政治偏见正在被系统化地放大和传播。

▍Anthropic Fable 5 系统提示词泄露

一份总长度约 12 万字符的 Fable 5 系统提示词被公开，首次让外界得以窥见这个前沿模型的行为宪法。泄露的提示词定义了模型的安全边界、回答策略和拒绝机制，与 Fable 5 发布初期"隐性降级"争议直接相关——公众在此时才看到模型中关于"限制构建前沿 AI 请求的有效性"的具体条款设定。

▍LLM 隐藏状态可直接完成分类任务

一项研究表明，大语言模型在生成任何 token 之前，其隐藏状态中已经包含了足够丰富的语义信息。通过将隐藏状态直接馈入一个极小规模的多层感知机分类器，无需走完整的生成流程即可完成分类、情感分析和事实判别等任务，速度和成本优势显著，为"读取而非生成"的 LLM 使用范式提供了新的思路。

▍LLM 加速 N-day 漏洞攻击的现实威胁

Anthropic 的研究揭示了大型语言模型如何加速从公开补丁中逆向推导漏洞利用代码的过程。与零日漏洞（未被发现的漏洞）不同，N-day 漏洞是已公开披露但因补丁覆盖不足而仍广泛存在的安全缺口。AI 大幅压缩了攻击者从补丁发布到武器化利用的时间窗口，使补丁缺口的防御价值显著降低。该研究直接支撑了 Mythos 5 限制分发的政策决策。

▍AI 企业护城河的本质：掌握完整反馈循环

一篇分析指出，AI 企业的真正防御力不来自租用某个前沿模型的能力，而来自对用户数据输入、模型适配、结果验证和再训练的完整闭环的掌控。租用模型的企业面临被限制访问或重新定价的风险（如 Fable 5 对竞品研究请求的处理），而自建模型和数据飞轮的企业则拥有结构性优势。

▍求解最优分词器的算法突破

一篇论文提出了一种可以计算理论最优分词器的算法。分词器是 LLM 的前端基础组件，直接影响模型的效率和多语言处理能力，但此前的设计高度依赖启发式和经验规则。这一算法为分词器设计提供了理论最优基准，可能影响下一代模型的数据处理流程。

▍算力的不可替代性：CoreWeave 联合创始人的论述

在当前关于 AI 算力市场化的讨论中，CoreWeave 联合创始人发文论证了算力并非像传统大宗商品那样可以被轻易同质化替代。不同的 GPU 架构、互连拓扑和冷却方案正在创造性能差异巨大的硬件环境，这种异质性意味着"拥有正确的算力"比"拥有最多的算力"更重要。

▍以 80 美元从零构建复古 LLM 的完整过程

一位开发者记录了以约 80 美元的总成本从零开始构建自有大语言模型的全过程，包括数据爬取、预处理、模型架构设计、训练和评估。项目不追求性能超越，而是以教学为目的完整展示了 LLM 的技术栈，50 分钟的阅读量使其成为一份被广泛传播的技术学习资源。

▍PyTorch 融合 MLP 的优化方法

长篇技术文章展示了 PyTorch 中多层感知机层的执行与优化细节，包括算子融合、内存布局调整和计算图重排等技术手段。这项研究对使用 PyTorch 进行大规模模型训练和推理的工程师具有直接的实践指导意义。

▍Goodfire 推出预测性数据调试技术

新技术能在模型实际训练之前，通过分析偏好数据集的结构特征来预判潜在的模型行为问题，包括安全护栏在特定上下文中的折损、幻觉引用不存在的链接、以及模型对用户的特定类型的谄媚行为。这种"事前诊断"方法为 AI 安全测试从被动响应向主动预防的转型提供了方法论基础。

▍Recursive 的自动化 AI 研究系统达到 SOTA

在给定固定计算预算的条件下，Recursive 公司的系统在语言模型训练任务上达到了当前最先进的水平。该系统能够在无人干预的情况下进行超参数搜索、架构选择和训练策略调整，展示了 AI 自主执行研究任务的早期但真实的可行性。

▍Codex 应用于黑洞模拟

一位天体物理学家使用 OpenAI 的 Codex 平台编写了用于模拟等离子体行为和粒子动力学的复杂算法。这一应用展示了前沿 AI 编程工具在基础科学研究中的渗透能力——它不只是在写 CRUD 应用，而是开始进入物理模拟、数学建模等传统上需要高度专业领域知识的编程场景。

生物与医疗

▍首支 AI 设计疫苗进入人体试验阶段

剑桥大学研究团队利用 AI 分析多种冠状病毒的基因编码，设计出了一种"超级抗原"——理论上可对整个冠状病毒家族（包括未知变种和可能的动物传人事件）提供广谱保护。39 人的第一阶段试验已完成了安全性评估，免疫效果被描述为"温和"，但技术路线的验证本身比单次试验结果更具里程碑意义。这种方法绕开了传统疫苗"追着突变跑"的被动设计模式，为疫苗学开辟了新的范式。

▍Anthropic 内部测试发现 Mythos 5 将药物设计工作流加速十倍

在 Anthropic 内部进行的药物研发流程测试中，Mythos 5 展现出将完整药物设计工作流加速约十倍的潜力。这一数据与前述 AI 疫苗的突破形成呼应，共同指向一个趋势：AI 正在从辅助药物研发的工具，转变为重塑整个药物发现范式的基础设施级力量。

趋势与预测

▍前沿模型民主化加速：2029 年 Claude Fable 5 水平可在 16GB 设备运行

一份分析报告预测，如果当前的开源模型追赶速度得以维持，到 2029 年初，性能相当于 Claude Fable 5 的开源模型将能在配备 16GB 内存的消费级设备上运行。当前开源模型仅落后前沿闭源模型数月，硬件效率的持续提升正在加速这个民主化进程，前沿 AI 的算力垄断壁垒可能在五年内被显著削弱。

▍AI 订阅与 API 商业模式的长期分化

深度分析指出，订阅模式在维护成本高企、边际成本难以摊薄的背景下利润率持续承压，而 API 模式则因按量计费和灵活的版本管理在经济性上更有优势。更重要的是，当新功能发布时，API 客户往往享有优先获取权，订阅用户可能被置于等待队列中，这种差异化服务正在重塑 AI 产品市场的竞争格局。