AI 周报 | 6 月 2 日–9 日:Claude Mythos 级模型公开、苹果 Siri 改用 Gemini

这一周，AI 行业的主线是「前沿能力加速落地、规则与成本同时收紧」。Anthropic 把此前只对网络安全机构开放的 Mythos 级模型首次面向公众放出（Claude Fable 5），苹果在 WWDC 上承认自研失败、把全新 Siri 押注在谷歌 Gem)ini 上，OpenAI 把 Codex 推向全公司白领、并给免费用户上线「会做梦」的记忆系统。与此同时，Gemini 3.5 Pro 仍在「跳票」边缘，xAI、MiniMax、微软的新模型轮番登场。规则层面，联合国发布迄今最系统的 AI 环境足迹报告，GitHub Copilot 改用按 Token 计费引爆开发者怒火。

大模型与重磅产品发布

Anthropic 正式公开 Mythos 级模型：Claude Fable 5 与 Mythos 5 同时登场
来源：Pasquale Pillitteri / Yahoo Finance｜日期：2026-06-09
6 月 9 日，Anthropic 正式发布 Claude Fable 5（带安全护栏的公开版）与 Claude Mythos 5（移除部分限制、仅经 Project Glasswing 向网络安全专业人士开放）。Fable 5 在 SWE-Bench Pro 上拿下 80.3%（Opus 4.8 为 69.2%、GPT-5.5 为 58.6%），定价为每百万 token 输入 10 美元、输出 50 美元，恰为 Opus 的两倍；涉及网络安全和生物的高风险请求会自动改路由到 Opus 4.8，触发率低于 5%。Anthropic 称 Stripe 用它把一次涉及 5000 万行代码的迁移从数月压缩到数天。

Gemini 3.5 Pro 本周仍未发布，谷歌的「下个月」承诺逼近月底
来源：Tech Times｜日期：2026-06-06
皮查伊在 5 月 19 日 I/O 上说「再给我们一个月」，但截至 6 月初 Gemini 3.5 Pro 仍只在 Vertex 内部预览，未正式上线。官方规格指向 200 万 token 上下文窗口与 Deep Think 推理模式，预期定价约为 3.5 Flash 的十倍（约每百万 token 输入 15 美元、输出 60 美元）。已上线的 3.5 Flash 跑出 55 分的 Intelligence Index、284 tokens/秒的速度，本周成为业界推断 Pro 性能的主要参照。

OpenAI 把 Codex 推向全公司白领：上线 Sites、Annotations 与六大行业插件
来源：OpenAI / VentureBeat｜日期：2026-06-02
6 月 2 日的「Intelligence at Work」发布会上，OpenAI 给 Codex 加了三件套：六个行业插件（覆盖销售、数据分析、创意、产品设计等，集成 62 个应用与 110 项技能）、可对文档/表格/幻灯片做局部精修的 Annotations，以及能把分析一键变成可分享内部网页应用的 Sites。Codex 周活已达 500 万，其中非开发者占约 20%，增速是开发者的三倍多；OpenAI 还预告未来几周把 Codex 能力直接搬进 ChatGPT。

ChatGPT 上线「会做梦」的记忆系统 Dreaming，免费用户首次可用
来源：OpenAI / Open Data Science｜日期：2026-06-04
6 月 4 日，OpenAI 把记忆系统 Dreaming 向免费用户开放。它能随时间自动更新记忆——比如把「你 7 月要去新加坡」改写成「你 2026 年 7 月去过新加坡」，从而在时间敏感的问答上给出更贴合现状的回答。隐私研究者已提出担忧：一项 2026 年 2 月的 arXiv 研究发现，样本中 96% 的 ChatGPT 记忆是系统单方面创建的。

微软 Build 2026 一口气发七款自研 MAI 模型，并联手梅奥诊所做医疗大模型
来源：Microsoft AI / EdTech Innovation Hub｜日期：2026-06-02
微软在 Build 大会上发布七款自研 MAI 模型，包括首个推理模型 MAI-Thinking-1（35B 激活参数 MoE、256K 上下文，AIME 2025 拿 97%、SWE-Bench Pro 53%）和编码模型 MAI-Code-1-Flash（仅 5B 参数、SWE-Bench Pro 51%，已默认进入 VS Code 与 GitHub Copilot）。CEO 苏莱曼称模型完全从零训练、不蒸馏他家模型；微软同时宣布与梅奥诊所共建医疗前沿模型，模型归梅奥所有、先在其院内部署，验证后经 Foundry 对外开放。

苹果 WWDC 承认自研失败：全新 Siri AI 改由谷歌 Gemini 驱动
来源：TechCrunch / MacRumors｜日期：2026-06-08
6 月 8 日 WWDC 上，苹果发布拖延两年的全新对话式助手「Siri AI」，并罕见地确认其底层用的是在苹果数据中心运行的定制版谷歌 Gemini 模型。据彭博社 Mark Gurman 报道，苹果每年约向谷歌支付 10 亿美元，使用约 1.2 万亿参数的定制版 Gemini（运行于搭载 Nvidia Blackwell B200 GPU 的 Google Cloud）。苹果同时推出 iOS 27、macOS 27 与对开发者免费、本地运行的 Foundation Models 框架。这对长期标榜垂直整合与隐私的苹果是个标志性转折。

MiniMax M3 兑现承诺：开源权重在 6 月中旬落地 Hugging Face
来源：MiniMax / VentureBeat｜日期：2026-06-01
MiniMax 于 6 月 1 日发布 M3，号称首个同时具备前沿编码、100 万 token 上下文与原生多模态的开源权重模型，并承诺 10 天内（约 6 月 11 日前）在 Hugging Face 与 GitHub 放出权重与技术报告。其自研稀疏注意力 MSA 让 100 万 token 下单 token 算力降至上代的 1/20。M3 报 SWE-Bench Pro 59.0%、BrowseComp 83.5，OpenRouter 促销价低至每百万 token 输入 0.3 美元、输出 1.2 美元——但权重落地前这些均为厂商自报数据，且 M3 目前尚未开源训练代码与推理算子，不能算「完全开源」。

xAI 一周连发多弹：Grok Voice、Imagine 1.5 上线，V9-Medium 完成训练
来源：Tech Times / Releasebot｜日期：2026-06-09
本周 xAI 节奏很快：6 月 4 日上线语音交互 Grok Voice 和图生视频 Grok Imagine 1.5 预览，6 月 5 日马斯克确认核心模型升级与 worktrees 支持。1.5 万亿参数的 Grok V9-Medium（约为当前生产模型 v8-small 的三倍）已完成训练、进入微调阶段，预计 6 月中旬发布；该模型用大量 Cursor 真实开发数据训练，主打编码能力。

开发者工具与 Agent 生态

GitHub Copilot 全面改用按 Token 计费，开发者炸锅
来源：GitHub Blog / TechCrunch｜日期：2026-06-01
6 月 1 日，GitHub Copilot 所有套餐正式切换为按 Token 用量计费——以「AI Credits」计价，1 credit = 0.01 美元，按输入/输出/缓存 token 量乘以各模型 API 费率结算，且取消了用尽额度后自动降级到低价模型的「兜底」机制。CPO Mario Rodriguez 称旧的「高级请求」模型「已不可持续」。有 Reddit 用户晒图称账单将从每月约 29 美元飙到近 750 美元，引发被称为「Tokenpocalypse」的争议；不过代码补全与 Next Edit Suggestions 仍免费，且部分开发者认为新模式比旧的请求配额更公平，舆论实为分化。

Cursor 3.7 上线 Design Mode：用点选、画框甚至语音指挥 Agent 改 UI
来源：Cursor｜日期：2026-06-05
6 月 4–5 日，Cursor 在浏览器与 canvas 中推出 Design Mode：用户可直接点选页面上多个元素，让 Agent 理解其代码、布局与视觉关系并据此修改，还能在 Agent 运行中途通过语音排队下一项改动。同时新增可视化「上下文浏览器」，把 token 消耗按系统提示、工具定义、规则、技能等拆解成可追问的交互报告。

Windsurf 正式更名 Devin Desktop，转型「Agent 指挥中心」
来源：Apidog｜日期：2026-06-03
6 月初，Cognition 把 Windsurf 编辑器更名为 Devin Desktop，并以一次 OTA 更新推送给老用户，套餐、设置、插件全部平移。新默认界面是「Agent Command Center」——一块看板，把本地与云端运行的所有 Agent 按「进行中/受阻/待审」排列。原 Cascade 转为 legacy，继任者 Devin Local 用 Rust 重写、token 效率提升约 30%，并支持通过 ACP 协议跑 Codex、Claude Agent 等外部 Agent。

Claude Code 密集更新：新增安全模式、fallback 模型与跨会话消息加固
来源：Releasebot｜日期：2026-06-09
本周 Claude Code 连续多次更新：新增 --safe-mode（禁用全部自定义配置以便排错）、/cd 命令（不破坏缓存切换工作目录）、最多三个按序尝试的 fallback 模型；并强化跨会话消息安全——经 SendMessage 中转的消息不再携带用户权限，auto 模式直接拦截。Opus 4.8 已成为默认模型并支持 dynamic workflows 编排大量后台子 Agent。

MCP 协议走向「生产级连接层」，6 月规范周聚焦无状态传输与服务发现
来源：Ted Tschopp / Anthropic｜日期：2026-06-06
Anthropic 联合创始人 David Soria Parra 在 AI Engineer Europe 透露，MCP 月下载量已突破 1.1 亿，OpenAI Agent SDK、谷歌 ADK、LangChain 等数千框架都把它作为依赖。即将到来的 6 月规范周重点是无状态传输（便于负载均衡下横向扩展）与「MCP Server Cards」服务发现（通过 .well-known URL 暴露能力元数据），并探索「MCP applications」与「skills over MCP」等新机制。

行业落地：医疗与产业

便携式视网膜相机 AI Optics Sentinel 获 FDA 510(k) 许可
来源：Modern Retina｜日期：2026-06-05
6 月 5 日，AI Optics 的便携式 Sentinel 视网膜相机获 FDA 510(k) 许可。公司正在此基础上开发 AI 视网膜筛查软件，目标是为糖尿病视网膜病变、青光眼、黄斑变性提供端到端检测方案，并与 NYU Langone Health 合作推进可及性，把高质量眼底成像带入更多基层医疗场景。

一周产业落地切片：法国初创用 AI 早筛眼疾，比亚迪进军人形机器人
来源：Medium（David Akpovi 周报）｜日期：2026-06-07
本周多起 AI 行业落地：法国初创 Zenkolab 用 AI 分析视网膜图像、早期发现眼疾，意在缩短诊断延迟、扩大缺乏眼科专家地区的筛查覆盖；中国车企比亚迪确认进军人形机器人，复用其在电池、传感器、软件与 AI 上的积累；Uber 联合 WeRide、AVOMO 在西班牙马德里地区推出该国首个商业 Robotaxi 服务。

中国 AI 动态

高考期间六大 AI 平台集体「上锁」，拍题答疑被暂停
来源：21 世纪经济报道 / 澎湃新闻｜日期：2026-06-07
2026 年全国高考报名人数达 1290 万、6 月 7 日开考。依据教育部等五部门《「人工智能+教育」行动计划》，豆包、通义千问、腾讯元宝、Kimi、DeepSeek、文心一言等平台在考试时段暂停拍题识图、试题解答、作文生成等功能。通义 App 显示「高考考试时段拍照讲题服务暂时关闭」，部分大学生反映连搭论文框架、整理文献也被一并拦截，被吐槽为「一刀切」。多家平台明确表示考前备考、考后复盘均可正常使用，这一限制也折射出中国 AI 教育正从「搜答案」转向「陪学习」的趋势。

监管、版权与政策

Bartz v. Anthropic 15 亿美元版权和解进入最后阶段，每部作品赔付约 3100 美元
来源：Authors Guild / Authors Alliance｜日期：2026-06-09
作为美国史上最大版权和解，Bartz 案的最终公平性听证于 5 月 14 日举行，法官 Araceli Martínez-Olguín 已将其交付裁决。班级代理律师披露每部作品赔付约 3100 美元、作品名单参与率达 92.77%；结算管理方定于 6 月 11 日测算分配方案，随后开始打款。该和解只针对盗版下载、不为 AI 训练是否合理使用立先例，而针对 OpenAI、Meta、苹果等的同类诉讼正沿用此「打盗版而非打训练」策略推进。

欧盟 AI 法案进入落地倒计时，6 月 1 日设立独立专家支持机制
来源：European Commission｜日期：2026-06-01
6 月 1 日，欧盟委员会宣布为 AI 法案执法引入独立专家支持。按 5 月 7 日达成的「AI 法案 Omnibus」政治协议，透明度义务（含 AI 生成内容水印）将于 8 月 2 日生效，存量生成式系统延至 12 月 2 日合规；高风险系统义务整体推迟至 2027 年 12 月与 2028 年 8 月。协议还新增对「换脸/脱衣」类非自愿亲密内容与 CSAM 的禁令，违者最高可罚 3500 万欧元或全球营业额 7%。

AI 安全、就业与社会影响

联合国大学报告：到 2030 年 AI 数据中心耗电将逼近日本全国，用水翻倍
来源：UN News / 联合国大学 UNU-INWEH｜日期：2026-06-03
6 月 3 日，联合国大学发布迄今最系统的 AI 环境足迹报告。预计到 2030 年全球数据中心年耗电达 945 太瓦时（约等于日本全国），是巴基斯坦、孟加拉、尼日利亚三国用电之和的近三倍；用水将达 9.3 万亿升，相当于撒哈拉以南非洲 13 亿人一年的基本生活用水；土地占用超 1.45 万平方公里。报告警告「低碳」不等于「低水低地」，并指出日常推理占总能耗的 80–90%，呼吁把 AI 纳入能源、水、土地综合规划。

就业信号分化：5 月 38,579 个裁员归因 AI，但「AI 致失业」证据仍有争议
来源：Open Data Science 周报 / Challenger, Gray & Christmas｜日期：2026-06-09
本周就业数据呈两极信号。据再就业公司 Challenger, Gray & Christmas 6 月 4 日报告，5 月全美宣布裁员 97,006 人（自 2020 年以来最高 5 月值），其中 38,579 人（约 40%）归因于 AI，连续第三个月成为首要原因；但 Apollo 首席经济学家 Torsten Sløk 撰文称看到「zero evidence of job losses because of AI」（援引 ADP 全美就业报告），DeepMind 的哈萨比斯亦称因 AI 裁员「目光短浅」。PwC《2025 全球 AI 就业晴雨表》（基于约十亿条招聘广告）此前给出的 AI 技能薪资溢价已从上年的 25% 翻倍至 56%。更清晰的图景是劳动力市场在「分化」：入门技术岗收缩，复合型岗位坚挺。

OpenAI 宣称「对话已死」，筹划 ChatGPT 史上最大改版为「超级应用」
来源：OpenTools / Financial Times｜日期：2026-06-06
据报道，OpenAI 正筹划自发布以来对 ChatGPT 最大的一次改版，要把它从聊天机器人变成融合 Codex、AI Agent、图像生成与第三方服务的「超级应用」。一位资深员工对《金融时报》直言「Chat is dead」，押注 AI 的未来不是对话而是自主行动。改版预计未来数周开始推出——这与本周 Codex 进入 ChatGPT 的动作一脉相承。

结语与下周看点

把本周拼起来看，前沿能力、商业模式与治理规则正在同时加速：Anthropic 用 Fable 5/Mythos 5 给出「释放能力、隔离风险」的样本，苹果用十亿美元向 Gemini「低头」承认大厂也难独自跑赢 AI，OpenAI 与微软则不约而同地把 Agent 从开发者桌面推向全公司白领与垂直行业。与此同时，成本与边界开始变得真实——GitHub Copilot 的「Token 化」让被资本长期补贴的 AI 第一次把账单摊到开发者面前，联合国报告把数据中心的水电土地代价量化到「国家级」，欧盟与法院则在水印、版权、合规上逐格收紧。中国这边，高考给 AI 划出清晰的使用边界，也照见教育行业从「答案竞争」转向「能力竞争」的深层变化。

下周最值得盯的，首先是 Gemini 3.5 Pro 能否在 6 月底前兑现「下个月」承诺、以及它的真实基准与定价；其次是 MiniMax M3 的开源权重是否如约在 6 月 11 日前落地、能否经得起第三方复现；再次是 xAI Grok V9-Medium 的正式发布与编码实测，以及 GitHub Copilot 计费风波是否会催生更多开发者向 Claude Code、Cursor 等迁移。规则层面，Bartz 案 6 月 11 日的分配测算与欧盟 8 月透明度大限，都将继续影响整个行业的成本结构。我们下周见。