这一周,AI 行业的主线是「前沿能力加速落地、规则与成本同时收紧」。Anthropic 把此前只对网络安全机构开放的 Mythos 级模型首次面向公众放出(Claude Fable 5),苹果在 WWDC 上承认自研失败、把全新 Siri 押注在谷歌 Gem)ini 上,OpenAI 把 Codex 推向全公司白领、并给免费用户上线「会做梦」的记忆系统。与此同时,Gemini 3.5 Pro 仍在「跳票」边缘,xAI、MiniMax、微软的新模型轮番登场。规则层面,联合国发布迄今最系统的 AI 环境足迹报告,GitHub Copilot 改用按 Token 计费引爆开发者怒火。
大模型与重磅产品发布
Anthropic 正式公开 Mythos 级模型:Claude Fable 5 与 Mythos 5 同时登场
来源:Pasquale Pillitteri / Yahoo Finance|日期:2026-06-09
6 月 9 日,Anthropic 正式发布 Claude Fable 5(带安全护栏的公开版)与 Claude Mythos 5(移除部分限制、仅经 Project Glasswing 向网络安全专业人士开放)。Fable 5 在 SWE-Bench Pro 上拿下 80.3%(Opus 4.8 为 69.2%、GPT-5.5 为 58.6%),定价为每百万 token 输入 10 美元、输出 50 美元,恰为 Opus 的两倍;涉及网络安全和生物的高风险请求会自动改路由到 Opus 4.8,触发率低于 5%。Anthropic 称 Stripe 用它把一次涉及 5000 万行代码的迁移从数月压缩到数天。
Gemini 3.5 Pro 本周仍未发布,谷歌的「下个月」承诺逼近月底
来源:Tech Times|日期:2026-06-06
皮查伊在 5 月 19 日 I/O 上说「再给我们一个月」,但截至 6 月初 Gemini 3.5 Pro 仍只在 Vertex 内部预览,未正式上线。官方规格指向 200 万 token 上下文窗口与 Deep Think 推理模式,预期定价约为 3.5 Flash 的十倍(约每百万 token 输入 15 美元、输出 60 美元)。已上线的 3.5 Flash 跑出 55 分的 Intelligence Index、284 tokens/秒的速度,本周成为业界推断 Pro 性能的主要参照。
OpenAI 把 Codex 推向全公司白领:上线 Sites、Annotations 与六大行业插件
来源:OpenAI / VentureBeat|日期:2026-06-02
6 月 2 日的「Intelligence at Work」发布会上,OpenAI 给 Codex 加了三件套:六个行业插件(覆盖销售、数据分析、创意、产品设计等,集成 62 个应用与 110 项技能)、可对文档/表格/幻灯片做局部精修的 Annotations,以及能把分析一键变成可分享内部网页应用的 Sites。Codex 周活已达 500 万,其中非开发者占约 20%,增速是开发者的三倍多;OpenAI 还预告未来几周把 Codex 能力直接搬进 ChatGPT。
ChatGPT 上线「会做梦」的记忆系统 Dreaming,免费用户首次可用
来源:OpenAI / Open Data Science|日期:2026-06-04
6 月 4 日,OpenAI 把记忆系统 Dreaming 向免费用户开放。它能随时间自动更新记忆——比如把「你 7 月要去新加坡」改写成「你 2026 年 7 月去过新加坡」,从而在时间敏感的问答上给出更贴合现状的回答。隐私研究者已提出担忧:一项 2026 年 2 月的 arXiv 研究发现,样本中 96% 的 ChatGPT 记忆是系统单方面创建的。
微软 Build 2026 一口气发七款自研 MAI 模型,并联手梅奥诊所做医疗大模型
来源:Microsoft AI / EdTech Innovation Hub|日期:2026-06-02
微软在 Build 大会上发布七款自研 MAI 模型,包括首个推理模型 MAI-Thinking-1(35B 激活参数 MoE、256K 上下文,AIME 2025 拿 97%、SWE-Bench Pro 53%)和编码模型 MAI-Code-1-Flash(仅 5B 参数、SWE-Bench Pro 51%,已默认进入 VS Code 与 GitHub Copilot)。CEO 苏莱曼称模型完全从零训练、不蒸馏他家模型;微软同时宣布与梅奥诊所共建医疗前沿模型,模型归梅奥所有、先在其院内部署,验证后经 Foundry 对外开放。
苹果 WWDC 承认自研失败:全新 Siri AI 改由谷歌 Gemini 驱动
来源:TechCrunch / MacRumors|日期:2026-06-08
6 月 8 日 WWDC 上,苹果发布拖延两年的全新对话式助手「Siri AI」,并罕见地确认其底层用的是在苹果数据中心运行的定制版谷歌 Gemini 模型。据彭博社 Mark Gurman 报道,苹果每年约向谷歌支付 10 亿美元,使用约 1.2 万亿参数的定制版 Gemini(运行于搭载 Nvidia Blackwell B200 GPU 的 Google Cloud)。苹果同时推出 iOS 27、macOS 27 与对开发者免费、本地运行的 Foundation Models 框架。这对长期标榜垂直整合与隐私的苹果是个标志性转折。
MiniMax M3 兑现承诺:开源权重在 6 月中旬落地 Hugging Face
来源:MiniMax / VentureBeat|日期:2026-06-01
MiniMax 于 6 月 1 日发布 M3,号称首个同时具备前沿编码、100 万 token 上下文与原生多模态的开源权重模型,并承诺 10 天内(约 6 月 11 日前)在 Hugging Face 与 GitHub 放出权重与技术报告。其自研稀疏注意力 MSA 让 100 万 token 下单 token 算力降至上代的 1/20。M3 报 SWE-Bench Pro 59.0%、BrowseComp 83.5,OpenRouter 促销价低至每百万 token 输入 0.3 美元、输出 1.2 美元——但权重落地前这些均为厂商自报数据,且 M3 目前尚未开源训练代码与推理算子,不能算「完全开源」。
xAI 一周连发多弹:Grok Voice、Imagine 1.5 上线,V9-Medium 完成训练
来源:Tech Times / Releasebot|日期:2026-06-09
本周 xAI 节奏很快:6 月 4 日上线语音交互 Grok Voice 和图生视频 Grok Imagine 1.5 预览,6 月 5 日马斯克确认核心模型升级与 worktrees 支持。1.5 万亿参数的 Grok V9-Medium(约为当前生产模型 v8-small 的三倍)已完成训练、进入微调阶段,预计 6 月中旬发布;该模型用大量 Cursor 真实开发数据训练,主打编码能力。
开发者工具与 Agent 生态
GitHub Copilot 全面改用按 Token 计费,开发者炸锅
来源:GitHub Blog / TechCrunch|日期:2026-06-01
6 月 1 日,GitHub Copilot 所有套餐正式切换为按 Token 用量计费——以「AI Credits」计价,1 credit = 0.01 美元,按输入/输出/缓存 token 量乘以各模型 API 费率结算,且取消了用尽额度后自动降级到低价模型的「兜底」机制。CPO Mario Rodriguez 称旧的「高级请求」模型「已不可持续」。有 Reddit 用户晒图称账单将从每月约 29 美元飙到近 750 美元,引发被称为「Tokenpocalypse」的争议;不过代码补全与 Next Edit Suggestions 仍免费,且部分开发者认为新模式比旧的请求配额更公平,舆论实为分化。
Cursor 3.7 上线 Design Mode:用点选、画框甚至语音指挥 Agent 改 UI
来源:Cursor|日期:2026-06-05
6 月 4–5 日,Cursor 在浏览器与 canvas 中推出 Design Mode:用户可直接点选页面上多个元素,让 Agent 理解其代码、布局与视觉关系并据此修改,还能在 Agent 运行中途通过语音排队下一项改动。同时新增可视化「上下文浏览器」,把 token 消耗按系统提示、工具定义、规则、技能等拆解成可追问的交互报告。
Windsurf 正式更名 Devin Desktop,转型「Agent 指挥中心」
来源:Apidog|日期:2026-06-03
6 月初,Cognition 把 Windsurf 编辑器更名为 Devin Desktop,并以一次 OTA 更新推送给老用户,套餐、设置、插件全部平移。新默认界面是「Agent Command Center」——一块看板,把本地与云端运行的所有 Agent 按「进行中/受阻/待审」排列。原 Cascade 转为 legacy,继任者 Devin Local 用 Rust 重写、token 效率提升约 30%,并支持通过 ACP 协议跑 Codex、Claude Agent 等外部 Agent。
Claude Code 密集更新:新增安全模式、fallback 模型与跨会话消息加固
来源:Releasebot|日期:2026-06-09
本周 Claude Code 连续多次更新:新增 --safe-mode(禁用全部自定义配置以便排错)、/cd 命令(不破坏缓存切换工作目录)、最多三个按序尝试的 fallback 模型;并强化跨会话消息安全——经 SendMessage 中转的消息不再携带用户权限,auto 模式直接拦截。Opus 4.8 已成为默认模型并支持 dynamic workflows 编排大量后台子 Agent。
MCP 协议走向「生产级连接层」,6 月规范周聚焦无状态传输与服务发现
来源:Ted Tschopp / Anthropic|日期:2026-06-06
Anthropic 联合创始人 David Soria Parra 在 AI Engineer Europe 透露,MCP 月下载量已突破 1.1 亿,OpenAI Agent SDK、谷歌 ADK、LangChain 等数千框架都把它作为依赖。即将到来的 6 月规范周重点是无状态传输(便于负载均衡下横向扩展)与「MCP Server Cards」服务发现(通过 .well-known URL 暴露能力元数据),并探索「MCP applications」与「skills over MCP」等新机制。
行业落地:医疗与产业
便携式视网膜相机 AI Optics Sentinel 获 FDA 510(k) 许可
来源:Modern Retina|日期:2026-06-05
6 月 5 日,AI Optics 的便携式 Sentinel 视网膜相机获 FDA 510(k) 许可。公司正在此基础上开发 AI 视网膜筛查软件,目标是为糖尿病视网膜病变、青光眼、黄斑变性提供端到端检测方案,并与 NYU Langone Health 合作推进可及性,把高质量眼底成像带入更多基层医疗场景。
一周产业落地切片:法国初创用 AI 早筛眼疾,比亚迪进军人形机器人
来源:Medium(David Akpovi 周报)|日期:2026-06-07
本周多起 AI 行业落地:法国初创 Zenkolab 用 AI 分析视网膜图像、早期发现眼疾,意在缩短诊断延迟、扩大缺乏眼科专家地区的筛查覆盖;中国车企比亚迪确认进军人形机器人,复用其在电池、传感器、软件与 AI 上的积累;Uber 联合 WeRide、AVOMO 在西班牙马德里地区推出该国首个商业 Robotaxi 服务。
中国 AI 动态
高考期间六大 AI 平台集体「上锁」,拍题答疑被暂停
来源:21 世纪经济报道 / 澎湃新闻|日期:2026-06-07
2026 年全国高考报名人数达 1290 万、6 月 7 日开考。依据教育部等五部门《「人工智能+教育」行动计划》,豆包、通义千问、腾讯元宝、Kimi、DeepSeek、文心一言等平台在考试时段暂停拍题识图、试题解答、作文生成等功能。通义 App 显示「高考考试时段拍照讲题服务暂时关闭」,部分大学生反映连搭论文框架、整理文献也被一并拦截,被吐槽为「一刀切」。多家平台明确表示考前备考、考后复盘均可正常使用,这一限制也折射出中国 AI 教育正从「搜答案」转向「陪学习」的趋势。
监管、版权与政策
Bartz v. Anthropic 15 亿美元版权和解进入最后阶段,每部作品赔付约 3100 美元
来源:Authors Guild / Authors Alliance|日期:2026-06-09
作为美国史上最大版权和解,Bartz 案的最终公平性听证于 5 月 14 日举行,法官 Araceli Martínez-Olguín 已将其交付裁决。班级代理律师披露每部作品赔付约 3100 美元、作品名单参与率达 92.77%;结算管理方定于 6 月 11 日测算分配方案,随后开始打款。该和解只针对盗版下载、不为 AI 训练是否合理使用立先例,而针对 OpenAI、Meta、苹果等的同类诉讼正沿用此「打盗版而非打训练」策略推进。
欧盟 AI 法案进入落地倒计时,6 月 1 日设立独立专家支持机制
来源:European Commission|日期:2026-06-01
6 月 1 日,欧盟委员会宣布为 AI 法案执法引入独立专家支持。按 5 月 7 日达成的「AI 法案 Omnibus」政治协议,透明度义务(含 AI 生成内容水印)将于 8 月 2 日生效,存量生成式系统延至 12 月 2 日合规;高风险系统义务整体推迟至 2027 年 12 月与 2028 年 8 月。协议还新增对「换脸/脱衣」类非自愿亲密内容与 CSAM 的禁令,违者最高可罚 3500 万欧元或全球营业额 7%。
AI 安全、就业与社会影响
联合国大学报告:到 2030 年 AI 数据中心耗电将逼近日本全国,用水翻倍
来源:UN News / 联合国大学 UNU-INWEH|日期:2026-06-03
6 月 3 日,联合国大学发布迄今最系统的 AI 环境足迹报告。预计到 2030 年全球数据中心年耗电达 945 太瓦时(约等于日本全国),是巴基斯坦、孟加拉、尼日利亚三国用电之和的近三倍;用水将达 9.3 万亿升,相当于撒哈拉以南非洲 13 亿人一年的基本生活用水;土地占用超 1.45 万平方公里。报告警告「低碳」不等于「低水低地」,并指出日常推理占总能耗的 80–90%,呼吁把 AI 纳入能源、水、土地综合规划。
就业信号分化:5 月 38,579 个裁员归因 AI,但「AI 致失业」证据仍有争议
来源:Open Data Science 周报 / Challenger, Gray & Christmas|日期:2026-06-09
本周就业数据呈两极信号。据再就业公司 Challenger, Gray & Christmas 6 月 4 日报告,5 月全美宣布裁员 97,006 人(自 2020 年以来最高 5 月值),其中 38,579 人(约 40%)归因于 AI,连续第三个月成为首要原因;但 Apollo 首席经济学家 Torsten Sløk 撰文称看到「zero evidence of job losses because of AI」(援引 ADP 全美就业报告),DeepMind 的哈萨比斯亦称因 AI 裁员「目光短浅」。PwC《2025 全球 AI 就业晴雨表》(基于约十亿条招聘广告)此前给出的 AI 技能薪资溢价已从上年的 25% 翻倍至 56%。更清晰的图景是劳动力市场在「分化」:入门技术岗收缩,复合型岗位坚挺。
OpenAI 宣称「对话已死」,筹划 ChatGPT 史上最大改版为「超级应用」
来源:OpenTools / Financial Times|日期:2026-06-06
据报道,OpenAI 正筹划自发布以来对 ChatGPT 最大的一次改版,要把它从聊天机器人变成融合 Codex、AI Agent、图像生成与第三方服务的「超级应用」。一位资深员工对《金融时报》直言「Chat is dead」,押注 AI 的未来不是对话而是自主行动。改版预计未来数周开始推出——这与本周 Codex 进入 ChatGPT 的动作一脉相承。
结语与下周看点
把本周拼起来看,前沿能力、商业模式与治理规则正在同时加速:Anthropic 用 Fable 5/Mythos 5 给出「释放能力、隔离风险」的样本,苹果用十亿美元向 Gemini「低头」承认大厂也难独自跑赢 AI,OpenAI 与微软则不约而同地把 Agent 从开发者桌面推向全公司白领与垂直行业。与此同时,成本与边界开始变得真实——GitHub Copilot 的「Token 化」让被资本长期补贴的 AI 第一次把账单摊到开发者面前,联合国报告把数据中心的水电土地代价量化到「国家级」,欧盟与法院则在水印、版权、合规上逐格收紧。中国这边,高考给 AI 划出清晰的使用边界,也照见教育行业从「答案竞争」转向「能力竞争」的深层变化。
下周最值得盯的,首先是 Gemini 3.5 Pro 能否在 6 月底前兑现「下个月」承诺、以及它的真实基准与定价;其次是 MiniMax M3 的开源权重是否如约在 6 月 11 日前落地、能否经得起第三方复现;再次是 xAI Grok V9-Medium 的正式发布与编码实测,以及 GitHub Copilot 计费风波是否会催生更多开发者向 Claude Code、Cursor 等迁移。规则层面,Bartz 案 6 月 11 日的分配测算与欧盟 8 月透明度大限,都将继续影响整个行业的成本结构。我们下周见。
夜雨聆风