
核心摘要:
1、Anthropic 重磅发布Claude Fable 5与Mythos 5,Fable 5 成为首个面向公众的 Mythos 级模型,在几乎所有基准测试中达到 SOTA,定价仅为前代的一半;
2、谷歌推出Gemini 3.5 Live Translate,支持 70 余种语言实时语音翻译;
3、瑞幸咖啡上线 AI 开放平台,提供标准化 MCP Server 与点单全流程 Skill;
4、UC Berkeley 发布ALE智能体终极基准,覆盖 55 个行业 1500 项真实任务,顶尖组合通过率仅 25%;
5、腾讯混元开源多模态强化学习框架UniRL;
6、vLLM 推出 RL 训练后框架vime;
7、国家互联网应急中心发布预警,警惕恶意智能体技能包带来的越狱与挖矿风险。
一、模型发布与开源
1、Anthropic 发布 Claude Fable 5 与受限版 Mythos 5,全面领跑 SOTA
Anthropic正式发布两款同底层模型:
Claude Fable 5:首个面向公众开放的 Mythos 级模型,官方称其能力超越此前所有公开发布的模型,任务越长越复杂领先幅度越大。在软件工程、知识工作、视觉和科研等领域显著领先,内部蛋白质设计专家使用该模型将药物设计部分环节加速约 10 倍,14 个靶点中有 9 个产出候选药物设计。
Claude Mythos 5:与 Fable 5 共享底层,安全限制有所放宽,拥有全球最强网络安全能力,仅通过 Project Glasswing 面向少量网络防御者和基础设施提供商开放。安全机制:新增三级安全分类器(网络安全、生物化学、蒸馏),检测到相关请求时自动回退至 Claude Opus 4.8 处理,超过 95% 的会话不会触发回退。同时开设生物学受信访问计划,为少数研究人员移除生物化学限制。定价与可用性:两款模型均为输入 10 美元 / 百万 token、输出 50 美元 / 百万 token,不到前代 Mythos Preview 价格的一半。API 和按量企业版即日起可用;Pro/Max/Team 及按席企业版 6 月 9 日至 22 日免费包含 Fable 5,之后需消耗 usage credits。Anthropic 已为所有用户重置 5 小时和每周使用限额。
https://www.anthropic.com/news/claude-fable-5-mythos-5
系统卡:https://anthropic.com/claude-fable-5-mythos-5-system-card



2、谷歌发布 Gemini 3.5 Live Translate,支持 70 + 语言实时语音翻译
谷歌推出实时流式语音翻译模型Gemini 3.5 Live Translate,能够以连续流式处理方式实现语音到语音互译,自动检测并保留说话者语调,支持超过 70 种语言。生成的音频会添加不可察觉的 SynthID 水印。开发者可通过 Gemini Live API 和 Google AI Studio 使用公开预览版;消费端正逐步向 Google 翻译应用推送,Android 端新增 "聆听模式",Google Meet 面向部分企业客户开启私人预览。
https://blog.google/innovation-and-ai/models-and-research/gemini-models/gemini-live-3-5-translate/
API 文档:
https://ai.google.dev/gemini-api/docs/live-api/live-translate


3、智谱联合清华开源 SCAIL-2 端到端角色动画模型
智谱与清华大学团队开源SCAIL-2受控角色动画模型,采用端到端架构,通过直接拼接驱动视频的 latent 摆脱对骨架图或修复掩码的依赖。原生支持单 / 多角色动画、角色替换、长视频生成与 3D 姿态控制,具备动物驱动等零样本能力。提供 512p 与 704p 分辨率输出,采用 Apache 2.0 协议授权,支持 ComfyUI 工作流。
https://teal024.github.io/SCAIL-2/
GitHub:
https://github.com/zai-org/SCAIL-2
Hugging Face:
https://huggingface.co/zai-org/SCAIL-2

4、HiDream 发布 O1-Image-1.5 文生图模型,位列全球第三
HiDream 推出闭源文生图模型HiDream-O1-Image-1.5,支持最高 2K 分辨率生成。根据 Artificial Analysis 文生图排行榜,该模型位列第三,仅次于 OpenAI 的图像模型。基于 Unified Transformer 架构在单一 token 空间内编码,定价为每千张图像 80 美元,现已上线 HiHarness 和 Vivago 平台。
https://x.com/ArtificialAnlys/status/2064465242323869910


5、Cohere 开源 North Mini Code Agentic 编程模型
Cohere 正式发布其首个开源 Agentic 编程模型North MiniCode,采用 300 亿总参数、30 亿激活参数的 MoE 架构。官方数据显示,该模型在 Artificial Analysis 编程指数中获得 33.4 分,特定硬件环境下输出吞吐量最高可达 Devstral Small 2 的 2.8 倍。开发者可通过 Hugging Face 免费获取权重,或经由 Cohere API 和 OpenRouter 接入。
https://cohere.com/blog/north-mini-code
Hugging Face:
https://huggingface.co/CohereLabs/North-Mini-Code-1.0

二、开发生态与工具更新
1、Claude Code v2.1.170 发布,引入 Fable 5 与嵌套Subagent 支持
Anthropic 发布终端编程工具 Claude Code v2.1.170 版本,核心更新包括:
正式集成 Claude Fable 5 模型
新增嵌套 Subagent支持,允许 Agent 调用其他 Agent 优化上下文管理,初始嵌套深度上限为 5,用户可监控并指定使用的模型与思考权重
https://github.com/anthropics/claude-code/releases/tag/v2.1.170

2、OpenAI Responses API 网页搜索新增图片结果支持
OpenAI 宣布其 Responses API 的 Web search 功能已扩展支持图片搜索结果,开发者能够利用该功能构建展示产品、地点、视觉参考及来源链接的应用,提升多模态工作流的完整性。
https://x.com/OpenAIDevs/status/2064395155688616153
API 文档:
https://developers.openai.com/api/docs/guides/tools-web-search

3、OpenClaw 2026.6.5 发布,新增并行搜索与插件安全策略
OpenClaw 正式发布 2026.6.5 版本,核心更新:
新增Parallel并行网络搜索,提供零配置免费路径和付费 API 选项
引入security.installPolicy自定义安全策略,允许操作员通过运行本地命令并审查源代码来控制技能和插件安装,策略启用但不可用时默认拒绝安装
改进 Matrix 和 QQBot 使用体验,强化 Anthropic 及 MCP 会话恢复能力
版本号规则更改为 YYYY.M.PATCH 格式
https://x.com/openclaw/status/2064444553634144665
4、TRAE SOLO 升级为 TRAE Work,拓展至全场景办公
TRAE 宣布其产品 TRAE SOLO 正式升级为TRAE Work,品牌定位从专门服务开发者拓展至更广泛的日常工作场景。升级后包含处理日常任务的Work 模式和面向开发的Code 模式,支持 PC、移动端和 Web 三端跨设备使用。Work 模式支持用户自选模型,已于今年 5 月完成与飞书的打通,后续计划推出面向设计场景的 Design 模式。
https://mp.weixin.qq.com/s/x2vdeXecta3UL5zEZUx88w

三、产品应用落地
1、瑞幸咖啡上线 AI 开放平台,提供 MCP Server 与点单全流程 Skill
瑞幸咖啡推出官方 "瑞幸咖啡 AI 开放平台",面向 AI Agent、智能应用与业务协作场景提供标准化接入服务。平台集成了标准 MCP Server、CLI 命令行服务与 My Coffee Skill,允许用户通过自然语言指令自动串联并完成门店查询、商品选择、优惠匹配以及订单创建和支付。目前共开放 8 个 API 工具覆盖点单全流程,MCP 服务采用 Streamable HTTP 远程模式且登录状态可保留一个月,Skill 已适配 Cursor、Claude Code 等多款主流开发工具。

四、技术洞察与前沿研究
1、UC Berkeley 发布 ALE 智能体终极基准,顶尖组合通过率仅 25%
UC Berkeley RDI 团队与 300 多位行业专家合作,推出名为 **Agents' Last Exam (ALE)** 的开源评测基准,旨在衡量前沿模型在具有经济价值的真实长周期任务上的实际表现。该基准包含超过 1500 项源自真实项目的专业任务,覆盖基于美国职业分类标准的 55 个非物理实体行业,重点评测结合 GUI 与 CLI 的通用计算机使用 Agent。官方排行榜显示,当前表现最优的 Codex 搭配 gpt-5.5 模型通过率为 25.0%,整体 Agent 在最难评测级别中平均通过率仅为 2.6%。
GitHub:https://github.com/rdi-berkeley/agents-last-exam
预印本:https://arxiv.org/abs/2606.05405


2、腾讯混元开源 UniRL 多模态强化学习框架
腾讯混元团队正式发布UniRL强化学习基础设施,旨在为统一的多模态模型提供后训练支持。核心机制是将单一的强化学习后训练循环(生成、评分、计算优势、更新策略及同步权重)跨模型家族应用,使得模型和算法成为两个独立的可组合维度。支持扩散、自回归、提示词增强及统一模型四种训练模式,兼容 Stable Diffusion 3、FLUX.2-Klein、Qwen 系列及 HunyuanVideo 等多种主流模型。同步推出自研 DRPO 和 Flow-DPPO 两种算法。
GitHub:https://github.com/Tencent-Hunyuan/UniRL
预印本:https://arxiv.org/abs/2606.09821

3、vLLM 团队推出 vime 强化学习训练后框架
vLLM 团队宣布在 vLLM 生态中推出全新的 LLM 强化学习训练后框架vime,基于 Apache 2.0 协议开源。采用三阶段解耦设计,将 slime 的训练栈与 vLLM 的推理能力整合在统一架构中,官方称其在长时间运行中能保持稳定的训练与推理对齐。目前支持 GRPO 和 PPO 等算法以及 Qwen3 和 GLM-4.5 等模型,并在系统层面抽象了集群拓扑,以便同一 RL 流水线在不同硬件后端上复用。
GitHub:https://github.com/vllm-project/vime

五、行业动态与企业动作
1、CNCERT 发布安全警告:警惕恶意智能体技能包风险
国家互联网应急中心(CNCERT)近期发布安全公告,指出部分恶意智能体技能包正以 "大模型越狱" 或 "挖矿赚钱" 名义公开传播:
"godmode" 技能:通过内置攻击模块诱导模型突破安全限制,可能导致隐私泄露、账号被永久封禁及法律追责
"Bonero-Miner" 技能:诱导智能体下载外部程序进行匿名挖矿,可能致使用户被动卷入洗钱活动CNCERT 提醒广大用户加强技能包来源审查,切勿安装宣称可越狱的技能包;企业用户应建立准入白名单并在隔离网络中部署智能体。
https://mp.weixin.qq.com/s/J68BSgEGWbaHjrnU9melhQ

六、前瞻与市场传闻
今日暂无经权威信源核实的前瞻与市场传闻内容。
七、Claw 专题动态
1、Claude Code 嵌套 Subagent 功能大幅提升复杂任务处理能力
Claude Code v2.1.170 引入的嵌套 Subagent 支持,允许主 Agent 根据任务复杂度自动生成和调度多个子 Agent,每个子 Agent 拥有独立的上下文窗口和思考过程,有效解决了长任务中的上下文污染和注意力分散问题,为 Claw 技术处理超复杂多步骤任务提供了核心架构支持。
2、OpenClaw 并行搜索与安全策略完善企业级部署能力
OpenClaw 新增的 Parallel 并行搜索显著提升了信息获取效率,而自定义插件安装安全策略则解决了企业部署 Claw 时的核心安全顾虑,允许企业对第三方技能和插件进行严格的准入控制,为 Claw 技术在企业环境中的大规模商业化铺平了道路。
3、瑞幸 MCP Server 成为 Claw 生态首个标准化餐饮服务接口
瑞幸咖啡 AI 开放平台提供的标准化 MCP Server 和 My Coffee Skill,是 Claw 生态中首个来自消费行业的官方服务接口,实现了自然语言到线下服务的完整闭环,为其他传统行业接入 Claw 生态提供了可复制的范本。
4、ALE 基准揭示当前 Claw 技术的真实能力边界
UC Berkeley 发布的 ALE 基准通过 1500 项真实行业任务的严格评测,客观展示了当前顶尖 Claw 系统在处理复杂专业工作时仍存在巨大差距,为 Claw 技术的未来研发指明了方向,也帮助行业建立了合理的预期。
八、GitHub 热门开源项目
2026.06.10 全球 Trending AI 类
1、rdi-berkeley/agents-last-exam
星标:2.7k(今日 + 2.6k)
简介:UC Berkeley 发布的智能体终极评测基准,覆盖 55 个行业 1500 项真实长周期任务,顶尖组合通过率仅 25%
2、Tencent-Hunyuan/UniRL
星标:1.9k(今日 + 1.8k)
简介:腾讯混元开源多模态强化学习框架,统一支持扩散、LLM 与 VLM 的后训练,兼容多种主流模型
3、zai-org/SCAIL-2
星标:1.5k(今日 + 1.4k)
简介:智谱与清华联合开源的端到端角色动画模型,摆脱骨架图依赖,支持多角色交互与零样本动物驱动
4、vllm-project/vime
星标:1.2k(今日 + 1.1k)
简介:vLLM 团队推出的强化学习训练后框架,整合 slime 训练栈与 vLLM 推理能力,保持训练推理稳定对齐
5、anthropics/claude-code
星标:8.3k(今日 + 920)
简介:Anthropic 官方终端编程工具,v2.1.170 新增 Claude Fable 5 与嵌套 Subagent 支持


END
深圳市雪球易创科技有限公司(SnowEngine),是国内领先的多云管理服务商(MSP)与企业级 AI 解决方案提供商,深耕云计算与人工智能领域,致力于成为企业数字化转型最可信赖的长期伙伴。
我们可提供全维度企业数字化服务:
✅ 全栈云服务:多云统一纳管、无忧云迁移、架构升级与成本优化,适配微软、阿里、腾讯、谷歌等主流云平台;
✅ 企业级 AI 落地:一站式接入全球 300 + 顶尖 AI 模型,定制化 AI 解决方案、私有化部署与全生命周期运维;
✅ 安全合规保障:遵循等保 2.0、GDPR 等国际标准,全链路数据安全防护,适配金融、医药、政务等强监管行业;
✅ 全周期运维支持:7×24 小时技术响应,专属团队全程陪跑,保障企业业务稳定运行。


全球 300 + 顶尖 AI 模型一键接入!

📩 商务合作 & 资讯&订阅:后台回复「相关内容如:AI大模型/云服务」立即咨询
目前我们已服务全球 1000 + 企业客户,业务覆盖深圳、上海、北京、香港、新加坡、美国等全球核心区域,可为不同行业、不同规模的企业量身定制数字化与智能化转型方案。


夜雨聆风