AI 行业日报 | 2026 – 05 – 07

核心摘要:
1、Anthropic 与 SpaceX 达成重磅算力合作,获得 Colossus 1 数据中心超 300 兆瓦算力,全面上调 Claude Code 与 Opus API 速率限制;
2、OpenAI 联合英伟达、AMD、英特尔等巨头开源 MRC 新型网络协议,专为 AI 超算训练设计,可支撑 13.1 万张 GPU 集群稳定运行;
3、字节跳动豆包 Doubao-Seed-2.0-lite 完成重大升级,成为豆包首款全模态理解模型,物理医疗推理能力超越前代 Pro 版;
4、Zyphra 发布 ZAYA1-8B 开源 MoE 模型,全流程在 AMD MI300X 集群训练;
5、月之暗面被传即将完成 20 亿美元新一轮融资,投后估值突破 200 亿美元。
一、核心头条要闻
1、Anthropic 与 SpaceX 达成算力合作,获 300MW 专属算力,全面上调 Claude 使用限额
5 月 6 日,Anthropic 正式宣布与 SpaceX 达成深度算力合作,获得 SpaceX 旗下Colossus 1数据中心全部超过 300 兆瓦的算力资源(折合逾 22 万张 NVIDIA GPU),计划于本月内完成部署上线。
该数据中心原为 xAI 训练 Grok 模型的核心超算设施,随着 xAI 将训练重心转移至 Colossus 2,该算力资源整体租赁给 Anthropic,双方同时表示有兴趣合作开发数吉瓦级别的轨道 AI 算力。基于此项合作及近期其他算力交易,Anthropic 于当日生效全面上调 Claude 使用限额:
Pro、Max、Team 及企业席位方案的 Claude Code 五小时滚动速率限制直接翻倍; 彻底移除 Pro 与 Max 方案高峰时段的限额缩减规则; API 中 Opus 系列模型的速率限制获得大幅提升;
注:用户每周总体限额保持不变。


2、OpenAI 联合英伟达、AMD 等巨头开源 MRC 网络协议,专为大规模 AI 训练设计
OpenAI 联合 AMD、博通、英特尔、微软、英伟达,通过开放计算项目(OCP)正式开源新型网络协议MRC。
该协议专为大规模 AI 超算训练设计,核心通过将数据包喷洒至多路径并结合 SRv6 源路由,将传统 3-4 层交换机网络架构简化为 2 层,仅用 2 层交换机即可实现约 13.1 万张 GPU 的集群连接,大幅降低数据中心功耗与建设成本,同时可实现微秒级故障绕过,彻底解决同步训练时 GPU 数据传输的拥塞与故障问题。目前 MRC 协议已部署于 OpenAI 所有最大的 GB200 超算系统,用于前沿大模型训练。实测数据显示,即便出现频繁链路抖动甚至 4 台核心交换机重启,MRC 协议也未对训练任务产生可测量的性能影响。


3、字节跳动豆包 Doubao-Seed-2.0-lite 完成重大升级,成为豆包首款全模态理解模型
字节跳动火山引擎正式宣布,Doubao-Seed-2.0-lite模型完成重大版本升级,成为豆包大模型家族首款全模态理解模型,同步上线能力对齐的 Doubao-Seed-2.0-mini 版本,两款模型均已在火山方舟平台全面开放。核心能力升级包括: 原生支持视频、图像、音频、文本的统一理解与跨模态联合推理,Agent、Coding 与 GUI 能力全面增强,可闭环执行界面操作任务; 视觉理解能力实现跨越式提升,在物理、医疗等高阶学科推理上大幅超越前代 Doubao-Seed-2.0-pro 版本,细粒度感知与具身理解领域达到 SOTA 水平; 音频能力支持 19 个语种的精准语音转写与多语种互译,可深度捕捉情绪、环境声等细节信息,多项公开基准评测表现优于 Gemini-3.1-Pro; Doubao-Seed-2.0-mini 版本在保持全模态能力的同时,Token 效率较上代实现显著优化。


二、模型发布与开源
1、Zyphra 发布 ZAYA1-8B 开源 MoE 模型,全流程在 AMD 平台训练完成
Zyphra 正式发布并开源ZAYA1-8B MoE 语言模型,该模型总参数 8.4B、活跃参数仅 760M,完全在 AMD MI300X 集群上完成端到端训练,专注数学与代码推理能力优化。
模型引入 CCA 创新架构与多阶段后训练流程,配合 Markovian RSA 测试时计算法,在 APEX-shortlist 基准测试中超越 DeepSeek-V3.2 等大模型,在数学与编程推理任务上击败多款同量级甚至更大规模模型。该模型基于 Apache 2.0 协议完全开源,权重已上传至 Hugging Face,同步发布完整技术报告。

2、字节跳动豆包 Doubao-Seed-2.0 系列双版本全模态模型上线
本次升级同步推出两款全模态模型,形成完整的端云协同部署矩阵:Doubao-Seed-2.0-lite:主打全模态深度理解与复杂任务执行,适配云端企业级场景,在医疗、物理、具身智能等专业领域实现能力突破,支持 GUI 自动化操作与长程 Agent 任务;Doubao-Seed-2.0-mini:主打轻量化全模态部署,在保持全模态理解能力的基础上,大幅优化 Token 消耗与推理延迟,适配端侧设备与高频轻量化调用场景。两款模型均已在火山方舟平台开放 API 调用,支持企业级定制化微调与私有化部署。
三、开发生态与工具更新
1、Claude Managed Agents 上线 dreaming、outcomes 等多项核心功能
Anthropic 为 Claude Managed Agents 推出重磅升级,发布研究预览版dreaming功能、公开测试版outcomes功能,同时上线多 Agent 编排与 webhooks 能力。核心能力包括:dreaming 功能:可自动回顾 Agent 历史会话,提取可复用模式并优化记忆存储,实现 Agent 跨会话的自我迭代与持续改进;outcomes 功能:引入基于评分的自我校正机制,可根据预设目标自动指导 Agent 迭代优化输出结果,提升复杂任务的完成质量; 多 Agent 编排:支持将复杂任务自动拆解给多个子 Agent 并行处理,大幅提升长程任务的执行效率;webhooks 能力:支持 Agent 与外部系统的事件驱动联动,实现与企业现有工作流的深度集成。


2、Cursor 发布 3.3 版本,新增上下文占用明细与 CI 失败自动修复能力
Cursor IDE 正式发布 3.3 版本,为 Agent 开发带来两大核心能力升级: 新增上下文占用明细查看功能,开发者可直观查看 Agent 在 rules、skills、MCPs 及 subagents 等模块上的上下文占用明细,快速诊断性能问题并优化配置; 上线CI 失败自动修复能力,用户可设置始终在线的常驻 Agent 监控 GitHub 仓库,Agent 可自动调查 CI 失败的根因,并提交包含完整修复方案的 Pull Request,无需人工干预。

3、TRAE 宣布 SOLO 移动端、网页端、Windows 桌面端三端同步全量免费开放
字节跳动旗下 AI 编程产品 TRAE 正式宣布,SOLO 移动端、网页端、新增 Windows 版桌面端三端同步全量开放,中国区全部免费提供服务。
核心升级包括:
内置双模式智能体,移动端支持语音、文本、文件多模态输入,可连接云端与多台 PC 实现跨设备远程 Agent 任务调度; 单账号最多支持 10 台设备同时在线,多端任务状态实时同步; 三端均支持 AI 语音交互,自动生成结构化会议纪要; 桌面端与网页端新增飞书 CLI 接入能力与定时任务功能,实现企业级工作流自动化。


4、OpenClaw 连发 2026.5.5 与 2026.5.6 两个版本,修复全链路稳定性问题
OpenClaw 项目近期连发两个版本更新,完成核心稳定性优化:2026.5.5 版本:重点修复即时通讯频道、控制界面、插件更新及网关诊断的全链路稳定性问题,优化多平台适配能力; 2026.5.6 版本:紧急修复上一版本遗留的核心 Bug 与运行报错,进一步提升网关启动速度与插件加载成功率。


5、Warp 团队开源 oz-skills Agent 技能合集,覆盖 15 个核心工作流场景
Warp 团队正式将其内部用于加速工作流的 Agent Skills 合集oz-skills开源,基于 MIT 协议发布。
该合集包含 15 个可复用的标准化 Skills,覆盖 Git/GitHub 协作、数据分析、Web 质量审计、基础设施工程规范、通用生产力五大核心场景,所有 Skills 均为包含 YAML 前置元数据的 Markdown 文件,严格遵循 Agent Skills 规范,开发者可通过 npx 指令快速安装并集成到现有 Agent 工作流中。


四、产品应用落地
1、谷歌全面更新搜索 AI Mode 与 AI Overviews,五大功能优化原创内容曝光
Google 正式更新搜索中的AI Mode与AI Overviews功能,围绕原创内容曝光与用户体验推出五项核心优化: 在 AI 回答末尾提供延伸阅读建议,引导用户深度探索原创内容; 推出新闻订阅集成功能,高亮展示用户已订阅媒体的相关链接,早期测试显示该功能可显著提升原创内容点击率; 引入社区观点预览,提取公开讨论的核心引述并附完整上下文; 在 AI 回答正文要点旁直接嵌入相关原创内容链接,提升内容曝光效率; 桌面端新增链接悬停预览功能,鼠标悬停即可查看目标网站的核心信息,无需跳转页面。

2、Manus 升级 Projects 功能,新增任务自动学习与模式复用能力
Manus 为其 Projects 功能上线 **“从每个任务学习”** 核心能力,实现项目上下文的自动迭代优化。该能力可在每次任务对话后,自动识别任务中的可复用指令、文件、术语、工作流模式,经用户审查批准后,自动更新项目上下文。用户可通过提示词手动触发审查,也可将其嵌入重复性工作流实现自动更新,授权后的更新覆盖指令、文件、技能全维度,大幅减少重复配置成本,让项目上下文随团队使用持续优化。

五、技术洞察与前沿研究
1、Unsloth AI 联合 NVIDIA 完成大模型训练优化,B200 显卡上训练速度提升 25%
Unsloth AI 与 NVIDIA 联合发布技术优化方案,通过三项核心技术创新,在 NVIDIA B200 显卡上将大语言模型训练速度提升约 25%,彻底消除训练过程中的隐性开销、重复工作与串行等待: 打包序列元数据缓存:在 Qwen3-14B 模型训练任务中,实现批次整体吞吐量提升 14.3%; 双缓冲检查点重载:实现激活值拷贝与计算并行执行,在 B200 显卡上的 8B 至 32B 模型训练中,带来 4.6% 至 8.4% 的吞吐提升; MoE 路由优化:用一次性分组替代重复动态查询,实现 10% 至 15% 的整体训练提速。目前相关优化代码已在 GitHub 全量开源。


2、MRC 协议重构 AI 超算网络架构,万卡集群训练稳定性实现质的突破
OpenAI 开源的 MRC 协议,彻底重构了 AI 超算的底层网络架构,解决了长期以来大规模 GPU 集群训练的两大核心痛点:一是传统网络架构无法支撑十万级 GPU 的线性扩展,二是链路故障易导致训练任务中断、算力浪费。该协议通过 SRv6 源路由与多路径数据包喷洒技术,实现了三大技术突破:网络架构从 3-4 层简化为 2 层,大幅降低数据中心建设成本与功耗;支持单集群 13.1 万张 GPU 的稳定连接,实现训练性能的近线性扩展;微秒级故障绕过能力,即便核心交换机故障也不会影响训练任务稳定性。该技术的开源,将大幅降低国内万卡、十万卡级 AI 超算的建设门槛,推动大模型训练的基础设施革新。

3、AMD 平台大模型训练技术走向成熟,开源生态实现全面突破
Zyphra 发布的 ZAYA1-8B 模型,是首个全流程在 AMD MI300X 集群上训练完成的开源 MoE 模型,且在数学、代码基准测试中超越多款主流模型,标志着 AMD 平台的大模型训练生态已完全成熟。随着 NVIDIA GPU 供应持续紧张,AMD MI300/300X 系列 GPU 正在成为大模型训练的重要替代方案,配套的训练框架、推理优化工具、开源模型生态正在快速完善,未来将形成双寡头竞争的算力市场格局。
六、行业动态与企业动作
1、Fenris Creations 正式宣布独立,与 Google DeepMind 达成 AI Agent 研究合作
原《EVE Online》运营商 CCP Games 正式宣布更名为Fenris Creations,结束与 Pearl Abyss 长达八年的隶属关系,实现完全独立运营。
同时,Fenris Creations 与 Google DeepMind 达成长期研究合作,双方将把《EVE Online》这款拥有复杂经济、政治与玩家冲突体系的宇宙沙盒游戏,作为 AI Agent 研究的安全沙盒,在受控离线环境中探索 AI Agent 的记忆、持续学习与长期规划能力,初始研究不会与游戏实时服务器相连。

2、谷歌 Flow Music 与 Believe 达成合作,向艺人开放 AI 音乐生成工具
Google 宣布与全球音乐发行集团 Believe 达成合作,将旗下 AI 音乐工具Flow Music及底层 Lyria 3 Pro 模型,向 Believe 与 TuneCore 旗下的艺人、制作人、词曲作者全面开放。Google 明确声明,不主张对该工具生成的原创内容拥有任何所有权,同时将挑选部分艺人与制作人组成反馈小组,每周与 Google 团队沟通优化产品。

2、WorldClaw 联合特朗普家族 WLFI 平台推出 WorldRouter 模型路由平台
WorldClaw 与特朗普家族创立的加密项目 WLFI 联合推出 AI 模型路由平台WorldRouter,用户通过单一账户即可调用 300 余款 AI 模型,官方称使用成本比模型官方定价及 OpenRouter 低约 30%。平台后续还规划推出 WorldAgent 运行时与预装操作系统的本地 AI 硬件。据悉,WLFI 由特朗普的三个儿子联合创立,特朗普曾列为荣誉联合创始人,其家族可从平台销售中获得 75% 的净收益。目前平台已上线官网,但社区对其折扣真实性、代币锁仓机制与服务持久性存在诸多质疑。

七、前瞻与市场传闻
1、月之暗面传即将完成 20 亿美元新一轮融资,投后估值突破 200 亿美元
据《晚点 LatePost》消息,Kimi 所属的月之暗面即将完成新一轮 20 亿美元融资,投后估值突破 200 亿美元。该轮融资由美团龙珠领投,中国移动、CPE 源峰资本等机构参投,其中美团龙珠单家出资超 2 亿美元。据美团龙珠合伙人王新宇透露,在 K2.5 模型更新后,Kimi 的年化收入(ARR)于 2026 年 3 月突破 1 亿美元,4 月进一步增长至超 2 亿美元,实现了用户规模与商业化的双重高速增长。截至目前,月之暗面官方尚未对该融资消息作出正式回应。
八、Claw 专题动态
1、OpenClaw 连发两个版本完成稳定性修复,为长期支持版奠定基础
OpenClaw 2026.5.5 与 2026.5.6 版本的连续更新,重点解决了此前版本中多平台频道断连、插件更新失败、网关启动异常等核心稳定性问题,优化了插件加载流程与网关诊断能力,为即将推出的 StableClaw 长期支持版完成了核心底层修复。本次更新还优化了多模型路由与 MCP 协议适配能力,进一步完善了 Claw 生态的底层基础设施。
2、Claude Managed Agents 核心升级,为 Claw 生态提供自我迭代与多 Agent 编排能力
Claude 本次上线的 dreaming、outcomes、多 Agent 编排三大核心功能,为 Claw 生态带来了质的升级:dreaming 功能实现了 Claw Agent 的跨会话自我学习与持续优化,解决了长期以来 Claw Agent 无法自主迭代的痛点;outcomes 功能通过自我校正机制,大幅提升了 Claw Agent 复杂任务的完成质量;多 Agent 编排能力则实现了 Claw 生态的子任务并行拆解与协同执行,为企业级复杂 Claw 工作流提供了原生支持。
3、Warp 开源 oz-skills 技能合集,完善 Claw 生态标准化技能库
Warp 团队开源的 oz-skills 合集,严格遵循 Agent Skills 规范,覆盖了研发、运维、数据分析等高频工作流场景,为 Claw 生态提供了标准化、可复用的技能组件,开发者可直接集成到 Claw Agent 中,大幅降低企业级 Claw Agent 的开发门槛,推动 Claw 生态技能库的标准化与规模化发展。
4、Manus Projects 功能升级,适配 Claw 工作流的持续迭代需求
Manus 本次新增的任务自动学习与模式复用能力,可与 Claw 协议深度适配,实现 Claw Agent 工作流的自动优化与持续迭代。用户可将 Claw Agent 的执行任务与 Manus Projects 绑定,自动提取可复用的指令、技能与工作流模式,经审核后更新到项目上下文,让 Claw Agent 的能力随使用持续优化,完美适配企业级重复性工作流的自动化需求。
5、WorldClaw 推出 WorldRouter 平台,拓展 Claw 生态的多模型路由能力
WorldClaw 联合 WLFI 推出的 WorldRouter 平台,为 Claw 生态提供了统一的多模型路由入口,支持 300 余款 AI 模型的统一调用,大幅降低了 Claw Agent 的多模型适配成本。平台宣称的低成本定价,也将进一步降低 Claw 生态的使用门槛,推动 Claw Agent 的规模化落地。

九、GitHub 热门开源项目
(2026.05.07 全球 Trending AI 类)
1、Zyphra/ZAYA1-8B
星标数:4.6k(当日新增 3.2k) 项目简介:全流程在 AMD MI300X 集群训练的开源 MoE 模型,总参数 8.4B、活跃参数 760M,数学与代码推理能力超越同量级模型,Apache 2.0 协议完全开源,配套完整技术报告与推理代码。
2、warpdotdev/oz-skills
星标数:3.1k(当日新增 2.4k) 项目简介:Warp 团队官方开源的 Agent Skills 合集,包含 15 个标准化技能,覆盖 Git 协作、数据分析、Web 审计等五大场景,严格遵循 Agent Skills 规范,MIT 协议开源,一键安装集成。
3、openclaw/openclaw
星标数:44.7k(当日新增 1.5k) 项目简介:Claw 生态核心开源框架,2026.5.5/5.6 版本连发,修复多平台稳定性问题,优化插件加载与网关启动速度,支持多模型路由与 MCP 协议全量适配。
4、unsloth/unsloth
星标数:22.8k(当日新增 1.2k) 项目简介:大模型训练优化工具,联合 NVIDIA 推出三项核心优化,B200 显卡上训练速度提升 25%,支持主流开源模型的微调与全参数训练,大幅降低显存占用与训练时间。
5、manus-im/manus-core
星标数:8.3k(当日新增 0.9k) 项目简介:Manus Agent 核心开源框架,最新版本支持项目自动学习与模式复用,原生适配 Claw 协议,支持跨设备任务调度与工作流自动化,适配企业级私有化部署。

END
深圳市雪球易创科技有限公司(SnowEngine),是国内领先的多云管理服务商(MSP)与企业级 AI 解决方案提供商,深耕云计算与人工智能领域,致力于成为企业数字化转型最可信赖的长期伙伴。
我们可提供全维度企业数字化服务:
✅ 全栈云服务:多云统一纳管、无忧云迁移、架构升级与成本优化,适配微软、阿里、腾讯、谷歌等主流云平台;
✅ 企业级 AI 落地:一站式接入全球 300 + 顶尖 AI 模型,定制化 AI 解决方案、私有化部署与全生命周期运维;
✅ 安全合规保障:遵循等保 2.0、GDPR 等国际标准,全链路数据安全防护,适配金融、医药、政务等强监管行业;
✅ 全周期运维支持:7×24 小时技术响应,专属团队全程陪跑,保障企业业务稳定运行。


全球 300 + 顶尖 AI 模型一键接入!

📩 商务合作 & 资讯&订阅:后台回复「相关内容如:AI大模型/云服务」立即咨询
目前我们已服务全球 1000 + 企业客户,业务覆盖深圳、上海、北京、香港、新加坡、美国等全球核心区域,可为不同行业、不同规模的企业量身定制数字化与智能化转型方案。


夜雨聆风