AI 行业日报 | 2026 - 06

AI 行业日报 | 2026 - 06 - 05

核心摘要：

1、NVIDIA 正式发布并开源 550B 参数旗舰模型 Nemotron 3 Ultra，采用 LatentMoE 混合架构，专为长周期 Agent 编排设计；

2、OpenAI 推出 ChatGPT 全新记忆架构 "Dreaming"，后台自动提炼用户偏好；

3、Anthropic 发布重磅报告称 AI 递归自我改进或比预期更快，Claude 已编写自身 80% 代码；

4、字节跳动开源 Bernini 统一视频生成与编辑框架，能力达闭源商业模型第一梯队；

5、李飞飞团队发文厘清世界模型定义，划分为渲染器、仿真器、规划器三大类；

6、VoidZero 正式加入 Cloudflare，Vite 等核心项目维持开源。

一、模型发布与开源

1、NVIDIA 正式发布并开源 Nemotron 3 Ultra 550B 模型

　　NVIDIA 发布最新旗舰开源大模型Nemotron 3 Ultra，总参数量 550B，激活参数 55B，采用结合 Mamba-2、MoE 与 Attention 层的LatentMoE 混合架构，支持最高 1M token 上下文长度，专为复杂 Agent 系统的前沿推理和编排构建。引入多教师在线策略蒸馏（MOPD）技术提升跨领域推理效率，使用 NVFP4 精度优化计算效率。官方数据显示，该模型在 SWE-bench 和 Terminal-bench 等测试中 token 消耗最多节省 30%，在 Blackwell 架构上实现 5 倍吞吐量提升，取得美国开源权重 AI 智能指数最高分。模型采用 OpenMDW-1.1 许可证开源，Hermes Agent 和 OpenCode 等平台已提供限时免费调用。

官方博客：https://developer.nvidia.com/blog/nvidia-nemotron-3-ultra-powers-faster-more-efficient-reasoning-for-long-running-agents/技术报告：https://research.nvidia.com/labs/nemotron/files/NVIDIA-Nemotron-3-Ultra-Technical-Report.pdfHugging Face：https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16

2、字节跳动开源 Bernini 统一视频生成与编辑框架

　　字节跳动开源统一视频生成与编辑框架Bernini的推理代码及渲染器模型权重Bernini-R，并同步放出相关论文。该框架集成基于 MLLM 的语义规划器和基于 DiT 的渲染器，支持文生图、文生视频、多种视频编辑（含运动修改）、参考图引导编辑及内容插入等多种任务。官方称其视频编辑能力在内部盲测中达到领先闭源商业模型的第一梯队。模型权重采用 Apache 2.0 协议发布，推荐使用打包了 Wan2.2 基础组件的 Diffusers 格式，建议在 Hopper 架构 GPU 上运行以获得最佳性能。

GitHub：https://github.com/bytedance/Bernini官网：https://bernini-ai.github.io/Hugging Face：https://huggingface.co/ByteDance/Bernini-R论文：https://arxiv.org/abs/2605.22344

3、Boson AI 发布 Higgs Audio v3 TTS 模型，支持百种语言零样本克隆

　Boson AI 发布Higgs Audio v3 TTS 模型，专为 Voice Agent 实时对话场景设计。支持 100 种语言的零样本声音克隆，允许开发者通过内联标签实时控制情绪、语速及咳嗽或笑声等音效。官方基准数据显示，其在多语种测试集上的错字率降至个位数，在多款同类模型对比中取得最优表现。模型权重已基于非商用许可证在 Hugging Face 开放，同时提供 Boson API 服务。

官方博客：https://www.boson.ai/blog/higgs-audio-v3-ttsHugging Face：https://huggingface.co/bosonai/higgs-audio-v3-tts-4b

4、Google Magenta 发布实时音乐生成模型 Magenta

　RealTime 2Google Magenta 团队推出专为交互式音乐创作设计的实时生成模型 **Magenta RealTime 2 (MRT2)** 及其底层 C++ 推理引擎。包含 24 亿参数的基础版和 2.3 亿参数的小配置版，能够响应 MIDI 输入、音频示例和文本提示，实现连续的低延迟音频流生成。相较于上一代版本，控制延迟从约 3 秒大幅缩减至约 200 毫秒，通过基于 MLX 框架的 C++ 引擎实现了在 Apple Silicon 芯片上的本地化运行。基础版实时生成需 M3 Pro 或 M2 Max 及以上配置，小模型可支持几乎所有 Apple Silicon Mac 设备。

官方发布：https://magenta.withgoogle.com/magenta-realtime-2Hugging Face：https://huggingface.co/google/magenta-realtime-2GitHub：https://github.com/magenta/magenta-realtime

5、NVIDIA 发布 Nemotron 3.5 Content Safety 模型与配套数据集

　NVIDIA 发布Nemotron 3.5 Content Safety模型及配套的多模态安全数据集。该模型基于 Google Gemma 3 4B IT 架构微调，能在单一上下文窗口内结合用户提示词、图像及助手回复进行统一的安全审查。新增自然语言自定义策略执行及可输出逐步推理痕迹的 THINK Mode。模型及数据集已基于 NVIDIA Open Model License 在 Hugging Face 开放，并提供 NVIDIA NIM 及多种第三方平台部署选项。

官方博客：https://huggingface.co/blog/nvidia/nemotron-3-5-content-safetyHugging Face：https://huggingface.co/nvidia/Nemotron-3.5-Content-Safety

6、香港生成式人工智能研发中心推出 HKGAI V3 大模型

　　香港生成式人工智能研发中心正式发布HKGAI V3大模型。相较于去年推出的 V1 版本，V3 已升级具备智能体能力，以本地数据训练为基础，支持处理两文三语，能够深刻掌握香港独有的语境与文化，灵活处理多元化的本地应用场景。香港特区政府官员在发布会上表示将成立相关委员会以完善 AI 生态圈，HKGAI 后续也将发布 AI 生态合作机制，推动该模型在 "港文通" 等垂直场景的落地。

官方公告：https://www.info.gov.hk/gia/general/202606/03/P2026060300659.htm

二、开发生态与工具更新

1、OpenAI 为 Codex 推出 iOS 测试插件并修复 Token 计数 Bug

　OpenAI Developers 正式发布 Codex 的Build iOS Apps插件，支持在内置浏览器中直接查看、测试 iOS 应用及进行 SwiftUI 热重载。据开发者解析，该功能通过串流真实 iOS 模拟器画面并读取原生 Accessibility 信息来实现视觉与交互操作。同日，OpenAI 员工 Tibo 证实团队正在修复一个导致不到 15% 的 Pro 和 Plus 账户 Token 被少统计的 Bug。

官方公告：https://x.com/OpenAIDevs/status/2062599291479478275Bug 修复进展：https://x.com/thsottiaux/status/2062648326332539015

2、Claude Code 将动态工作流触发词改为 "ultracode"

　　为解决原触发词易被误触的问题，ClaudeDevs 宣布将 Claude Code 研究预览版中动态工作流功能的显式触发词从 "workflow" 更改为 **"ultracode"**。该功能允许 Claude 即时编写编排脚本，并并行启动大量协调的子 Agent 来处理复杂任务。

官方公告：https://x.com/ClaudeDevs/status/2062257177788858398

3、Antigravity 向所有付费用户开放 /teamwork-preview 多 Agent 协作功能

Google Antigravity 官方宣布，现已将/teamwork-preview命令的研究预览从原先仅限每月 200 美元的 Google AI Ultra 计划扩展至所有付费计划。该功能可在 Antigravity 2.0 客户端中调用，利用多个分工明确的子 Agent 组成异步团队并行工作。官方团队曾使用它通过单条提示成功从零构建了可运行 Doom 的操作系统，并复现了 AlphaZero 的轻量可玩版本。官方强烈建议使用 Gemini 3.5 Flash 模型以控制成本，并警告单次任务可能迅速用尽每周令牌额度。

官方公告：https://x.com/_mohansolo/status/2062624694323515543

4、GitHub Copilot 上线百万级上下文与可配置推理级别

　　GitHub 官方宣布为 GitHub Copilot 推出100 万 token 上下文窗口及可配置推理级别两项新能力，旨在帮助开发者处理更复杂的跨文件项目与架构调试难题。目前已正式在 VS Code、Copilot CLI 和 GitHub Copilot App 中上线。官方提醒，提升上下文窗口大小或推理级别会增加每次交互的 AI 额度消耗，建议仅在处理复杂任务时按需启用。

官方公告：https://github.blog/changelog/2026-06-04-larger-context-windows-and-configurable-reasoning-levels-for-github-copilot/

5、HeyGen 推出视频与动态图形规范 frame.md

　HeyGen 官方宣布推出名为frame.md的全新规范文件，主要服务于视频与动态图形设计领域。该规范的核心作用是指导 Agent 按照特定规范生成保持品牌一致性的视频，解决过去 Agent 在处理视频时常将其错误转换回网页或幻灯片的问题。用户只需上传现有的 design.md 文件，即可将其转换为 frame.md 格式。

官方公告：https://x.com/HeyGen/status/2062296287710708169

6、OpenAI 在 Responses 与 Completions API 中内建审核分数返回

　　OpenAI 近日通过官方开发者账号宣布，其 Responses API 和 Completions API 现已内建审核分数返回能力。开发者在调用生成接口时，只需在请求中加入moderation对象即可同时获得输入与输出内容的安全评分，无需再单独请求审核端点。返回的结果包含是否标记为有害、具体类别及置信度分数，可用于日志记录、内容路由、人工审核或直接拦截。

官方公告：https://x.com/OpenAIDevs/status/2062619558440267801官方文档：https://developers.openai.com/api/docs/guides/moderation

三、产品应用落地

1、NotebookLM 推出 Source Attribution 来源归因功能

NotebookLM 官方宣布正式上线Source Attribution功能。该功能向用户公开了生成特定产物的确切公式，其中包含所使用的提示词与具体的资料来源。若用户需要对结果进行修改，可直接点击提供的 Iterate 选项进行自定义迭代。

官方公告：https://x.com/NotebookLM/status/2062653124326863077

2、LM Studio 推出 iOS 移动应用 Locally，支持远程调用本地大模型

　LM Studio 官方宣布，此前收购的 Locally 应用现已成为其官方移动端应用，并正式为 iPhone 和 iPad 推出LM Link功能。该功能允许用户通过端到端加密的安全连接，在移动设备上远程访问并运行部署在家庭或工作电脑上的本地大模型，且所有聊天记录均保存在本地设备。用户目前可在 App Store 下载 Locally 应用并与运行中的 LM Studio 桌面端配对使用，该移动应用及相关功能目前仅限于 iOS 平台。

官方博客：https://lmstudio.ai/blog/locally-lm-link下载地址：https://lmstudio.ai/download

四、技术洞察与前沿研究

1、Anthropic 详解基于 Claude 的自助式数据分析架构，准确率达 95%

　Anthropic 官方发文详述了其内部利用 Claude 实现自助式商业分析自动化的 Agentic 数据栈。该架构通过四个层级来解决概念歧义、数据陈旧和检索失败三大问题，目前已将 95% 的分析查询自动化，总体准确率约达 95%。该架构要求语义层定义必须由人类主导，并将 Skills 文件与模型代码同库维护以实现自动化同步与验证。

官方博客：https://claude.com/blog/how-anthropic-enables-self-service-data-analytics-with-claude

2、李飞飞团队发文厘清世界模型定义，划分为三大功能类别

　　李飞飞及 World Labs 团队发文，基于强化学习的 POMDP 框架澄清 "世界模型" 这一被滥用的术语。团队将该技术划分为输出视觉像素的渲染器、输出物理环境状态的仿真器，以及输出动作指令的规划器三大功能类别。其中受关注度最低的仿真器被视为衔接渲染与规划的核心桥梁，其首款相关产品 Marble 已实现同时输出视觉与物理网格数据。文章指出，由于三类模型共享底层世界知识，其技术边界正不断消融，未来将融合为可根据需求灵活切换输出形式的大一统世界基础模型。

官方文章：https://drfeifei.substack.com/p/a-functional-taxonomy-of-world-models

3、Guide Labs 发布 Clarity：全球首个内建可解释性 AI 平台

　Guide Labs 正式发布Clarity平台，由其 Steerling 8B 模型驱动，据称是首个将可解释性内建于训练过程的 AI 系统，旨在解决现有模型黑箱、无法追溯输出与训练数据关联的问题。Clarity 提供三大核心功能：一是概念解释，展示模型生成文本时所依据的人类可理解概念；二是训练数据归因，可链接到训练集中最相似的语料片段；三是概念操控，用户无需修改提示词，仅需通过放大或抑制特定概念即可实时改变模型回答。目前 Clarity 仍处于仅限邀请的研究预览阶段，Guide Labs 正与特定领域企业合作开发定制化可解释 AI 方案。

官方发布：https://www.guidelabs.ai/post/meet-clarity/平台地址：https://platform.guidelabs.ai/

4、Arena.ai 推出 Agent Mode 及真实任务评估排行榜

　Arena.ai 宣布上线Agent Mode，将原有的单一聊天升级为可自主规划并执行复杂任务的多步工作流。该模式为模型配备了网页搜索、bash 沙盒及文件系统等工具，使其能独立完成建站、研究及代码调试等任务，官方统计其中编码任务占比达 29%。同步推出的Agent Arena排行榜基于超过 30 万个真实用户任务信号进行排名，目前 OpenAI 的 GPT-5.5 (High) 位列第一。

官方博客：https://arena.ai/blog/agent-mode/排行榜：https://arena.ai/leaderboard/agent

五、行业动态与企业动作

1、VoidZero 正式加入 Cloudflare，核心开源项目维持 MIT 许可

　VoidZero 官方宣布加入 Cloudflare，旗下 Vite、Vitest、Rolldown、Oxc 和 Vite + 等核心项目将继续保持开源并遵循 MIT 许可证。Evan 及 VoidZero 团队将继续领导这些项目的开发，Cloudflare 承诺支持其开源使命。由于开源工具商业化面临挑战，且双方此前在 Vite 技术及部署平台上已有协同，此次加入旨在让团队专注工具研发，并共同应对 AI Agent 带来的开发范式变化。

VoidZero 公告：https://voidzero.dev/posts/voidzero-cloudflareCloudflare 公告：https://blog.cloudflare.com/voidzero-joins-cloudflare

2、Google 宣布向犹他州所有 K-12 学校免费提供 Gemini for Education

　Google 宣布与犹他州教育局 (USBE) 建立合作，计划从 2026-2027 学年起，为犹他州所有 K-12 学校提供Gemini for Education。此举将向全州超过 70.8 万名师生免费提供具备企业级安全保护的 AI 工具、专业培训以及 Google Career Certificates。在实际应用中，Gemini 可辅助教师生成定制化教学材料并总结课堂讨论，同时帮助学生探索复杂概念并获得个性化解释。官方承诺相关对话数据不会被用于训练 AI 模型。

官方公告：https://blog.google/products-and-platforms/products/education/utah-state-education-partnership/

六、前瞻与市场传闻

1、TRAE 即将上线四档付费 "速通" 权益，最高 1399 元 / 月

　　TRAE 官方宣布即将推出全新的付费 "速通" 权益体系，包含速通 Pro、速通 Pro+、速通 Ultra 和优速通 Express 四档。该增值服务旨在提升用户在高峰时段的对话响应速度，支持按月计费，购买后权益与账号绑定，可在 TRAE IDE 及多个版本的 TRAE SOLO 中通用。四档月费从 99 元至 1399 元不等，对应每月 100 次到不限次的速通次数，以及 10 个或 20 个云端任务并行数量上限，部分高档位还提供 SOTA 模型优先体验。现有免费版核心功能不受影响，原 "优速通" 用户权益将自动平移至新版 Express 档位。

官方预告：https://docs.trae.cn/ide/coming-soon

2、消息称 Anthropic 即将发布 Mythos 级别新模型代号

　　Oceanus据多个社交平台消息人士透露，Anthropic 正在筹备发布代号为Oceanus的 Mythos 级新模型，其内部检查点被标识为claude-oceanus-v1-p。据称该模型的性能将超越现有的 Mythos Preview 版本，且已有红队测试员获得了访问权限。不过消息指出，由于有人疑似通过 API 代理转售访问权限，相关的红队测试已被暂停。

相关来源：https://x.com/chetaslua/status/2062565987103502520

七、Claw 专题动态

1、NVIDIA Nemotron 3 Ultra 成为长周期 Claw 编排最强开源底座

　Nemotron 3 Ultra 专为复杂 Agent 系统的前沿推理和编排构建，1M 上下文长度与 LatentMoE 架构使其在处理多步骤、长周期 Claw 任务时表现优异，token 消耗降低 30% 的特性大幅提升了 Claw 应用的运行效率与成本效益，成为目前开源领域最强大的 Claw 编排模型。

2、Claude Code ultracode 触发词优化多 Claw 协作体验

　　将动态工作流触发词改为更精准的 "ultracode"，有效减少了误触概率，同时该功能允许 Claude 自动生成和协调多个子 Claw Agent，通过隔离上下文与工作树解决了长任务中的代理懒惰、目标漂移等问题，显著提升了复杂高价值 Claw 任务的完成质量。

3、Antigravity /teamwork-preview 实现百级 Claw 并行协作

　　向所有付费用户开放的多 Agent 团队协作功能，可调度多达上百个分工明确的子 Claw 并行工作，官方已验证其能够完成从零构建操作系统、复现 AlphaZero 等超复杂任务，为大规模 Claw 协同开发提供了强大的平台支持。

4、GitHub Copilot 百万上下文赋能 Claw 全项目开发

　GitHub Copilot 上线的 100 万 token 上下文窗口，使开发者能够在 Claw 开发过程中一次性加载整个项目的代码库，实现跨文件的架构理解与调试，可配置推理级别则允许根据任务复杂度灵活平衡性能与成本，大幅提升了 Claw 开发的效率与体验。

5、Arena.ai Agent 排行榜建立 Claw 能力评估标准

　　基于 30 万个真实用户任务信号的 Agent Arena 排行榜，为不同模型的 Claw 能力提供了客观、量化的评估标准，能够帮助开发者选择最适合特定场景的 Claw 模型底座，推动 Claw 生态的健康发展与技术迭代。

八、GitHub 热门开源项目

2026.06.05 全球 Trending AI 类

1、bytedance/Bernini

　　星标：3.7k（今日 + 3.2k）　　简介：字节跳动开源统一视频生成与编辑框架，支持文生视频、运动修改等多种任务，能力达闭源商业模型第一梯队，Apache 2.0 协议

地址：https://github.com/bytedance/Bernini

2、magenta/magenta-realtime

　　星标：2.1k（今日 + 1.8k）　　简介：Google Magenta 实时音乐生成模型，200 毫秒低延迟，支持 Apple Silicon 本地运行，提供 24 亿和 2.3 亿两种参数版本

地址：https://github.com/magenta/magenta-realtime

3、nvidia/Nemotron-3-Ultra

　　星标：4.5k（今日 + 3.9k）　　简介：NVIDIA 旗舰开源大模型，550B 总参数 / 55B 激活参数，LatentMoE 架构，1M 上下文，专为长周期 Agent 编排设计

地址：https://huggingface.co/nvidia/NVIDIA-Nemotron-3-Ultra-550B-A55B-BF16

4、vitejs/vite

　　星标：72.3k（今日 + 1.2k）　　简介：下一代前端开发与构建工具，VoidZero 加入 Cloudflare 后将继续保持 MIT 开源，由原团队主导开发

地址：https://github.com/vitejs/vite

5、google-deepmind/science-skills

　　星标：3.2k（今日 + 980）　　简介：Google DeepMind 开源科研 Agent 工具包，集成 30 + 主流科学数据库与模型，加速文献综合、数据分析等科研任务

地址：https://github.com/google-deepmind/science-skills

提示：本报为 AI 辅助创作，存在内容错漏、信息幻觉等风险，仅供参考不构成任何决策依据，请以权威信源为准，错漏欢迎留言指正。

加入社群，畅聊AI

END

深圳市雪球易创科技有限公司（SnowEngine），是国内领先的多云管理服务商（MSP）与企业级 AI 解决方案提供商，深耕云计算与人工智能领域，致力于成为企业数字化转型最可信赖的长期伙伴。

我们可提供全维度企业数字化服务：

✅ 全栈云服务：多云统一纳管、无忧云迁移、架构升级与成本优化，适配微软、阿里、腾讯、谷歌等主流云平台；

✅ 企业级 AI 落地：一站式接入全球 300 + 顶尖 AI 模型，定制化 AI 解决方案、私有化部署与全生命周期运维；

✅ 安全合规保障：遵循等保 2.0、GDPR 等国际标准，全链路数据安全防护，适配金融、医药、政务等强监管行业；

✅ 全周期运维支持：7×24 小时技术响应，专属团队全程陪跑，保障企业业务稳定运行。

全球 300 + 顶尖 AI 模型一键接入！

📩 商务合作 & 资讯&订阅：后台回复「相关内容如：AI大模型/云服务」立即咨询

目前我们已服务全球 1000 + 企业客户，业务覆盖深圳、上海、北京、香港、新加坡、美国等全球核心区域，可为不同行业、不同规模的企业量身定制数字化与智能化转型方案。