AI 行业日报 | 2026 - 06

AI 行业日报 | 2026 - 06 - 04

核心摘要：

1、豆包官宣计划推出专业版，明确辟谣 "降体验逼买会员" 传闻；

2、Google 发布 Gemma 4 12B 原生多模态模型，16GB 笔记本可本地运行；

3、Ideogram 4.0 开源登顶文生图开源榜；

4、OpenAI 升级生命科学模型 GPT-Rosalind 并发布前沿治理蓝图；

5、美国签署 AI 安全行政令，建立自愿审查框架不设强制许可；

6、Suno 完成 4 亿美元 D 轮融资估值 54 亿美元；

7、OpenClaw 发布重大更新，新增 Skill Workshop 与原生 Windows 支持；

　8、Kimi 推出本地 Agent 产品 Kimi Work Beta，支持 300 个子 Agent 并行协作。

一、模型发布与开源

1、豆包计划推出专业版，明确辟谣降体验推会员传闻

　　豆包官方宣布计划推出"豆包专业版"，以满足专业人群在软件开发、数据分析、专业设计等领域的高级生产力需求。官方强调，广大用户日常使用的搜索问答、写作生图及音视频对话等基础功能将继续保持免费且持续更新。目前专业版仍处于测试阶段，未来正式上线时将在一定额度内免费提供服务。同时官方对网传 "降低基础功能体验以推动用户购买会员" 的不实说法进行了明确辟谣。

官方公告：https://mp.weixin.qq.com/s/Be5hOIJUQC8ogxRy3epWLQ

2、Google 发布 Gemma 4 12B 原生多模态模型，Apache 2.0 开源

　Google DeepMind 正式发布Gemma 4 12B模型，填补了轻量级边缘模型与 26B MoE 模型之间的空白。该模型是 Gemma 家族首个支持原生音频输入的中型模型，采用无编码器的统一架构，直接将图像和原始音频信号输入 LLM 主干以降低处理延迟。官方称其基准性能接近 26B 模型且内存占用更低，仅需 16GB VRAM 即可在消费级笔记本上本地运行多模态 Agent。模型权重及各类适配工具现已开放下载，官方同步发布了用于构建 Agent 的官方技能库。

官方发布：https://blog.google/innovation-and-ai/technology/developers-tools/introducing-gemma-4-12b/开发者指南：https://developers.googleblog.com/gemma-4-12b-the-developer-guide/Hugging Face：https://huggingface.co/collections/google/gemma-4

3、Ideogram 发布开源图像模型 Ideogram 4.0，登顶开源文生图榜

　Ideogram 正式推出其首个开源权重的文生图基础模型Ideogram 4.0。该模型参数量为 9.3B，采用从头训练的完全单流 Diffusion Transformer 架构，引入了全新的结构化 JSON 提示词接口，原生支持最高 2048 分辨率的图像生成。它支持通过边界框坐标精确控制空间布局，以及通过十六进制颜色代码控制图像色彩方案。模型权重已在 Hugging Face 以非商用许可公开，用户也可通过官方托管 API 进行商用部署。根据第三方平台 Arena.ai 的最新评测，Ideogram 4.0 在文生图榜单中排名第八，是排名最高的开源模型。

官方博客：https://ideogram.ai/blog/ideogram-4.0/GitHub：https://github.com/ideogram-oss/ideogram4

4、Reve 发布 Reve 2.0 图像模型，宣称全球最佳 4K 图像生成

　　AI 图像实验室 Reve 正式推出Reve 2.0图像模型及配套编辑器。官方宣称这是世界上最好的 4K 图像模型，并称其在 Arena 文本转图像排行榜上位居第二，领先于 Nano Banana 2 和 GPT-Image-1.5。该产品引入了 "精确布局" 和 "图像即代码" 的新机制，允许用户对图像的每个区域和元素进行分割、标记和精确编辑。目前该模型已在官方网站上线，支持用户上传照片作为参考并添加至生成的图像中。

官方公告：https://x.com/reve/status/2062260665121919101官网体验：https://reve.com

5、OpenAI 升级生命科学模型 GPT-Rosalind，整合 Agentic Coding 能力

　OpenAI 宣布为其专为企业级生命科学研究打造的 GPT-Rosalind 模型系列引入新能力，将 GPT-5.5 的 agentic coding 和工具使用能力与更强的药物发现及实验工作流智能相结合。官方公布的评估数据显示，在涵盖药物化学、基因组学和湿实验室排错等多个自建基准测试中，GPT-Rosalind 的表现均优于 GPT-5.5、Gemini 3.1 Pro 和 Grok 4.3 等模型。为了支持实际科研执行，OpenAI 还推出了 Life Sciences Research 和 Life Sciences NGS Analysis 插件，所有用户可在 Codex 中使用，合格企业用户可用 GPT-Rosalind 驱动这些插件。目前更新后的模型正通过受信任访问部署结构，向全球具备合法科研目的和安全治理能力的符合条件的组织开放研究预览版。

官方发布：https://openai.com/index/introducing-new-capabilities-to-gpt-rosalind/插件地址：https://github.com/openai/plugins/tree/main/plugins/ngs-analysis

7、Nex AGI 发布并开源 Nex-N2-Pro 模型，性能媲美顶级闭源模型

　Nex AGI 发布并开源Nex-N2-Pro模型，该模型基于 Qwen3.5-397B-A17B 后训练而成，主打 Agentic Thinking 框架。官方公布的评测数据显示，该模型在多项基准测试中表现与 GPT-5.5、Opus 4.7 等顶级模型相当。目前模型权重已在 Hugging Face 和 ModelScope 开源，同时 SiliconFlow 平台已上线该模型并限时免费开放 API 调用。

Hugging Face：https://huggingface.co/nex-agi/Nex-N2-Pro官网：https://nex-agi.cn/

8、京东开源 JoyAI-Echo 长音视频生成框架，支持 5 分钟连贯内容

　　京东 Joy Future Academy 推出了名为JoyAI-Echo的长音视频生成框架，目前已通过 GitHub 和 Hugging Face 开源其推理代码与模型权重。该框架采用跨模态音视频记忆库技术，能够生成最长达 5 分钟的连贯故事，并在多镜头切换中保持角色外观与声音音色的一致性。官方公布的评测数据显示，其生成速度较原流程提升约 7.5 倍，且在多项指标上的用户偏好度优于 HappyOyster 及 Wan 2.6。该项目基于 LTX-2.3 开发，明确仅限学术研究与非商业用途。

GitHub：https://github.com/jd-opensource/JoyAI-EchoHugging Face：https://huggingface.co/jdopensource/JoyAI-Echo

二、开发生态与工具更新

1、OpenAI 调整 Codex 验证规则，服务端突发大规模 429 故障

　　据AI 社区反馈，OpenAI 近期对 Codex 强制要求的 SMS 二次验证疑似已取消，但仍有部分用户称需要验证。此外系统疑似灰度新增了 Passkey 和邮件接码选项，但老号绑定的手机号仍不可更改。与此同时，北京时间 6 月 3 日 OpenAI 服务端（包括 API、Codex 及 ChatGPT）出现大规模故障，用户频繁遇到 429 错误及速率限制，且 Codex 的额度显示界面在故障期间消失。此外，有人密集向 OpenAI 官方论坛提交了关于跨区订阅、支付漏洞及 Token 转售的举报材料。

状态页：https://status.openai.com社区讨论：https://linux.do/t/topic/2301047

2、Codex 宣布重置所有付费套餐使用额度，补偿可靠性问题

　　针对过去 24 小时内多起影响 Codex 可靠性的事件，Codex 负责人 Tibo 于今日上午约 8 点半宣布重置所有付费套餐的 Codex 使用额度。Tibo 表示，过去 24 小时内发生了三起影响 Codex 可靠性的独立小事件，目前团队正采取积极措施防止同类问题重现。

官方公告：https://x.com/thsottiaux/status/2062329981548802523

3、MiniMax 优化 M3 模型速度，开启 Token Plan 退款并永久加赠 50% 额度

　　针对访问量超预期的情况，MiniMax 团队连夜优化了 MiniMAX-M3 模型的 GPU 推理服务。官方同步宣布，本周五上午 10:00 前下单 Token Plan 的用户，在订阅有效期内将获得 M3 周限额永久额外赠送 50% 的福利额度。与此同时，官方在开发者交流群内宣布 Token Plan 退款通道现已开启，用户可前往控制台订阅页面申请，常规订单将在本周内处理完毕。此外，官方还上线了专属自助售后平台以统一接管售后与业务答疑。

官方文档：https://platform.minimaxi.com/docs/token-plan/migration

4、OpenClaw 发布 2026.6.1 版本，新增 Skill Workshop 与原生 Windows 支持

　OpenClaw 正式发布 2026.6.1 版本，重点引入了Skill Workshop功能，允许 Agent 将重复性工作转化为可审查、可修改且附带支持文件的可复用技能。此次更新还带来了 Workboard 多智能体编排能力增强，正式支持原生 Windows 节点作为集群主机运行，并集成了 MiniMax M3 模型作为该系列的默认选项。

官方博客：https://openclaw.ai/blog/openclaw-agent-skill-workshopGitHub 发布：https://github.com/openclaw/openclaw/releases/tag/v2026.6.1

5、讯飞上线星辰 Token Plan 包月订阅服务，统一调用多款旗舰模型

　　讯飞星辰 MaaS 平台正式推出面向企业团队的包月订阅制大模型调用服务 "星辰 Token Plan"。该服务采用统一额度池设计，一份订阅即可调用 Spark-X2、DeepSeek-V4 等多款旗舰大模型，以及语音识别、OCR 等讯飞核心能力。服务承诺高峰期不限流，提供 99.95% 的 SLA 保障，并为每名成员提供最高 500 万 TPM 的吞吐能力。目前该服务包含三档套餐，并限时提供订购折扣及赠送 AstronClaw 会员等促销活动。

官方公告：https://mp.weixin.qq.com/s/CBD4Vak-sAR_UWZN_APBEw官网：https://maas.xfyun.cn/

三、产品应用落地

1、Kimi 推出本地 Agent 产品 Kimi Work Beta 版，支持 300 个子 Agent 并行

　　Kimi 官方发布Kimi Work Beta版，这是一款面向知识工作者的通用型本地 Agent。其内核基于 Kimi Code，内置浏览器操作方案 Kimi WebBridge，支持用户通过自然语言在桌面端拆解任务与调用工具，最高可自主创建包含 300 个子 Agent 的团队进行协作。官方称，该产品由 AI 深度参与编写，92% 的客户端代码由 AI 生成。目前 Mac 版已提供下载，Windows 版即将上线。

官方公告：https://mp.weixin.qq.com/s/guE7g4kpu_PdrDT0a7DhzA

2、千问向第三方 Agent 和 Skill 全面开放，首批企业已接入测试

　　千问目前已向第三方 Agent 和 Skill 全面开放，瑞幸咖啡、肯德基、蜜雪冰城和东方航空等首批企业正在进行 Agent 服务测试并陆续上线。未来所有企业均可在千问 APP 中运营自己的品牌 Agent，自定义其人设与服务边界，以对话形式为用户提供服务。上述 Agent 具备记忆与主动规划能力，可在特定场景下主动提供行程提醒、复购推荐等服务。

官方公告：https://mp.weixin.qq.com/s/rUcQ-QxC3xmKfrK18fV0Yw

3、QoderWork 升级高校福利，师生认证额外获 4000 积分

　QoderWork 发布了 AI 生产力计划，面向所有用户开放免费领取包含 2000 积分的 1 个月 Pro 资源包。目前，高校师生在完成身份认证后，可额外领取有效期 3 个月的 4000 积分，累计获得 6000 积分用于学习与科研。在领取方式上，学生在认证通过后需点击页面手动领取，而教师提交认证后需等待 1-3 个工作日审核，通过后系统将自动发放至账户。

官方公告：https://mp.weixin.qq.com/s/EsEY_OWq70U0dcHQjnXokw

4、Google Labs 发布 Dreambeans，基于用户数据生成个性化生活故事

　Google Labs 近日推出了名为Dreambeans的全新实验性 AI 移动应用，登陆 Android 和 iOS 平台。该应用利用 Personal Intelligence 和 Nano Banana 2 技术，连接 Gmail 和 Calendar 等多个 Google 应用数据，每日提供约 10 到 14 个数量有限的个性化 AI 插画 "故事" 及生活建议，旨在减少无意义浏览。Dreambeans 要求至少连接一个 Google 应用，用户可自主控制隐私及数据连接范围，且其设置独立，不影响 Gemini Apps 或 AI Mode 等其他产品。目前该应用仅面向符合条件的美国 Google AI Ultra 订阅用户开放，要求用户年龄为 18 岁及以上，其他个人 Google 账号用户可申请加入候补名单。

官方发布：https://blog.google/innovation-and-ai/models-and-research/google-labs/dreambeans/体验地址：http://labs.google/dreambeans

四、技术洞察与前沿研究

1、Anthropic 发布报告：AI 自主攻击行为涌现，MITRE ATT&CK 框架亟待更新

　　Anthropic 发布报告，分析了 2025 年 3 月至 2026 年 3 月间 832 个恶意账户。报告指出，AI 攻击正从编写恶意软件转向后入侵操作，中高风险占比从前半年 33% 升至后半年 56%。报告认为，传统风险评估方法已失效，关键在于 AI 是否用于实时决策的后入侵环节及自主串联攻击的 "脚手架"。同时，MITRE ATT&CK 框架未涵盖 AI Agent 自主编排，已不敷使用。目前，Anthropic 已部署网络防护，正与 MITRE 探讨框架演进并发布工具。

官方报告：https://www.anthropic.com/news/AI-enabled-cyber-threats-mitre-attack

五、行业动态与企业动作

1、美国发布 AI 安全新规：鼓励发布前自愿受检，不设强制许可

　　美国领导人正式签署了《促进先进人工智能创新与安全》行政命令，确立了一项针对前沿 AI 模型的自愿审查框架。根据该命令，联邦机构将在 60 天内制定评估标准以界定 "受保前沿模型"。开发商可自行决定是否在公开发布前最多 30 天将其提交给政府进行安全评估，且明确规定此举不会设立强制性的政府许可或预审批要求。除了模型审查，命令还要求在 30 天内优先升级国家安全系统和关键基础设施的 AI 网络防御，并与行业合作建立网络安全信息交换中心。

官方文件：https://www.whitehouse.gov/presidential-actions/2026/06/promoting-advanced-artificial-intelligence-innovation-and-security/

2、OpenAI 发布前沿 AI 治理蓝图，CEO 赴华盛顿探讨公私合作

　　OpenAI 发布前沿 AI 美国治理蓝图，提议建立持久的联邦框架。该战略涵盖在州级安全法律共识上构建国家框架、强化 CAISI 作为联邦前沿安全主要机构，以及动员应对国家安全挑战的韧性计划。据媒体报道，其 CEO Sam Altman 正访问华盛顿以推动公私合作，计划与白宫官员及国会议员会面。此时正值美国领导人呼吁 AI 公司自愿在发布前共享前沿模型供审查，且 Altman 议程还包含建立向消费者传递 AI 财务收益的机制。

官方蓝图：https://openai.com/index/frontier-safety-blueprint/相关报道：https://www.bloomberg.com/news/articles/2026-06-03/openai-ceo-to-share-oversight-ideas-in-wake-of-trump-ai-order

3、Google Search 允许网站不被 AI Overviews 收录，英国率先测试

　　Google 官方宣布在 Search Console 中测试新控件，此举旨在帮助网站所有者管理其内容在生成式 AI 搜索中的呈现方式。该功能的开关允许网站选择退出 AI Overviews 等功能，但退出后将无法获得来自这些 AI 功能的流量。官方强调该设置不会用作常规搜索的排名信号。据媒体报道，此举是遵照英国反垄断监管机构要求，目前正面向英国部分网站测试，随后向全球推出。同时官方称其 AI Overviews 月活跃用户已超 25 亿。

官方公告：https://blog.google/products-and-platforms/products/search/new-controls-website-owners/相关报道：https://www.bloomberg.com/news/articles/2026-06-03/google-forced-by-uk-to-give-publishers-control-over-ai-summaries

4、Suno 官宣获得超 4 亿美元 D 轮融资，投后估值 54 亿美元

　　AI 音乐生成平台 Suno 通过官方博客宣布，已完成超过 4 亿美元的 D 轮融资，投后估值达到 54 亿美元。本轮融资由 Bond Capital 领投，多家新投资方、现有投资方以及部分音乐行业从业者参与跟投。官方表示，新资金将用于帮助更多用户进行音乐表达，并计划在未来几个月内开始推出其与音乐产业合作开发的首个音乐模型，以为粉丝创造新体验并帮助艺术家解锁商业可能。

官方公告：https://suno.com/blog/series-d-announcement

六、前瞻与市场传闻

1、OpenAI 计划将 Codex 核心能力整合进 ChatGPT，打造统一工作界面

　　OpenAI 在「Intelligence at Work」直播中提及，将在未来几周内把 Codex 的核心 Agent 能力直接整合进 ChatGPT。整合完成后，用户无需在两个独立产品之间切换，即可在桌面端、移动端和浏览器中使用该功能。ChatGPT 还将联动 Excel、Slack 和 PowerPoint 等企业工具，从传统的对话入口正式升级为直接调用 Agent 完成各项工作的统一界面。

官方直播：https://openai.com/zh-Hans-CN/business/intelligence-at-work/

2、Google 被曝向开发者付费购买代码库训练 AI

　　据媒体报道，Google 近期正在接触部分 Android 应用开发者，提出以付费方式获取其私有代码库的访问权，此举旨在用于训练 AI 并改进开发工具。据 404 Media 获得的一封保密邮件显示，该计划面向 "高质量、真实世界的代码库"，其涵盖范围包括当前应用及存档项目，并采用非独家许可。开发者将保留 100% 的知识产权，并可继续在其他地方将数据变现。目前，该计划尚处于试点阶段。

相关报道：https://www.neowin.net/reports/google-wants-to-pay-play-store-developers-for-code-to-train-its-ai/https://www.404media.co/google-is-quietly-buying-code-from-play-store-developers-to-train-ai/

七、Claw 专题动态

1、OpenClaw 2026.6.1 版本实现重大突破，成为跨平台开发首选

　OpenClaw 最新版本新增的 Skill Workshop 功能，首次实现了 Agent 技能的可复用、可审查与可编辑，解决了长期以来 Claw 任务重复性高、难以沉淀的痛点。同时原生 Windows 节点支持的加入，打破了 Claw 开发对 macOS 和 Linux 的依赖，大幅降低了 Windows 开发者的使用门槛。默认集成 MiniMax M3 模型后，OpenClaw 已成为目前功能最完善、跨平台支持最好的开源 Claw 框架。

2、Kimi Work Beta 推动国产 Claw 产品进入实用阶段

　Kimi Work Beta 支持最高 300 个子 Agent 并行协作，内置的 Kimi WebBridge 实现了浏览器操作的自动化，能够处理复杂的网页任务。92% 的客户端代码由 AI 生成，展示了 Claw 技术在软件开发中的强大能力。该产品的发布标志着国产 Claw 产品从技术演示走向实际应用，为知识工作者提供了强大的 AI 生产力工具。

3、千问开放第三方生态，加速 Claw 消费级应用落地

　　千问向所有企业开放品牌 Agent 运营权限，允许企业自定义人设与服务边界，具备记忆与主动规划能力。首批接入的瑞幸、肯德基等消费品牌，将 Claw 技术带入了普通用户的日常生活，推动 Claw 从企业级工具向消费级应用快速普及。

4、讯飞星辰 Token Plan 为企业级 Claw 提供算力支撑

　　讯飞推出的星辰 Token Plan 采用统一额度池设计，支持多款大模型与讯飞核心能力的统一调用，提供高峰不限流、99.95% SLA 的高可靠服务。赠送的 AstronClaw 会员进一步降低了企业部署 Claw 应用的成本，为企业级 Claw 的规模化落地提供了坚实的算力基础。

5、Anthropic 警示 Claw 安全风险，呼吁行业重视治理

　Anthropic 的报告指出，AI Agent 已被用于实施自主后入侵攻击，传统的网络安全框架已无法应对新型威胁。报告呼吁行业尽快更新 MITRE ATT&CK 框架，将 Agent 编排纳入风险评估体系，建立统一的 Claw 安全治理标准，保障 AI 技术的健康发展。

八、GitHub 热门开源项目

2026.06.04 全球 Trending AI 类

1、ideogram-oss/ideogram4

　　星标：3.2k（今日 + 2.8k）　　简介：Ideogram 4.0 开源文生图模型，9.3B 参数，支持 JSON 提示词与边界框布局控制，多语言文本渲染业界领先

地址：https://github.com/ideogram-oss/ideogram4

2、　jd-opensource/JoyAI-Echo

　　星标：2.5k（今日 + 2.2k）　　简介：京东开源长音视频生成框架，支持 5 分钟连贯内容生成，保持角色与音色一致性，生成速度提升 7.5 倍

地址：https://github.com/jd-opensource/JoyAI-Echo

3、openclaw/openclaw

　　星标：1.8k（今日 + 1.5k）　　简介：OpenClaw 2026.6.1 版本，新增 Skill Workshop 与原生 Windows 支持，多智能体编排能力增强

地址：https://github.com/openclaw/openclaw

4、openai/plugins/tree/main/plugins/ngs-analysis

　　星标：1.2k（今日 + 1.0k）　　简介：OpenAI 官方 NGS 分析插件，与 GPT-Rosalind 配合使用，支持基因组学数据处理与分析

地址：https://github.com/openai/plugins/tree/main/plugins/ngs-analysis

5、nex-agi/Nex-N2-Pro

　　星标：980（今日 + 850）　　简介：Nex-N2-Pro 开源大模型，基于 Qwen3.5 后训练，主打 Agentic Thinking，性能媲美 GPT-5.5 与 Opus 4.7

地址：https://huggingface.co/nex-agi/Nex-N2-Pro

提示：本报为 AI 辅助创作，存在内容错漏、信息幻觉等风险，仅供参考不构成任何决策依据，请以权威信源为准，错漏欢迎留言指正。

加入社群，畅聊AI

END

深圳市雪球易创科技有限公司（SnowEngine），是国内领先的多云管理服务商（MSP）与企业级 AI 解决方案提供商，深耕云计算与人工智能领域，致力于成为企业数字化转型最可信赖的长期伙伴。

我们可提供全维度企业数字化服务：

✅ 全栈云服务：多云统一纳管、无忧云迁移、架构升级与成本优化，适配微软、阿里、腾讯、谷歌等主流云平台；

✅ 企业级 AI 落地：一站式接入全球 300 + 顶尖 AI 模型，定制化 AI 解决方案、私有化部署与全生命周期运维；

✅ 安全合规保障：遵循等保 2.0、GDPR 等国际标准，全链路数据安全防护，适配金融、医药、政务等强监管行业；

✅ 全周期运维支持：7×24 小时技术响应，专属团队全程陪跑，保障企业业务稳定运行。

全球 300 + 顶尖 AI 模型一键接入！

📩 商务合作 & 资讯&订阅：后台回复「相关内容如：AI大模型/云服务」立即咨询

目前我们已服务全球 1000 + 企业客户，业务覆盖深圳、上海、北京、香港、新加坡、美国等全球核心区域，可为不同行业、不同规模的企业量身定制数字化与智能化转型方案。