AI 行业早报 · 6月2日

AI 行业早报 · 2026年6月2日周二

今日精选 31 条 AI 动态，涵盖模型前沿、开源数据、智能体落地、资本基建与工具观点。

🔬 模型前沿

MiniMax M3开源，主打百万上下文编码

MiniMax 发布 M3，把前沿编码、智能体能力、原生多模态和 100 万 token 上下文放进同一个开源模型。它采用 MiniMax Sparse Attention，把百万上下文下的每 token 计算成本降到前代约 1/20，并在 SWE-Bench Pro 上拿到 59.0% 分数。对开发者来说，这意味着长仓库理解、长任务执行和低成本推理正在进一步靠近可用区间。

MiniMax：Blog^[1]

xAI Composer 2.5进入Grok Build

xAI 发布新的编程模型 Composer 2.5，并已在 Grok Build 中开放选择。官方强调它适合长时间运行任务和复杂指令，面向 SuperGrok 与 X Premium+ 用户开放。它的重点不是单次补全，而是更长链路的软件构建能力。

xAI：News^[2]

Qwen3.7-Plus强化多模态智能体

Qwen Studio 更新 Qwen3.7-Plus，覆盖聊天、图像与视频理解、图像生成、文档处理、网页搜索、工具调用和制品生成。它代表通用大模型产品继续向“多模态 + 工具 + 工作流”融合，目标是让模型从问答入口变成任务执行入口。

Qwen：Blog Retrieval^[3]

NVIDIA Cosmos 3面向物理AI推理

NVIDIA 介绍 Cosmos 3，用于机器人、自动驾驶和智能空间里的物理 AI 推理。它强调世界理解、事件预测和行动生成，让模型不仅“看懂画面”，还要推演真实环境会如何变化。物理世界模型正在成为具身智能和工业智能体的重要基础设施。

NVIDIA Technical Blog^[4]

SenseNova新模型瞄准AI图表生成

商汤推出 SenseNova-U1-8B-MoT-Infographic，专门解决 AI 生成图表时常见的数值错误、柱状图偏移和元素关系混乱问题。它支持生成更准确的图表，并能实时调整设计与布局。对报告、数据新闻和企业 BI 场景来说，图表可靠性比“好看”更关键。

X：商汤 SenseTime^[5]

JetBrains发布12B代码MoE模型Mellum2

JetBrains 在 Hugging Face 介绍 Mellum2，这是一款 12B 参数规模的混合专家模型。作为 IDE 厂商推出的代码模型，它更值得关注的是与开发工具链的潜在结合。代码模型竞争正从参数规模，转向“能否嵌入真实开发流程”。

Hugging Face：Blog^[6]

Nemotron 3 Ultra进入发布倒计时

NVIDIA AI 预告 Nemotron 3 Ultra 将在本周发布。虽然信息仍较简短，但 Nemotron 系列一直与企业级模型、推理和智能体基础设施强相关。后续重点要看它在推理成本、开源策略和 NVIDIA 生态整合上的具体变化。

X：NVIDIA AI^[7]

🧰 开源数据

OpenBMB开源UltraData两大数据集

OpenBMB 联合清华 NLP 与 Modelbest 发布 Ultra-FineWeb-L3 和 UltraData-SFT-2605。前者包含 600B+ tokens，其中中文超过 200B；后者包含 1500 万以上 SFT 样本，并覆盖思考与非思考标注。大模型竞争越来越依赖高质量数据工程，这类中文开放数据集会直接影响中小模型训练门槛。

X：面壁智能 OpenBMB^[8]

OpenRouter给自动路由加入成本旋钮

OpenRouter 的 Auto Router 新增 cost_quality_tradeoff 参数，让开发者在质量与成本之间明确调节。数值越低越偏向强模型，越高越偏向便宜模型。随着多模型调用成为常态，路由器正在从“选模型工具”变成 AI 应用成本控制层。

X：OpenRouter^[9]

OpenAI模型与Codex全面登陆AWS

OpenAI 宣布前沿模型与 Codex 已可在 AWS 上使用，企业客户能沿用现有云环境、采购流程和权限控制接入。这个动作降低了企业从试点到生产部署的组织摩擦，也说明顶级模型正在更深地嵌入主流云生态。

OpenAI：官网动态^[10]

Replit尝试一条提示词生成完整业务

Replit 宣布用户可以从一个提示词开始，生成网站、移动应用、幻灯片和发布视频，并连接 Stripe、QuickBooks、Mercury 等业务服务。它把 AI 编程进一步推向“从产品到运营”的一体化。对独立开发者来说，门槛降低；对平台来说，关键是能否把生成物变成可持续经营的业务。

X：Replit^[11]

Perplexity推出Search as Code架构

Perplexity 发布 Search as Code，为 AI 智能体打造新的搜索架构。它不再逐个循环调用搜索函数，而是让模型直接生成 Python 代码调用搜索栈，并已进入 Perplexity Agent API。搜索正在从“给模型结果”演进为“让模型编排检索过程”。

X：Perplexity^[12]

ChatGPT加入长文编辑与保存

ChatGPT 新增长文全屏编辑与保存到资料库功能。这个更新看似小，但击中了长文写作、资料整理和持续创作的真实痛点。聊天窗口正在变得更像工作台，而不是一次性问答框。

X：ChatGPT^[13]

🤖 智能体落地

腾讯混元发布智能体长期记忆插件

腾讯混元发布 Hy-Memory，面向 OpenClaw 等长期协作智能体，定位为 Agent 的“第二大脑”。它基于 6 层记忆框架、System1/System2 双系统和三层进化链，宣称可让记忆数量减少 70% 以上、信息密度提升 45% 以上、超长上下文 token 消耗降低 35%。智能体要长期协作，记忆管理会成为核心能力。

X：腾讯混元^[14]

NVIDIA工厂蓝图让AI接管运营决策层

NVIDIA 发布工厂运营蓝图 FOX，用于构建自主工厂管理智能体。它连接机器信号、质量数据和操作警报，目标是在工厂里形成统一决策层；富士康等首批采用者已开始基于 FOX 和 NemoClaw 构建多智能体系统。工业 AI 的重点正从单点检测转向跨系统协同。

NVIDIA Blog：Agentic AI^[15]

美团小美将接入腾讯元宝服务场景

美团 CEO 王兴透露，AI Agent“小美”将与腾讯元宝深度合作。用户在腾讯元宝中提出本地服务需求后，可无缝连接到美团外卖、配送等生态。这个案例说明“面向智能体的服务”正在变成平台竞争的新入口。

IT之家^[16]

Google演示并行子智能体整理文件

Google AI for Developers 展示 Antigravity 中的并行子智能体，用来自动分类和重命名数百个营销资产。这个演示展示了智能体的一个实用方向：不是替代整份工作，而是把琐碎、重复、规则明确的文件管理流程自动化。

X：Google AI for Developers^[17]

OpenRouter展示高预算智能体护栏教程

OpenRouter 分享了一个每周预算上限 1000 美元的智能体构建教程，重点包括模型拒绝列表、自定义数据保留、预算限制、ZDR、提示词注入防御和 DLP 检测。随着智能体能花钱、调模型、处理数据，护栏不再是附加功能，而是上线前提。

X：OpenRouter^[18]

Gemini Omni支持生成个人数字分身

Gemini App 展示 Gemini Omni 创建个人数字分身的流程，可生成外观和声音都像用户的视频角色。这类能力会推动个人视频创作门槛下降，也会让身份授权、肖像使用和内容标识变得更重要。

X：Gemini^[19]

Meta AI漏洞暴露智能体权限风险

The Verge 报道称，Meta 的 AI 支持聊天机器人被利用来关联新的电子邮件地址，从而劫持 Instagram 账号。这个事件提醒行业：当 AI 智能体可以直接执行账户管理动作时，权限边界、确认机制和风控链路必须重新设计。

The Verge：科技^[20]

🏗️ 资本基建

Anthropic提交保密S-1草案

Anthropic 宣布已向 SEC 保密提交 S-1 草案，为潜在 IPO 做准备。公司近期完成大额融资并发布 Claude Opus 4.8，这次动作让它拥有在市场条件合适时上市的选择权。头部 AI 公司正在从技术竞赛进入资本市场周期。

Anthropic：Newsroom^[21]

智谱计划A股科创板上市

智谱计划申请发行 A 股并在科创板上市，募集资金将投向通用基座大模型、大模型 MaaS 一站式服务平台和流动资金。公司还拟将英文名变更为 Z.AI Co., Ltd.。国产大模型公司正加速寻找长期资本与商业化支撑。

IT之家^[22]

Alphabet拟筹800亿美元加码AI支出

Bloomberg 报道称，Alphabet 正计划通过发行股票等方式筹集 800 亿美元，用于支持 AI 支出计划。这类规模的融资说明 AI 资本开支已经不只是研发预算，而是影响云、芯片、能源和数据中心的长期资产投入。

Bloomberg：Technology^[23]

OpenAI启动密歇根Stargate数据中心

OpenAI 在密歇根州启动 Stargate 1GW 数据中心项目，作为 AI 基础设施扩张的一部分。项目目标包括提升 AI 可及性、创造本地就业并支持社区发展。大模型竞争继续向电力、土地、网络和地方协作延伸。

OpenAI：官网动态^[24]

NVIDIA与台积电把AI带进晶圆厂

NVIDIA 和台积电将 AI 引入晶圆厂，用于推动半导体设计与制造发展。AI 正在进入芯片制造流程本身，从设计优化、设备运维到良率提升都有潜在空间。AI 算力需求越高，AI 反过来改造芯片生产的价值也越明显。

IT之家^[25]

佛州起诉OpenAI，安全争议升级

Ars Technica 报道称，佛罗里达州对 OpenAI 及 Sam Altman 提起诉讼，案件与多起 ChatGPT 相关刑事事件有关。无论最终法律结论如何，这都显示生成式 AI 的安全责任正在从产品讨论进入司法与合规层面。

Ars Technica：AI^[26]

💡 工具观点

开源与闭源模型走向不同增长曲线

Nathan Lambert 讨论开源与闭源模型的差异化增长路径：当微小智能提升能转化为实际价值时，闭源模型会在高价值场景里追求边际智能，开源模型则在成本、可控性、部署自由度等维度寻找增长点。模型竞争不会只有一个赢家路径。

Nathan Lambert：Interconnects^[27]

Claude Opus 4.8被用于把书变成Skill

阿易 AI Notes 分享用 Claude Opus 4.8 把《非暴力沟通》转化为 AI Skill 的流程。方法包括全书结构分析、框架提炼、技法抽取、反模式整理和自检，耗时约 45 分钟、消耗约 30 万 token。长上下文模型正在把知识工程从手工整理推向半自动生产。

X：阿易 AI Notes^[28]

开发者展示Codex App项目合集

开发者 Vista 分享了一批使用 Codex App 等工具开发的开源项目，包括 Chrome 插件、网站和 AI Skill。它展示了 AI 编程工具在个人项目里的真实产出形态：不是只写 demo，而是持续拼装插件、网站和工作流资产。

X：Vista^[29]

Sam Altman谈AI发展应以人为本

Sam Altman 在采访中强调，AI 不应被设计成脱离人类需求的系统，人类必须始终处于 AI 发展的中心。他认为行业需要更清楚地解释，人类如何在 AI 时代保持控制权、经济角色和有意义的生活。技术乐观之外，社会叙事同样重要。

X：Rohan Paul^[30]

微软研究聚焦智能体评估与对齐

微软研究分享了智能体评估与价值对齐相关研究，关注如何大规模评估智能体行为，并提出代码库在某些评估场景中优于文档。智能体越能行动，评估就越不能只看答题分数，而要观察它在复杂环境中的决策轨迹。

X：Microsoft Research^[31]

以上，AI 行业今日速览。 作者：卡夫卡卡不卡

引用链接

[1]MiniMax：Blog: https://www.minimax.io/blog/minimax-m3

[2]xAI：News: https://x.ai/news/composer-2-5

[3]Qwen：Blog Retrieval: https://qwen.ai/blog?id=qwen3.7-plus

[4]NVIDIA Technical Blog: https://developer.nvidia.com/blog/develop-physical-ai-reasoning-world-and-action-models-with-nvidia-cosmos-3

[5]X：商汤 SenseTime: https://x.com/SenseTime_AI/status/2061465029959209106

[6]Hugging Face：Blog: https://huggingface.co/blog/JetBrains/mellum2-launch

[7]X：NVIDIA AI: https://x.com/NVIDIAAI/status/2061305524700758050

[8]X：面壁智能 OpenBMB: https://x.com/OpenBMB/status/2061432928492810535

[9]X：OpenRouter: https://x.com/OpenRouter/status/2061476882470580329

[10]OpenAI：官网动态: https://openai.com/index/openai-frontier-models-and-codex-are-now-available-on-aws

[11]X：Replit: https://x.com/Replit/status/2061534759520760112

[12]X：Perplexity: https://x.com/perplexity_ai/status/2061506359326384319

[13]X：ChatGPT: https://x.com/ChatGPTapp/status/2061571468992126982

[14]X：腾讯混元: https://x.com/TencentHunyuan/status/2061372535267357029

[15]NVIDIA Blog：Agentic AI: https://blogs.nvidia.com/blog/factory-operations-fox-blueprint-ai-brain

[16]IT之家: https://www.ithome.com/0/958/410.htm

[17]X：Google AI for Developers: https://x.com/googleaidevs/status/2061515177166844317

[18]X：OpenRouter: https://x.com/OpenRouter/status/2061452942385783050

[19]X：Gemini: https://x.com/GeminiApp/status/2061480944905982276

[20]The Verge：科技: https://www.theverge.com/tech/941179/meta-instagram-ai-support-chatbot-exploit-hacked

[21]Anthropic：Newsroom: https://www.anthropic.com/news/confidential-draft-s1-sec

[22]IT之家: https://www.ithome.com/0/958/444.htm

[23]Bloomberg：Technology: https://www.bloomberg.com/news/articles/2026-06-01/alphabet-to-raise-80-billion-in-equity-capital-for-ai-spending

[24]OpenAI：官网动态: https://openai.com/index/stargate-michigan-data-center

[25]IT之家: https://www.ithome.com/0/958/109.htm

[26]Ars Technica：AI: https://arstechnica.com/tech-policy/2026/06/florida-sues-openai-sam-altman-after-multiple-chatgpt-linked-murders

[27]Nathan Lambert：Interconnects: https://www.interconnects.ai/p/open-and-closed-models-are-on-different

[28]X：阿易 AI Notes: https://x.com/AYi_AInotes/status/2061419197154857286

[29]X：Vista: https://x.com/vista8/status/2061443708374208769

[30]X：Rohan Paul: https://x.com/rohanpaul_ai/status/2061586179292831774

[31]X：Microsoft Research: https://x.com/MSFTResearch/status/2061440352859361521

AI 行业早报 · 2026年6月2日 周二