AI 行业早报 · 2026年6月2日 周二
今日精选 31 条 AI 动态,涵盖模型前沿、开源数据、智能体落地、资本基建与工具观点。
🔬 模型前沿
MiniMax M3开源,主打百万上下文编码
MiniMax 发布 M3,把前沿编码、智能体能力、原生多模态和 100 万 token 上下文放进同一个开源模型。它采用 MiniMax Sparse Attention,把百万上下文下的每 token 计算成本降到前代约 1/20,并在 SWE-Bench Pro 上拿到 59.0% 分数。对开发者来说,这意味着长仓库理解、长任务执行和低成本推理正在进一步靠近可用区间。
MiniMax:Blog[1]
xAI Composer 2.5进入Grok Build
xAI 发布新的编程模型 Composer 2.5,并已在 Grok Build 中开放选择。官方强调它适合长时间运行任务和复杂指令,面向 SuperGrok 与 X Premium+ 用户开放。它的重点不是单次补全,而是更长链路的软件构建能力。
xAI:News[2]
Qwen3.7-Plus强化多模态智能体
Qwen Studio 更新 Qwen3.7-Plus,覆盖聊天、图像与视频理解、图像生成、文档处理、网页搜索、工具调用和制品生成。它代表通用大模型产品继续向“多模态 + 工具 + 工作流”融合,目标是让模型从问答入口变成任务执行入口。
Qwen:Blog Retrieval[3]
NVIDIA Cosmos 3面向物理AI推理
NVIDIA 介绍 Cosmos 3,用于机器人、自动驾驶和智能空间里的物理 AI 推理。它强调世界理解、事件预测和行动生成,让模型不仅“看懂画面”,还要推演真实环境会如何变化。物理世界模型正在成为具身智能和工业智能体的重要基础设施。
NVIDIA Technical Blog[4]
SenseNova新模型瞄准AI图表生成
商汤推出 SenseNova-U1-8B-MoT-Infographic,专门解决 AI 生成图表时常见的数值错误、柱状图偏移和元素关系混乱问题。它支持生成更准确的图表,并能实时调整设计与布局。对报告、数据新闻和企业 BI 场景来说,图表可靠性比“好看”更关键。
X:商汤 SenseTime[5]
JetBrains发布12B代码MoE模型Mellum2
JetBrains 在 Hugging Face 介绍 Mellum2,这是一款 12B 参数规模的混合专家模型。作为 IDE 厂商推出的代码模型,它更值得关注的是与开发工具链的潜在结合。代码模型竞争正从参数规模,转向“能否嵌入真实开发流程”。
Hugging Face:Blog[6]
Nemotron 3 Ultra进入发布倒计时
NVIDIA AI 预告 Nemotron 3 Ultra 将在本周发布。虽然信息仍较简短,但 Nemotron 系列一直与企业级模型、推理和智能体基础设施强相关。后续重点要看它在推理成本、开源策略和 NVIDIA 生态整合上的具体变化。
X:NVIDIA AI[7]
🧰 开源数据
OpenBMB开源UltraData两大数据集
OpenBMB 联合清华 NLP 与 Modelbest 发布 Ultra-FineWeb-L3 和 UltraData-SFT-2605。前者包含 600B+ tokens,其中中文超过 200B;后者包含 1500 万以上 SFT 样本,并覆盖思考与非思考标注。大模型竞争越来越依赖高质量数据工程,这类中文开放数据集会直接影响中小模型训练门槛。
X:面壁智能 OpenBMB[8]
OpenRouter给自动路由加入成本旋钮
OpenRouter 的 Auto Router 新增 cost_quality_tradeoff 参数,让开发者在质量与成本之间明确调节。数值越低越偏向强模型,越高越偏向便宜模型。随着多模型调用成为常态,路由器正在从“选模型工具”变成 AI 应用成本控制层。
X:OpenRouter[9]
OpenAI模型与Codex全面登陆AWS
OpenAI 宣布前沿模型与 Codex 已可在 AWS 上使用,企业客户能沿用现有云环境、采购流程和权限控制接入。这个动作降低了企业从试点到生产部署的组织摩擦,也说明顶级模型正在更深地嵌入主流云生态。
OpenAI:官网动态[10]
Replit尝试一条提示词生成完整业务
Replit 宣布用户可以从一个提示词开始,生成网站、移动应用、幻灯片和发布视频,并连接 Stripe、QuickBooks、Mercury 等业务服务。它把 AI 编程进一步推向“从产品到运营”的一体化。对独立开发者来说,门槛降低;对平台来说,关键是能否把生成物变成可持续经营的业务。
X:Replit[11]
Perplexity推出Search as Code架构
Perplexity 发布 Search as Code,为 AI 智能体打造新的搜索架构。它不再逐个循环调用搜索函数,而是让模型直接生成 Python 代码调用搜索栈,并已进入 Perplexity Agent API。搜索正在从“给模型结果”演进为“让模型编排检索过程”。
X:Perplexity[12]
ChatGPT加入长文编辑与保存
ChatGPT 新增长文全屏编辑与保存到资料库功能。这个更新看似小,但击中了长文写作、资料整理和持续创作的真实痛点。聊天窗口正在变得更像工作台,而不是一次性问答框。
X:ChatGPT[13]
🤖 智能体落地
腾讯混元发布智能体长期记忆插件
腾讯混元发布 Hy-Memory,面向 OpenClaw 等长期协作智能体,定位为 Agent 的“第二大脑”。它基于 6 层记忆框架、System1/System2 双系统和三层进化链,宣称可让记忆数量减少 70% 以上、信息密度提升 45% 以上、超长上下文 token 消耗降低 35%。智能体要长期协作,记忆管理会成为核心能力。
X:腾讯混元[14]
NVIDIA工厂蓝图让AI接管运营决策层
NVIDIA 发布工厂运营蓝图 FOX,用于构建自主工厂管理智能体。它连接机器信号、质量数据和操作警报,目标是在工厂里形成统一决策层;富士康等首批采用者已开始基于 FOX 和 NemoClaw 构建多智能体系统。工业 AI 的重点正从单点检测转向跨系统协同。
NVIDIA Blog:Agentic AI[15]
美团小美将接入腾讯元宝服务场景
美团 CEO 王兴透露,AI Agent“小美”将与腾讯元宝深度合作。用户在腾讯元宝中提出本地服务需求后,可无缝连接到美团外卖、配送等生态。这个案例说明“面向智能体的服务”正在变成平台竞争的新入口。
IT之家[16]
Google演示并行子智能体整理文件
Google AI for Developers 展示 Antigravity 中的并行子智能体,用来自动分类和重命名数百个营销资产。这个演示展示了智能体的一个实用方向:不是替代整份工作,而是把琐碎、重复、规则明确的文件管理流程自动化。
X:Google AI for Developers[17]
OpenRouter展示高预算智能体护栏教程
OpenRouter 分享了一个每周预算上限 1000 美元的智能体构建教程,重点包括模型拒绝列表、自定义数据保留、预算限制、ZDR、提示词注入防御和 DLP 检测。随着智能体能花钱、调模型、处理数据,护栏不再是附加功能,而是上线前提。
X:OpenRouter[18]
Gemini Omni支持生成个人数字分身
Gemini App 展示 Gemini Omni 创建个人数字分身的流程,可生成外观和声音都像用户的视频角色。这类能力会推动个人视频创作门槛下降,也会让身份授权、肖像使用和内容标识变得更重要。
X:Gemini[19]
Meta AI漏洞暴露智能体权限风险
The Verge 报道称,Meta 的 AI 支持聊天机器人被利用来关联新的电子邮件地址,从而劫持 Instagram 账号。这个事件提醒行业:当 AI 智能体可以直接执行账户管理动作时,权限边界、确认机制和风控链路必须重新设计。
The Verge:科技[20]
🏗️ 资本基建
Anthropic提交保密S-1草案
Anthropic 宣布已向 SEC 保密提交 S-1 草案,为潜在 IPO 做准备。公司近期完成大额融资并发布 Claude Opus 4.8,这次动作让它拥有在市场条件合适时上市的选择权。头部 AI 公司正在从技术竞赛进入资本市场周期。
Anthropic:Newsroom[21]
智谱计划A股科创板上市
智谱计划申请发行 A 股并在科创板上市,募集资金将投向通用基座大模型、大模型 MaaS 一站式服务平台和流动资金。公司还拟将英文名变更为 Z.AI Co., Ltd.。国产大模型公司正加速寻找长期资本与商业化支撑。
IT之家[22]
Alphabet拟筹800亿美元加码AI支出
Bloomberg 报道称,Alphabet 正计划通过发行股票等方式筹集 800 亿美元,用于支持 AI 支出计划。这类规模的融资说明 AI 资本开支已经不只是研发预算,而是影响云、芯片、能源和数据中心的长期资产投入。
Bloomberg:Technology[23]
OpenAI启动密歇根Stargate数据中心
OpenAI 在密歇根州启动 Stargate 1GW 数据中心项目,作为 AI 基础设施扩张的一部分。项目目标包括提升 AI 可及性、创造本地就业并支持社区发展。大模型竞争继续向电力、土地、网络和地方协作延伸。
OpenAI:官网动态[24]
NVIDIA与台积电把AI带进晶圆厂
NVIDIA 和台积电将 AI 引入晶圆厂,用于推动半导体设计与制造发展。AI 正在进入芯片制造流程本身,从设计优化、设备运维到良率提升都有潜在空间。AI 算力需求越高,AI 反过来改造芯片生产的价值也越明显。
IT之家[25]
佛州起诉OpenAI,安全争议升级
Ars Technica 报道称,佛罗里达州对 OpenAI 及 Sam Altman 提起诉讼,案件与多起 ChatGPT 相关刑事事件有关。无论最终法律结论如何,这都显示生成式 AI 的安全责任正在从产品讨论进入司法与合规层面。
Ars Technica:AI[26]
💡 工具观点
开源与闭源模型走向不同增长曲线
Nathan Lambert 讨论开源与闭源模型的差异化增长路径:当微小智能提升能转化为实际价值时,闭源模型会在高价值场景里追求边际智能,开源模型则在成本、可控性、部署自由度等维度寻找增长点。模型竞争不会只有一个赢家路径。
Nathan Lambert:Interconnects[27]
Claude Opus 4.8被用于把书变成Skill
阿易 AI Notes 分享用 Claude Opus 4.8 把《非暴力沟通》转化为 AI Skill 的流程。方法包括全书结构分析、框架提炼、技法抽取、反模式整理和自检,耗时约 45 分钟、消耗约 30 万 token。长上下文模型正在把知识工程从手工整理推向半自动生产。
X:阿易 AI Notes[28]
开发者展示Codex App项目合集
开发者 Vista 分享了一批使用 Codex App 等工具开发的开源项目,包括 Chrome 插件、网站和 AI Skill。它展示了 AI 编程工具在个人项目里的真实产出形态:不是只写 demo,而是持续拼装插件、网站和工作流资产。
X:Vista[29]
Sam Altman谈AI发展应以人为本
Sam Altman 在采访中强调,AI 不应被设计成脱离人类需求的系统,人类必须始终处于 AI 发展的中心。他认为行业需要更清楚地解释,人类如何在 AI 时代保持控制权、经济角色和有意义的生活。技术乐观之外,社会叙事同样重要。
X:Rohan Paul[30]
微软研究聚焦智能体评估与对齐
微软研究分享了智能体评估与价值对齐相关研究,关注如何大规模评估智能体行为,并提出代码库在某些评估场景中优于文档。智能体越能行动,评估就越不能只看答题分数,而要观察它在复杂环境中的决策轨迹。
X:Microsoft Research[31]
以上,AI 行业今日速览。 作者:卡夫卡卡不卡
引用链接
[1]MiniMax:Blog: https://www.minimax.io/blog/minimax-m3
[2]xAI:News: https://x.ai/news/composer-2-5
[3]Qwen:Blog Retrieval: https://qwen.ai/blog?id=qwen3.7-plus
[4]NVIDIA Technical Blog: https://developer.nvidia.com/blog/develop-physical-ai-reasoning-world-and-action-models-with-nvidia-cosmos-3
[5]X:商汤 SenseTime: https://x.com/SenseTime_AI/status/2061465029959209106
[6]Hugging Face:Blog: https://huggingface.co/blog/JetBrains/mellum2-launch
[7]X:NVIDIA AI: https://x.com/NVIDIAAI/status/2061305524700758050
[8]X:面壁智能 OpenBMB: https://x.com/OpenBMB/status/2061432928492810535
[9]X:OpenRouter: https://x.com/OpenRouter/status/2061476882470580329
[10]OpenAI:官网动态: https://openai.com/index/openai-frontier-models-and-codex-are-now-available-on-aws
[11]X:Replit: https://x.com/Replit/status/2061534759520760112
[12]X:Perplexity: https://x.com/perplexity_ai/status/2061506359326384319
[13]X:ChatGPT: https://x.com/ChatGPTapp/status/2061571468992126982
[14]X:腾讯混元: https://x.com/TencentHunyuan/status/2061372535267357029
[15]NVIDIA Blog:Agentic AI: https://blogs.nvidia.com/blog/factory-operations-fox-blueprint-ai-brain
[16]IT之家: https://www.ithome.com/0/958/410.htm
[17]X:Google AI for Developers: https://x.com/googleaidevs/status/2061515177166844317
[18]X:OpenRouter: https://x.com/OpenRouter/status/2061452942385783050
[19]X:Gemini: https://x.com/GeminiApp/status/2061480944905982276
[20]The Verge:科技: https://www.theverge.com/tech/941179/meta-instagram-ai-support-chatbot-exploit-hacked
[21]Anthropic:Newsroom: https://www.anthropic.com/news/confidential-draft-s1-sec
[22]IT之家: https://www.ithome.com/0/958/444.htm
[23]Bloomberg:Technology: https://www.bloomberg.com/news/articles/2026-06-01/alphabet-to-raise-80-billion-in-equity-capital-for-ai-spending
[24]OpenAI:官网动态: https://openai.com/index/stargate-michigan-data-center
[25]IT之家: https://www.ithome.com/0/958/109.htm
[26]Ars Technica:AI: https://arstechnica.com/tech-policy/2026/06/florida-sues-openai-sam-altman-after-multiple-chatgpt-linked-murders
[27]Nathan Lambert:Interconnects: https://www.interconnects.ai/p/open-and-closed-models-are-on-different
[28]X:阿易 AI Notes: https://x.com/AYi_AInotes/status/2061419197154857286
[29]X:Vista: https://x.com/vista8/status/2061443708374208769
[30]X:Rohan Paul: https://x.com/rohanpaul_ai/status/2061586179292831774
[31]X:Microsoft Research: https://x.com/MSFTResearch/status/2061440352859361521
夜雨聆风