2026年6月1日至6月5日,AI与云的变化直接落到三个产品动作:OpenAI Codex接入ChatGPT,豆包专业版准备收费,英伟达把智能体平台推向PC和物理AI。
业务重心已经从模型发布转向工作流入口、收费分层和基础设施。模型能力还在升级,但真正影响产业链格局的,是谁能把能力嵌进开发、分析、设计、机器人、汽车和日常办公这些具体任务里。
Google停服Gemini 2.0 Flash及其001、lite等旧模型,也给了另一个信号。原API调用会直接报错,开发者需要迁移到Gemini 3.5 Flash或Gemini 3.1 Flash Lite。模型迭代不只是能力升级,也会直接影响应用方和算力平台的适配节奏。
1.AI与云这条主线的核心变化,是竞争入口变了。行业开始从模型榜单竞争走向工作流入口、端侧平台和收费分层。
2.英伟达仍然站在基础设施前端。Vera Rubin架构量产、Vera CPU、Rubin超算架构、端侧智能体平台和Cosmos 3串起来,是把智能体、PC、机器人和智能汽车放进同一套平台叙事。
3.模型公司正在更快地把能力切成可付费服务。MiniMax M3证明代码能力继续追赶,豆包专业版则把开发、分析等高级能力拿出来收费。
OpenAI这次最值得看的地方,不是Codex继续做编程工具,而是Codex被放进ChatGPT体系。OpenAI举行AI上岗发布会,Codex从编程工具升级为面向全行业的智能体工作平台,同时推出6款角色插件,覆盖数据分析、创意制作、销售、产品设计等岗位。
这意味着AI工具的入口正在变窄,也在变深。过去一个模型应用可以依靠“能写代码、能生成内容、能回答问题”获得注意力。现在更关键的是,它能不能接住一个岗位的连续任务,把任务拆解、工具调用、结果修改和交付物沉淀接起来。
豆包专业版对应的是另一种路径。它计划覆盖开发、分析等高级服务,并在6月下旬开始收费,同时官方说明搜索、写作、音视频等日常基础功能会继续免费且升级。基础功能维持用户规模,高阶能力尝试变成收入来源。
英伟达的动作是在回答另一个问题:当AI走进具体工作流,底层算力和设备形态要怎样跟上。GTC2026大会宣告智能体AI时代到来,会上发布面向智能体的Rubin超算架构与自研Vera CPU,推出端侧平台重构PC生态,并展示物理AI世界模型。
这里的关键不是单个产品名,而是三层拼图。第一层是超算和CPU,解决模型和智能体系统的训练、推理与协同。第二层是RTX Spark,把相关能力带到本地设备生态。第三层是Cosmos 3,它的开源代码库、权重和技术报告能够原生理解并生成文本、图像、视频及动作,重点赋能机器人和智能汽车。
这条线索说明,AI与云不只是云端模型厂商之间的竞赛。智能体如果要进入真实生产环节,就会牵动芯片、设备、开发平台和行业终端。英伟达的优势也不只在卖算力,而在把算力平台、端侧平台和物理AI场景放进同一套架构。
Google停服Gemini 2.0系列旧模型,是这篇周报里容易被忽略但很重要的信号。原API调用会直接报错,开发者需要迁移到Gemini 3.5 Flash或Gemini 3.1 Flash Lite,这意味着模型厂商升级节奏会传导到应用方的工程维护。
对使用模型接口的公司来说,能力升级当然重要,但稳定性、迁移成本和兼容性同样重要。模型版本越快,应用层越不能只依赖一次接入。它需要持续测试、替换并评估用户体验,这也是AI云服务从可用走向可靠的必经阶段。
MiniMax M3提供了国内模型能力追赶的另一侧证据。MiniMax M3是原生多模态大模型,在SWE-Bench Pro代码能力评测中得分59.0%,逼近国际顶尖闭源模型水平。这个数字的意义在于,代码能力已经成为智能体和工作流产品的重要底座。
这条主线里,OpenAI和Google更偏模型与开发入口,英伟达更偏底层平台,MiniMax和豆包专业版分别对应能力追赶和收费分层。它们不是同一类公司,但都指向AI从发布会走进任务流。

接下来更需要跟踪三件事:工作流插件能否形成高频使用,专业版收费能否被核心任务承接,基础设施升级能否进入机器人、智能汽车和PC这些具体场景。
如果OpenAI Codex、豆包专业版、MiniMax M3、Gemini迁移和英伟达平台放在一条线上,AI与云的主线就很清楚:模型能力继续迭代,但真正影响产业格局的是谁能把能力变成稳定入口、付费产品和底层标准。
风险边界也不能忽略。后续政策不及预期、中美关系变化、宏观经济运行不及预期、AI技术迭代和应用不及预期、政策监管风险,都会影响产业链落地节奏。
发布会密度不等于落地速度,能力参数也不等于商业回款。AI与云的竞争,正在从“谁更聪明”变成“谁更能进入真实工作”。但从真实工作到稳定付费,中间还隔着产品留存、客户预算、工程迁移和基础设施投入。
夜雨聆风