AI与云:工具进入工作流,收费和基建怎么落地?

2026年6月1日至6月5日，AI与云的变化直接落到三个产品动作：OpenAI Codex接入ChatGPT，豆包专业版准备收费，英伟达把智能体平台推向PC和物理AI。

业务重心已经从模型发布转向工作流入口、收费分层和基础设施。模型能力还在升级，但真正影响产业链格局的，是谁能把能力嵌进开发、分析、设计、机器人、汽车和日常办公这些具体任务里。

Google停服Gemini 2.0 Flash及其001、lite等旧模型，也给了另一个信号。原API调用会直接报错，开发者需要迁移到Gemini 3.5 Flash或Gemini 3.1 Flash Lite。模型迭代不只是能力升级，也会直接影响应用方和算力平台的适配节奏。

先说结论

1.AI与云这条主线的核心变化，是竞争入口变了。行业开始从模型榜单竞争走向工作流入口、端侧平台和收费分层。

2.英伟达仍然站在基础设施前端。Vera Rubin架构量产、Vera CPU、Rubin超算架构、端侧智能体平台和Cosmos 3串起来，是把智能体、PC、机器人和智能汽车放进同一套平台叙事。

3.模型公司正在更快地把能力切成可付费服务。MiniMax M3证明代码能力继续追赶，豆包专业版则把开发、分析等高级能力拿出来收费。

模型能力进入岗位入口

OpenAI这次最值得看的地方，不是Codex继续做编程工具，而是Codex被放进ChatGPT体系。OpenAI举行AI上岗发布会，Codex从编程工具升级为面向全行业的智能体工作平台，同时推出6款角色插件，覆盖数据分析、创意制作、销售、产品设计等岗位。

这意味着AI工具的入口正在变窄，也在变深。过去一个模型应用可以依靠“能写代码、能生成内容、能回答问题”获得注意力。现在更关键的是，它能不能接住一个岗位的连续任务，把任务拆解、工具调用、结果修改和交付物沉淀接起来。

豆包专业版对应的是另一种路径。它计划覆盖开发、分析等高级服务，并在6月下旬开始收费，同时官方说明搜索、写作、音视频等日常基础功能会继续免费且升级。基础功能维持用户规模，高阶能力尝试变成收入来源。

英伟达补齐算力底座

英伟达的动作是在回答另一个问题：当AI走进具体工作流，底层算力和设备形态要怎样跟上。GTC2026大会宣告智能体AI时代到来，会上发布面向智能体的Rubin超算架构与自研Vera CPU，推出端侧平台重构PC生态，并展示物理AI世界模型。

这里的关键不是单个产品名，而是三层拼图。第一层是超算和CPU，解决模型和智能体系统的训练、推理与协同。第二层是RTX Spark，把相关能力带到本地设备生态。第三层是Cosmos 3，它的开源代码库、权重和技术报告能够原生理解并生成文本、图像、视频及动作，重点赋能机器人和智能汽车。

这条线索说明，AI与云不只是云端模型厂商之间的竞赛。智能体如果要进入真实生产环节，就会牵动芯片、设备、开发平台和行业终端。英伟达的优势也不只在卖算力，而在把算力平台、端侧平台和物理AI场景放进同一套架构。

模型迁移带来工程压力

Google停服Gemini 2.0系列旧模型，是这篇周报里容易被忽略但很重要的信号。原API调用会直接报错，开发者需要迁移到Gemini 3.5 Flash或Gemini 3.1 Flash Lite，这意味着模型厂商升级节奏会传导到应用方的工程维护。

对使用模型接口的公司来说，能力升级当然重要，但稳定性、迁移成本和兼容性同样重要。模型版本越快，应用层越不能只依赖一次接入。它需要持续测试、替换并评估用户体验，这也是AI云服务从可用走向可靠的必经阶段。

MiniMax M3提供了国内模型能力追赶的另一侧证据。MiniMax M3是原生多模态大模型，在SWE-Bench Pro代码能力评测中得分59.0%，逼近国际顶尖闭源模型水平。这个数字的意义在于，代码能力已经成为智能体和工作流产品的重要底座。

相关公司

这条主线里，OpenAI和Google更偏模型与开发入口，英伟达更偏底层平台，MiniMax和豆包专业版分别对应能力追赶和收费分层。它们不是同一类公司，但都指向AI从发布会走进任务流。

后面看什么

接下来更需要跟踪三件事：工作流插件能否形成高频使用，专业版收费能否被核心任务承接，基础设施升级能否进入机器人、智能汽车和PC这些具体场景。

如果OpenAI Codex、豆包专业版、MiniMax M3、Gemini迁移和英伟达平台放在一条线上，AI与云的主线就很清楚：模型能力继续迭代，但真正影响产业格局的是谁能把能力变成稳定入口、付费产品和底层标准。

后面可能存在的不确定性

风险边界也不能忽略。后续政策不及预期、中美关系变化、宏观经济运行不及预期、AI技术迭代和应用不及预期、政策监管风险，都会影响产业链落地节奏。

发布会密度不等于落地速度，能力参数也不等于商业回款。AI与云的竞争，正在从“谁更聪明”变成“谁更能进入真实工作”。但从真实工作到稳定付费，中间还隔着产品留存、客户预算、工程迁移和基础设施投入。