本周 AI 正在更快地从模型竞争,转向 Agent 化工具链、组织级采用度量和基础设施效率竞争。 OpenAI 在一周内连续更新 Codex 与 GPT-5.5 Instant,GitHub 开始给 Copilot 提供更细的企业采用度量,并把 Claude Opus 4.8 推到更广泛的开发工作流中;与此同时,NVIDIA 一边把“AI 工厂”上升为基础设施叙事,一边继续推进仿真到真实世界的机器人研究。这几条线放在一起看,会比单独看任何一条都更清楚: AI 的竞争重点,正在从“模型会什么”转向“系统能不能真正运转、组织能不能真正采用”。
5月29日,OpenAI 在 ChatGPT 发布说明中宣布,Codex 已支持在 Windows 设备上执行 Computer Use,并增强远程控制与使用资料页能力。这条更新的意义并不只在“又加了一个平台支持”,而在于它继续把 Codex 从编码助手推向更完整的 跨设备、跨宿主机的工作代理。
当一个 AI agent 可以在 Windows 主机上看、点、输,又能在别的设备上被远程接力时,它就不再只是“帮你写几段代码”的工具,而是在开始承担更长时长、更连续的任务。这意味着 AI 代理的竞争重心,正在更多落到运行环境覆盖、上下文延续和远程协同能力上。

5月28日,OpenAI 更新 GPT-5.5 Instant,强调更自然的日常对话、更清晰的实用任务节奏,并同步宣布逐步退休 OpenAI o3 与 GPT-4.5。表面看这是常见的产品更新,但其背后其实是一个非常清楚的信号: 模型产品线正在更强地围绕“统一体验”和“日常实用性”做收敛。
这意味着未来用户看到的竞争,不一定体现在“又多了几个模型名”,而会更多体现在产品是否更顺、更稳、更少割裂。对于 AI 产品公司来说,模型升级正在越来越像一场面向真实使用体验的持续运营,而不只是一次技术发布。
5月29日,GitHub 更新 Copilot usage metrics API,新增 `ai_adoption_phase` 字段,把用户划分为 code-first、agent-first、multi-agent 等不同采用阶段。这看起来像是一个后台报表改动,但它背后很重要,因为它说明企业级 AI 已经开始进入更成熟的管理周期。
当企业不再只关心“有多少人开通 Copilot”,而开始关心“员工是否从补全走向代理协作、是否在跨多个 AI 表面工作”,AI 工具就真正进入了组织能力建设阶段。换句话说, 采用度量本身正在成为 AI 产品竞争的一部分。

5月28日,GitHub 宣布 Claude Opus 4.8 在 Copilot 中正式可用,覆盖 VS Code、Visual Studio、Copilot CLI、Copilot cloud agent、移动端等多个表面。这条消息最有代表性的地方在于,更强模型不再是实验室里的“展示能力”,而是在越来越快地被放进开发工作流的第一线。
对开发者和企业来说,真正重要的不是某一个模型名字,而是模型选择权、接入速度和多表面可用性。未来很多平台的竞争,可能会体现在“谁能最快把最新能力接进用户最常用的工作界面里”。
5月27日,NVIDIA 发布《AI Factories: The New Infrastructure of Intelligence》,系统阐述 AI 工厂如何把电力转化为 token、把推理与 agent workloads 变成持续运转的“智能生产”。这条内容值得看,不是因为它提供了一个新口号,而是因为它把 AI 基础设施的评价标准推进到了一个更具产业意味的层次:tokens per second、tokens per watt、cost per token、utilization。
对 AI 圈而言,这类叙事变化很关键,因为它意味着基础设施的竞争已经不再只是“谁有更强 GPU”,而是“谁能更高效地持续生产智能”。Agent 系统越长、越复杂,这种系统级效率就越重要。

5月28日,NVIDIA Research 发布多篇 ICRA 论文总结,核心主题是 sim-to-real:机器人如何从仿真环境更稳定地迁移到真实世界。相比前一阶段大家更爱看 demo 视频,这一轮的重点正在变成“方法能否泛化”“部署是否稳定”“是否能跨不同机器人形态复用”。
这很重要,因为具身智能真正从实验室走向产业现场,靠的不是偶发成功,而是稳定、可迁移、可复现的方法体系。也就是说, 具身智能的竞争正在从“看起来会动”转向“是否可靠可用”。
夜雨聆风