OpenAI Codex 炸裂更新!直接操控 Windows 桌面应用,手机随时远程接管

导读【导读】OpenAI Codex 发布 26.527 版本重磅更新：Computer Use 正式登陆 Windows，AI agent 可以直接看屏幕、点鼠标、敲键盘操作桌面应用；同时支持从 iPhone、Android 手机或 Mac 远程控制 Windows 上的 Codex，随时随地启动任务、审批操作、查看结果。Coding agent 正在从命令行工具进化成跨设备、跨系统的开发操作层。

Codex 能直接操作 Windows 桌面了

5 月 29 日，OpenAI 官方账号 @CodexReleases 发了一条更新公告，标题只有一行：

"Computer use and mobile access on Windows 26.527"

「Computer Use 与手机远程访问，Windows 26.527 版本。」

▲ Codex Releases 发布 26.527 更新，1300+ 赞，14 万次浏览

标题平平无奇，但拆开来看，每一项都值得单独说。

Computer Use 登陆 Windows——Codex 现在可以在 Windows 上操作桌面应用程序，具体方式是看到屏幕内容、点击界面元素、在输入框里打字，全程在前台完成。

手机远程控制 Windows 设备——用户可以从 ChatGPT iOS/Android 客户端，或者从一台装了 Codex 的 Mac，远程启动和控制 Windows 设备上的 Codex 任务。

Profile 页面升级——现在可以查看个人资料详情、使用统计和 token 消耗。

三项更新里，前两项的含义远比字面上大。

官方 Changelog 确认：这次更新是正式发布

打开 OpenAI Developers 的 Codex changelog 页面，2026 年 5 月 29 日的条目直接列出了全部变更：

▲ OpenAI Developers 官方 changelog，2026-05-29 条目

除了 Computer Use 和手机远程控制，这个版本还塞了几个容易被忽略的更新：

本地项目线程协调
（thread coordination for local projects and worktrees），支持独立后台线程
历史对话搜索扩展
，现在可以按对话内容和 Git 分支名搜索过去的 Codex 会话
性能改进和 bug 修复

这些功能单独拎出来可能不算大新闻，但放在 Computer Use + 手机远程控制的背景下，Codex 的产品定位正在发生肉眼可见的变化。

Computer Use：AI 操作桌面应用，到底能做什么？

先拆解一下 Computer Use 到底意味着什么。

Codex 的 Computer Use 指的是：AI agent 可以像人类用户一样操作桌面应用程序。它能看到屏幕上显示的内容，能移动光标点击按钮，能在文本框里输入文字。

关键限制：前台操作。

官方 changelog 原话：

"Codex can operate Windows desktop apps by seeing, clicking, and typing in the foreground while it works."

「Codex 可以通过在前台看到、点击和输入来操作 Windows 桌面应用程序。」

这个"foreground"很关键。社区用户 @chimpansky 马上指出了一个现实问题：

"The foreground requirement means you can't use your machine while Codex runs computer use."

「前台要求意味着 Codex 在使用 Computer Use 时，你没法同时用这台电脑。」

换句话说，Codex 操作桌面的时候，它占着你的屏幕和鼠标。你要么看着它干活，要么去喝杯咖啡。这也是为什么手机远程控制变得特别重要——你可以把 Windows 交给 Codex，自己用手机监控进度。

手机远程控制：把 Windows 交给 AI，人走到哪管到哪

这是 26.527 更新里最有想象力的一项。

打开 OpenAI Developers 的 Remote connections 文档，开头就划定了能力边界：

"Remote connections let you use Codex from another device or another machine."

「远程连接让你可以从另一台设备或另一台机器使用 Codex。」

▲ OpenAI Developers 远程连接文档，详细说明了手机控制 Codex 的能力范围

具体来说，通过 ChatGPT 手机客户端连接到 Windows 上的 Codex 后，你可以：

启动新任务
或继续正在进行的任务
发送后续指令
，回答 agent 的问题，调整工作方向
审批命令和操作
——Codex 需要执行敏感操作时会请求许可
查看输出结果
：代码 diff、测试结果、终端输出、截图
收到通知
：任务完成或需要人工介入时，手机会推送提醒
切换不同的 host 和线程

但有一点必须强调：手机端用的是 Windows host 的一切资源。

官方文档这句话说得很明确：

"Remote access uses the connected host's projects, threads, files, credentials, permissions, plugins, Computer Use, browser setup, and local tools."

「远程访问使用的是已连接主机的项目、线程、文件、凭证、权限、插件、Computer Use、浏览器设置和本地工具。」

手机更像是一个远程控制面板，所有计算、文件访问、权限判断都发生在 Windows host 上。你在手机上启动一个任务，Codex 在你办公室的 Windows 电脑上执行；你在地铁上审批一个操作，Codex 在那台 Windows 上完成。

社区用户 @TheKryptoWiz 的评价很到位：

"Mobile steering matters because agents become useful when they keep working while attention moves elsewhere."

「手机操控之所以重要，是因为当你的注意力转移到别处时，agent 能继续工作才真正有用。」

这正是远程控制的核心价值：人和 agent 的工作节奏解耦。

Windows 支持的全貌：原生应用 + 沙箱 + 权限体系

很多人看到"Codex 支持 Windows"可能觉得只是加了个 Windows 客户端。实际上，OpenAI 在 Windows 上搭建了一整套执行环境。

▲ OpenAI Developers Windows 文档，展示了 native app、sandbox、权限配置的完整体系

根据官方 Windows 文档，Codex 在 Windows 上的存在形式包括：

原生桌面应用
（native Codex app）
命令行工具
（CLI）
IDE 扩展

原生应用支持的能力清单相当长：并行 agent 线程、worktrees、自动化、Git 功能、内置浏览器、artifact 预览、插件、skills。

但更值得关注的是安全设计。

当 Codex 在 Windows 上原生运行时，agent 模式使用Windows 沙箱来阻止对工作目录之外的文件写入，并且在没有明确批准的情况下禁止网络访问。

沙箱有两种模式，在 `config.toml` 里配置：

elevated 模式（推荐）：使用专用的低权限沙箱用户、文件系统权限边界、防火墙规则和本地策略。

WSL2 模式：走 Linux 沙箱实现。

这意味着 Computer Use 的 headline 虽然是"AI 能操作桌面应用"，但 OpenAI 同时给这个能力套上了沙箱 + 审批 + 网络管控的三重约束。agent 能看屏幕、点鼠标，但它的文件访问被限制在工作目录，网络请求需要你点头同意。

现在还缺什么？社区的真实反馈

更新发出后，评论区暴露了几个当前的痛点。

Linux 用户表示不满。@shikhr_ 直接留言：

"Still nothing for Linux."

「Linux 还是没有。」

目前 Codex 的桌面应用和 Computer Use 覆盖了 macOS 和 Windows，Linux 原生支持尚未提上日程。

前台占用引发讨论。前面提到的 @chimpansky 追问：有没有后台模式或 headless 模式？如果 Codex 操作桌面必须占据前台，对于只有一台电脑的开发者来说，等于整台机器在 agent 工作期间被"征用"了。

地区限制也是个问题。@ahtoshkaa 反馈说 Android 上 Codex 工作正常，但 Computer Use 和 Browser Use 在 EU 无法开启。这是个体反馈，官方没有发布正式的地区限制说明，但确实有用户遇到了这个情况。

Codex 正在变成什么？

回顾这次更新，最值得注意的趋势是：Codex 正在从"代码生成器"变成跨设备的 coding agent 操作层。

以前说 Codex，想到的是命令行里输入指令、等 AI 生成代码。现在的 Codex 可以：

在 Windows 桌面上操作 GUI 应用
通过手机远程启动、监控、审批任务
在沙箱里安全执行，带有权限审批和网络管控
支持并行线程、worktrees、自动化和插件系统

这个方向如果继续推进，Codex 的定位会更接近一个有桌面操作能力、可跨设备调度的开发助手运行时。

但也要看到边界：Computer Use 必须前台运行、手机端只是 host 的控制面板、沙箱和权限设计意味着 agent 的自主权仍然受限、Linux 支持还没来。

这些限制恰恰说明，OpenAI 在推进 agent 能力的同时，对安全边界的设计是认真的。至于这套跨设备 + 桌面操作 + 远程控制的组合能释放多少生产力，取决于 foreground 限制何时放开、Linux 何时加入、以及开发者对"把电脑交给 AI"这件事的信任到什么程度。

— END —