Codex 能直接操作 Windows 桌面了
5 月 29 日,OpenAI 官方账号 @CodexReleases 发了一条更新公告,标题只有一行:
"Computer use and mobile access on Windows 26.527"
「Computer Use 与手机远程访问,Windows 26.527 版本。」

▲ Codex Releases 发布 26.527 更新,1300+ 赞,14 万次浏览
标题平平无奇,但拆开来看,每一项都值得单独说。
Computer Use 登陆 Windows——Codex 现在可以在 Windows 上操作桌面应用程序,具体方式是看到屏幕内容、点击界面元素、在输入框里打字,全程在前台完成。
手机远程控制 Windows 设备——用户可以从 ChatGPT iOS/Android 客户端,或者从一台装了 Codex 的 Mac,远程启动和控制 Windows 设备上的 Codex 任务。
Profile 页面升级——现在可以查看个人资料详情、使用统计和 token 消耗。
三项更新里,前两项的含义远比字面上大。
官方 Changelog 确认:这次更新是正式发布
打开 OpenAI Developers 的 Codex changelog 页面,2026 年 5 月 29 日的条目直接列出了全部变更:

▲ OpenAI Developers 官方 changelog,2026-05-29 条目
除了 Computer Use 和手机远程控制,这个版本还塞了几个容易被忽略的更新:
- 本地项目线程协调
(thread coordination for local projects and worktrees),支持独立后台线程 - 历史对话搜索扩展
,现在可以按对话内容和 Git 分支名搜索过去的 Codex 会话 性能改进和 bug 修复
这些功能单独拎出来可能不算大新闻,但放在 Computer Use + 手机远程控制的背景下,Codex 的产品定位正在发生肉眼可见的变化。
Computer Use:AI 操作桌面应用,到底能做什么?
先拆解一下 Computer Use 到底意味着什么。
Codex 的 Computer Use 指的是:AI agent 可以像人类用户一样操作桌面应用程序。它能看到屏幕上显示的内容,能移动光标点击按钮,能在文本框里输入文字。
关键限制:前台操作。
官方 changelog 原话:
"Codex can operate Windows desktop apps by seeing, clicking, and typing in the foreground while it works."
「Codex 可以通过在前台看到、点击和输入来操作 Windows 桌面应用程序。」
这个"foreground"很关键。社区用户 @chimpansky 马上指出了一个现实问题:
"The foreground requirement means you can't use your machine while Codex runs computer use."
「前台要求意味着 Codex 在使用 Computer Use 时,你没法同时用这台电脑。」
换句话说,Codex 操作桌面的时候,它占着你的屏幕和鼠标。你要么看着它干活,要么去喝杯咖啡。这也是为什么手机远程控制变得特别重要——你可以把 Windows 交给 Codex,自己用手机监控进度。
手机远程控制:把 Windows 交给 AI,人走到哪管到哪
这是 26.527 更新里最有想象力的一项。
打开 OpenAI Developers 的 Remote connections 文档,开头就划定了能力边界:
"Remote connections let you use Codex from another device or another machine."
「远程连接让你可以从另一台设备或另一台机器使用 Codex。」

▲ OpenAI Developers 远程连接文档,详细说明了手机控制 Codex 的能力范围
具体来说,通过 ChatGPT 手机客户端连接到 Windows 上的 Codex 后,你可以:
- 启动新任务
或继续正在进行的任务 - 发送后续指令
,回答 agent 的问题,调整工作方向 - 审批命令和操作
——Codex 需要执行敏感操作时会请求许可 - 查看输出结果
:代码 diff、测试结果、终端输出、截图 - 收到通知
:任务完成或需要人工介入时,手机会推送提醒 - 切换不同的 host 和线程
但有一点必须强调:手机端用的是 Windows host 的一切资源。
官方文档这句话说得很明确:
"Remote access uses the connected host's projects, threads, files, credentials, permissions, plugins, Computer Use, browser setup, and local tools."
「远程访问使用的是已连接主机的项目、线程、文件、凭证、权限、插件、Computer Use、浏览器设置和本地工具。」
手机更像是一个远程控制面板,所有计算、文件访问、权限判断都发生在 Windows host 上。你在手机上启动一个任务,Codex 在你办公室的 Windows 电脑上执行;你在地铁上审批一个操作,Codex 在那台 Windows 上完成。
社区用户 @TheKryptoWiz 的评价很到位:
"Mobile steering matters because agents become useful when they keep working while attention moves elsewhere."
「手机操控之所以重要,是因为当你的注意力转移到别处时,agent 能继续工作才真正有用。」
这正是远程控制的核心价值:人和 agent 的工作节奏解耦。
Windows 支持的全貌:原生应用 + 沙箱 + 权限体系
很多人看到"Codex 支持 Windows"可能觉得只是加了个 Windows 客户端。实际上,OpenAI 在 Windows 上搭建了一整套执行环境。

▲ OpenAI Developers Windows 文档,展示了 native app、sandbox、权限配置的完整体系
根据官方 Windows 文档,Codex 在 Windows 上的存在形式包括:
- 原生桌面应用
(native Codex app) - 命令行工具
(CLI) - IDE 扩展
原生应用支持的能力清单相当长:并行 agent 线程、worktrees、自动化、Git 功能、内置浏览器、artifact 预览、插件、skills。
但更值得关注的是安全设计。
当 Codex 在 Windows 上原生运行时,agent 模式使用Windows 沙箱来阻止对工作目录之外的文件写入,并且在没有明确批准的情况下禁止网络访问。
沙箱有两种模式,在 `config.toml` 里配置:
elevated 模式(推荐):使用专用的低权限沙箱用户、文件系统权限边界、防火墙规则和本地策略。
WSL2 模式:走 Linux 沙箱实现。
这意味着 Computer Use 的 headline 虽然是"AI 能操作桌面应用",但 OpenAI 同时给这个能力套上了沙箱 + 审批 + 网络管控的三重约束。agent 能看屏幕、点鼠标,但它的文件访问被限制在工作目录,网络请求需要你点头同意。
现在还缺什么?社区的真实反馈
更新发出后,评论区暴露了几个当前的痛点。
Linux 用户表示不满。@shikhr_ 直接留言:
"Still nothing for Linux."
「Linux 还是没有。」
目前 Codex 的桌面应用和 Computer Use 覆盖了 macOS 和 Windows,Linux 原生支持尚未提上日程。
前台占用引发讨论。前面提到的 @chimpansky 追问:有没有后台模式或 headless 模式?如果 Codex 操作桌面必须占据前台,对于只有一台电脑的开发者来说,等于整台机器在 agent 工作期间被"征用"了。
地区限制也是个问题。@ahtoshkaa 反馈说 Android 上 Codex 工作正常,但 Computer Use 和 Browser Use 在 EU 无法开启。这是个体反馈,官方没有发布正式的地区限制说明,但确实有用户遇到了这个情况。
Codex 正在变成什么?
回顾这次更新,最值得注意的趋势是:Codex 正在从"代码生成器"变成跨设备的 coding agent 操作层。
以前说 Codex,想到的是命令行里输入指令、等 AI 生成代码。现在的 Codex 可以:
在 Windows 桌面上操作 GUI 应用 通过手机远程启动、监控、审批任务 在沙箱里安全执行,带有权限审批和网络管控 支持并行线程、worktrees、自动化和插件系统
这个方向如果继续推进,Codex 的定位会更接近一个有桌面操作能力、可跨设备调度的开发助手运行时。
但也要看到边界:Computer Use 必须前台运行、手机端只是 host 的控制面板、沙箱和权限设计意味着 agent 的自主权仍然受限、Linux 支持还没来。
这些限制恰恰说明,OpenAI 在推进 agent 能力的同时,对安全边界的设计是认真的。至于这套跨设备 + 桌面操作 + 远程控制的组合能释放多少生产力,取决于 foreground 限制何时放开、Linux 何时加入、以及开发者对"把电脑交给 AI"这件事的信任到什么程度。
— END —
夜雨聆风