Codex 推出＂Mac 遥控器＂,AI 编程助手正在变成你的系统级 Agent

下班前你在 Codex 里输入了一个任务："跑完测试套件，把失败的测试整理成报告，顺便给 PR 加上描述。"然后合上电脑，走进地铁。

到家掏出手机，Codex 推送了一条通知：测试完成，3 个失败用例已分析，根因定位到最近合并的某个 commit，PR 描述已更新。

这不是科幻片。这是 OpenAI 在 5 月 22 日发布的 Codex 更新中最炸裂的一项——Locked Computer Use。

一、一次更新，三个重磅

5 月 21-22 日，OpenAI 一口气向 Codex 推送了六项更新，其中三个功能值得每个开发者关注：

Locked Computer Use（锁屏 Mac 操控）：从手机给锁屏的 Mac 下发任务，Codex 会临时解锁、操作应用、完成任务，然后重新锁屏。屏幕全程显示"Codex 正在使用你的 Mac"的覆盖层。

Appshots：双击 Command 键，把当前窗口的截图 + 全部文本（包括滚动不可见内容）直接注入 Codex 对话。

/goal 模式稳定版：4 月还是实验性的 /goal 正式转为 GA。设定一个目标，Codex 自主循环"计划→执行→测试→审查→迭代"，可以跑上几个小时甚至几天，且跨进程重启不丢失。

这三个功能的叠加，意义远超"修了几个 bug、加了个快捷键"的常规更新。它们指向同一个方向——AI 编程工具正在从"对话式助手"演变成"系统级 Agent"。

二、Locked Computer Use：安全与便利的钢丝绳

最引人注目的当然是锁屏操控。技术上说，它并不复杂：Codex 持有 macOS 的 Accessibility 和 Screen Recording 权限，当收到远程请求时，会在后台临时解锁，同时用覆盖层遮蔽屏幕内容。

关键在安全设计。OpenAI 在这个功能上做了四层防护：

第一层，视觉隔离。Mac 被远程操控时，屏幕显示的是 Codex 覆盖层，不是你的桌面。即使在旁边亲眼看着，也看不到 Codex 在做什么——这防止了"路过偷看"的攻击场景。

第二层，本地优先。一旦检测到键盘或鼠标活动，Codex 立刻重新锁屏，暂停自动解锁。走到电脑前想自己用，系统秒级让渡控制权。

第三层，应用级权限。Codex 不能自动操作 Terminal，不能操作自身，不能处理系统级管理员弹窗。每次操作新应用前需要你的授权，也可以设为"始终允许"。

第四层，地理限制。EEA、英国、瑞士暂不支持——监管环境的差异直接影响了功能的可用范围。

这套设计反映出 OpenAI 的清醒认知：这是一个高风险功能。你的 Mac 里有 Git 仓库的私钥、AWS 的 Access Key、未发布的商业计划书。允许一个 AI 在锁屏状态下操作这一切，本质上是把信任从"你盯着它做"扩展到了"你不在场它也做"。

三、Appshots + /goal：让上下文不再靠粘贴

如果说 Locked Computer Use 是这次更新的 headline，Appshots 和 /goal 才是真正每天都会用的东西。

用过 Cursor 或 Claude Code 的人应该都有这个体验：给 AI 提供上下文是最大的摩擦。截图、复制文本、描述窗口内容——每一步都在打断思路。

Appshots 解决的就是这个问题。双击 Command 键，当前窗口的全部状态（屏幕可见 + 滚动不可见内容）直接进入 Codex 的上下文。调试浏览器时截个 bug 页面，设计稿截个图让 Codex 生成代码，API 文档截一下就能直接引用。它把"描述上下文"的成本降到了零。

/goal 模式则是另一个维度的变化。传统上，我们用 AI 编程工具的方式是"问一句答一句"的对话模式。/goal 把它变成了"设定目标→交付结果"的委托模式。Codex 会自主循环：写代码、跑测试、看结果、发现问题、修复、再继续。遇到搞不定的会停下来问你要不要调整方向。

这个模式刚出来时，有人担心失控——让 AI 自己跑几小时，万一搞出破坏呢？实际上两个设计减轻了这种担忧：一是它会在关键节点暂停等你确认，二是所有操作都在你本地的 Mac 上执行，不是你给了权限就放飞。

四、Agent 竞赛：编程工具的商业化军备

这次更新放在更大的图景下看，很有意思。

就在同一天，《华尔街日报》报道Anthropic 即将成为首个盈利的 AI 实验室。Q2 预计营收 109 亿美元，运营利润 5.59 亿美元。主要增长引擎是什么？编程工具和 Agent 功能。

Claude Code 在不到一年内，将企业年消费超百万美元的客户从 500 家翻倍到 1000+ 家。市场份额数据更耐人寻味：34.4% 的美国企业现在付费使用 Anthropic，超过了 OpenAI 的 32.3%。这是 Anthropic 首次在企业付费率上超越 OpenAI。

与此同时，OpenAI 的 Codex 也在快速进化。从 4 月的 /goal 实验版，到 5 月的 Locked Computer Use 和 Appshots，更新节奏明显在加快。

两家公司正在编程 Agent 这个赛道上展开一场军备竞赛。Claude Code 有企业信任度和安全合规优势（28 家安全工具合作伙伴），Codex 有跨设备远程操控的技术领先。Cursor 走的是云端 Agent 路线，最近也披露了其架构细节——基于 Temporal 平台每天处理 5000 万次操作，支撑了 40%+ 的 PR 生成。

编程工具的商业化正在发生质变：从"卖编辑器 license"到"卖 Agent 工时"。Anthropic 的盈利预期和 OpenAI 的激进扩张都说明了一件事——开发者愿意为"能自己干活的 AI"付费，而且是高单价。

五、我的几点判断

写到这里，说几个不那么确定的判断，抛砖引玉：

1. "锁屏操控"这个功能，意义可能不亚于 Computer Use 本身。Computer Use 让 AI 能操作电脑，Locked Mode 让 AI 能在你不在场时操作电脑。从"监督模式"到"委托模式"，信任模型发生了根本变化。这会是未来所有 AI 编程工具的标配。

2. Appshots 才是真正的效率革命。Locked Computer Use 很酷但不常用（谁会天天远程控 Mac？），但 Appshots 每次开发都会用。它解决的是 AI 编程最核心的难题——上下文传递的摩擦。

3. 安全设计的差异会成为竞争分水岭。Locked Computer Use 的四层防护、Claude Code 的企业合规集成，都在说明同一件事：当 AI 获得了操作系统的权限，安全就不再是 feature，而是 prerequisite。

4. 最大的输家可能不是程序员，而是 SaaS 公司。当一个 AI Agent 可以跨应用操作你的整个开发工具链，传统的"用户数 × 订阅费"定价模式会受到冲击。GitHub、Jira、Slack——如果 AI Agent 替你操作它们，它们该收谁的钱？

资料来源：

OpenAI's Codex Can Use macOS Apps Even When Your Mac Is Locked - MacObserver
You can now send Codex tasks from your phone even when your Mac is locked - DigitalTrends
OpenAI upgrades Codex with Appshots, Goal mode and more - Digit.in
Codex for Mac updated with Appshots - 9to5Mac
Anthropic on Track for First Profitable Quarter - TechCrunch
Cursor Blog: Cloud Agent Lessons
OpenAI Codex Changelog
Simon Willison: Codex /goal

你会放心让 AI 在你锁屏的电脑上操作吗？如果有机会，你最想让它在你离开时帮你做什么？