下班前你在 Codex 里输入了一个任务:"跑完测试套件,把失败的测试整理成报告,顺便给 PR 加上描述。"然后合上电脑,走进地铁。
到家掏出手机,Codex 推送了一条通知:测试完成,3 个失败用例已分析,根因定位到最近合并的某个 commit,PR 描述已更新。
这不是科幻片。这是 OpenAI 在 5 月 22 日发布的 Codex 更新中最炸裂的一项——Locked Computer Use。
一、一次更新,三个重磅
5 月 21-22 日,OpenAI 一口气向 Codex 推送了六项更新,其中三个功能值得每个开发者关注:

Locked Computer Use(锁屏 Mac 操控):从手机给锁屏的 Mac 下发任务,Codex 会临时解锁、操作应用、完成任务,然后重新锁屏。屏幕全程显示"Codex 正在使用你的 Mac"的覆盖层。
Appshots:双击 Command 键,把当前窗口的截图 + 全部文本(包括滚动不可见内容)直接注入 Codex 对话。
/goal 模式稳定版:4 月还是实验性的 /goal 正式转为 GA。设定一个目标,Codex 自主循环"计划→执行→测试→审查→迭代",可以跑上几个小时甚至几天,且跨进程重启不丢失。
这三个功能的叠加,意义远超"修了几个 bug、加了个快捷键"的常规更新。它们指向同一个方向——AI 编程工具正在从"对话式助手"演变成"系统级 Agent"。
二、Locked Computer Use:安全与便利的钢丝绳
最引人注目的当然是锁屏操控。技术上说,它并不复杂:Codex 持有 macOS 的 Accessibility 和 Screen Recording 权限,当收到远程请求时,会在后台临时解锁,同时用覆盖层遮蔽屏幕内容。
关键在安全设计。OpenAI 在这个功能上做了四层防护:

第一层,视觉隔离。Mac 被远程操控时,屏幕显示的是 Codex 覆盖层,不是你的桌面。即使在旁边亲眼看着,也看不到 Codex 在做什么——这防止了"路过偷看"的攻击场景。
第二层,本地优先。一旦检测到键盘或鼠标活动,Codex 立刻重新锁屏,暂停自动解锁。走到电脑前想自己用,系统秒级让渡控制权。
第三层,应用级权限。Codex 不能自动操作 Terminal,不能操作自身,不能处理系统级管理员弹窗。每次操作新应用前需要你的授权,也可以设为"始终允许"。
第四层,地理限制。EEA、英国、瑞士暂不支持——监管环境的差异直接影响了功能的可用范围。
这套设计反映出 OpenAI 的清醒认知:这是一个高风险功能。你的 Mac 里有 Git 仓库的私钥、AWS 的 Access Key、未发布的商业计划书。允许一个 AI 在锁屏状态下操作这一切,本质上是把信任从"你盯着它做"扩展到了"你不在场它也做"。
三、Appshots + /goal:让上下文不再靠粘贴
如果说 Locked Computer Use 是这次更新的 headline,Appshots 和 /goal 才是真正每天都会用的东西。
用过 Cursor 或 Claude Code 的人应该都有这个体验:给 AI 提供上下文是最大的摩擦。截图、复制文本、描述窗口内容——每一步都在打断思路。
Appshots 解决的就是这个问题。双击 Command 键,当前窗口的全部状态(屏幕可见 + 滚动不可见内容)直接进入 Codex 的上下文。调试浏览器时截个 bug 页面,设计稿截个图让 Codex 生成代码,API 文档截一下就能直接引用。它把"描述上下文"的成本降到了零。
/goal 模式则是另一个维度的变化。传统上,我们用 AI 编程工具的方式是"问一句答一句"的对话模式。/goal 把它变成了"设定目标→交付结果"的委托模式。Codex 会自主循环:写代码、跑测试、看结果、发现问题、修复、再继续。遇到搞不定的会停下来问你要不要调整方向。
这个模式刚出来时,有人担心失控——让 AI 自己跑几小时,万一搞出破坏呢?实际上两个设计减轻了这种担忧:一是它会在关键节点暂停等你确认,二是所有操作都在你本地的 Mac 上执行,不是你给了权限就放飞。
四、Agent 竞赛:编程工具的商业化军备
这次更新放在更大的图景下看,很有意思。
就在同一天,《华尔街日报》报道Anthropic 即将成为首个盈利的 AI 实验室。Q2 预计营收 109 亿美元,运营利润 5.59 亿美元。主要增长引擎是什么?编程工具和 Agent 功能。
Claude Code 在不到一年内,将企业年消费超百万美元的客户从 500 家翻倍到 1000+ 家。市场份额数据更耐人寻味:34.4% 的美国企业现在付费使用 Anthropic,超过了 OpenAI 的 32.3%。这是 Anthropic 首次在企业付费率上超越 OpenAI。
与此同时,OpenAI 的 Codex 也在快速进化。从 4 月的 /goal 实验版,到 5 月的 Locked Computer Use 和 Appshots,更新节奏明显在加快。
两家公司正在编程 Agent 这个赛道上展开一场军备竞赛。Claude Code 有企业信任度和安全合规优势(28 家安全工具合作伙伴),Codex 有跨设备远程操控的技术领先。Cursor 走的是云端 Agent 路线,最近也披露了其架构细节——基于 Temporal 平台每天处理 5000 万次操作,支撑了 40%+ 的 PR 生成。
编程工具的商业化正在发生质变:从"卖编辑器 license"到"卖 Agent 工时"。Anthropic 的盈利预期和 OpenAI 的激进扩张都说明了一件事——开发者愿意为"能自己干活的 AI"付费,而且是高单价。
五、我的几点判断
写到这里,说几个不那么确定的判断,抛砖引玉:
1. "锁屏操控"这个功能,意义可能不亚于 Computer Use 本身。Computer Use 让 AI 能操作电脑,Locked Mode 让 AI 能在你不在场时操作电脑。从"监督模式"到"委托模式",信任模型发生了根本变化。这会是未来所有 AI 编程工具的标配。
2. Appshots 才是真正的效率革命。Locked Computer Use 很酷但不常用(谁会天天远程控 Mac?),但 Appshots 每次开发都会用。它解决的是 AI 编程最核心的难题——上下文传递的摩擦。
3. 安全设计的差异会成为竞争分水岭。Locked Computer Use 的四层防护、Claude Code 的企业合规集成,都在说明同一件事:当 AI 获得了操作系统的权限,安全就不再是 feature,而是 prerequisite。
4. 最大的输家可能不是程序员,而是 SaaS 公司。当一个 AI Agent 可以跨应用操作你的整个开发工具链,传统的"用户数 × 订阅费"定价模式会受到冲击。GitHub、Jira、Slack——如果 AI Agent 替你操作它们,它们该收谁的钱?
资料来源:
OpenAI's Codex Can Use macOS Apps Even When Your Mac Is Locked - MacObserver You can now send Codex tasks from your phone even when your Mac is locked - DigitalTrends OpenAI upgrades Codex with Appshots, Goal mode and more - Digit.in Codex for Mac updated with Appshots - 9to5Mac Anthropic on Track for First Profitable Quarter - TechCrunch Cursor Blog: Cloud Agent Lessons OpenAI Codex Changelog Simon Willison: Codex /goal
你会放心让 AI 在你锁屏的电脑上操作吗?如果有机会,你最想让它在你离开时帮你做什么?
夜雨聆风