AGENT / COMPUTER USE
我第一次看到 Codex 的“locked use”时,脑子里冒出来的不是炫技,而是一个很日常的画面:电脑合上了,人已经离开桌面,但一个 AI 助手还在帮你查资料、点软件、整理任务。
这听起来有点吓人。也正因为吓人,它才值得认真看。

AIHOT 5 月 22 日把 Codex 锁屏电脑使用列入产品更新,重点是“真实设备”和“安全操控”同时出现。
AIHOT 今天把这条消息放进产品更新里:Codex 可以在 Mac 锁定、屏幕关闭的情况下,通过受控方式继续使用电脑上的应用。它不是普通聊天框多了一个按钮,而是 AI 从“给建议”继续往“接触真实工作现场”里走了一步。
一、这次到底发生了什么
OpenAI 的开发者文档把这个能力放在 Codex App 的 Computer Use 里。意思很直白:当命令行、插件或者结构化接口不够用时,Codex 可以看见并操作 macOS 上的图形界面,比如检查桌面应用、使用浏览器、改应用设置、复现只有图形界面才会出现的问题。

OpenAI 文档把 Computer Use 定义为让 Codex 操作桌面应用,适合命令行和结构化集成覆盖不到的任务。
这一步的关键词不是“自动化”,而是“图形界面”。以前 AI 最擅长处理文字、代码、网页表单。现在它开始碰窗口、按钮、菜单、弹窗、权限提示,这些才是普通人每天真的在用的电脑。
但文档也没有把它包装成无限制遥控。要使用 Computer Use,需要安装插件,还要授予屏幕录制和辅助功能权限。换句话说,AI 能看、能点、能输入,前提是你明确给了它入口。

真正的入口是权限:屏幕录制让 Codex 能看见界面,辅助功能让它能点击、输入和导航。
二、锁屏使用为什么敏感
真正让人停一下的,是 locked use。这个场景不是“你坐在电脑前看着它点”,而是任务可能在电脑锁定时继续推进。对一个人做项目的人来说,这很诱人:睡前交代 Codex 检查一个本地 App,第二天早上看结果。

Locked use 的重点不是无限遥控,而是在可信任务和短期授权里,让任务能在锁屏场景继续推进。
但它也把问题推到更硬的位置:AI 到底可以碰哪些应用?碰到支付、私信、后台、客户数据时怎么办?它点错按钮以后谁负责?本地有人碰鼠标键盘时,AI 是否立刻让出控制?这些都不是产品宣传里的小字,而是未来 Agent 产品能不能被信任的核心。
所以我不建议把它理解成“电脑不用管了”。更准确的理解是:AI 助手开始进入需要权限、确认和回滚的真实工作流。

安全指导必须放进正文:AI 可以影响应用和系统状态,所以任务范围、权限提示和人工复核都不是装饰。
三、给初学者:Agent 不是更会聊天,而是更会进现场
很多人刚接触 AI,会把工具分成两类:会聊天的,和会画图写代码的。但 Agent 这条线真正改变的是工作位置。
聊天机器人像坐在你旁边的顾问,你问一句,它答一句。Agent 更像一个临时同事,你给它一个目标,它需要自己去找文件、打开页面、点按钮、调用工具、检查结果,再回来告诉你完成到哪里。
Cursor 在云端 Agent 复盘里也讲了类似问题。它们一开始以为云端 Agent 是本地 Agent 的自然延伸,后来发现难点不是把模型搬到服务器,而是给它一整套可以运行、验证、恢复的开发环境。

Cursor 复盘中的云端 Agent,不是把模型搬到服务器,而是需要独立虚拟机、并行运行和可恢复执行链。
这句话对非开发者也有用。你以后让 AI 帮你做公众号、剪视频、做客服、整理订单,真正难的也不是“模型会不会说”,而是它有没有正确的资料、正确的软件、正确的权限,以及出错后有没有能退回来的状态。

“开发环境就是产品”这类经验提醒小团队:Agent 的可靠性、依赖和编排,比模型口号更关键。
四、给 OPC:别先追全自动,先设计确认点
如果你是一个人做项目,这类能力最容易让人兴奋:晚上给 AI 一个任务,早上醒来收结果。听起来像多了一个夜班同事。
但一人公司最怕的也正是这个:没有第二个人帮你兜底。一个错误的删除、一次误发、一笔没看清的扣款,可能比省下来的半小时更贵。
我会把今天这条新闻拆成三个可执行动作。
第一,把你的 AI 工作流分成“可自动”和“必须确认”两类。整理资料、生成草稿、跑测试、截图、查找文件,可以先自动。发布、付款、删除、群发、导出客户数据,一律加人工确认。
第二,给每个 Agent 任务写清楚停止条件。不是只写“帮我处理一下”,而是写“只读这些文件,不要修改;如果遇到登录、支付、删除、授权弹窗,停下来问我”。
第三,把任务结果做成可复查输出。比如生成一份报告、截图、变更清单、失败原因,而不是只给一句“完成了”。Agent 越接近真实电脑,越需要留下痕迹。
五、移动端 Agent 也在靠近
同一天,Google 也发布了 ADK for Kotlin 和 ADK for Android 0.1.0,方向是让开发者在后端和 Android 设备上构建 AI Agent,并把云端模型与端侧模型组合起来。

Google ADK for Kotlin 和 Android 说明 Agent 正在进入后端与移动端,本地模型、云端模型和应用权限会被放进同一套任务链。
这和 Codex 的电脑使用放在一起看,趋势更清楚:Agent 不会只停在一个网页对话框里。它会进入桌面、云端虚拟机、移动端应用、本地模型和企业系统。
普通人不需要马上懂所有技术名词。你只要记住一句话:AI 助手越有用,越需要被框住。
六、冷静边界
第一,Computer Use 目前是特定平台和特定场景能力,不代表所有设备都能这样用。不要把它想成万能遥控器。
第二,授权不是形式。屏幕录制、辅助功能、应用访问,本质上都是高敏权限。你给 AI 的权限,应该像给真人外包同事的权限一样克制。
第三,未来真正有竞争力的 Agent,不是最敢点按钮的那个,而是最会在该停的时候停下来的那个。
所以这条新闻最值得看的,不是“AI 终于能锁屏干活了”。而是从今天开始,我们要学习一种新的工作习惯:把任务交给 AI,也把边界一起交代清楚。
参考来源
AIHOT 2026-05-22 日报:https://aihot.virxact.com/daily/2026-05-22OpenAI Developers:Computer Use / Locked use:https://developers.openai.com/codex/app/computer-use#locked-useCursor Blog:What we’ve learned building cloud agents:https://cursor.com/blog/cloud-agent-lessonsGoogle Developers:ADK for Kotlin and Android:https://developers.googleblog.com/en/adk-kotlin-android-building-ai-agents/
夜雨聆风