导语:今天凌晨,OpenAI 悄悄推送了 Codex 有史以来最大的一次更新。它不再只是写代码——它现在可以看着你的屏幕,自己点击、输入、操作你电脑上的所有应用,而且全程在后台,不影响你工作。这一次,AI Agent 真正越过了「聊天框」的边界。
一、这次更新到底发生了什么
OpenAI 发布公告的标题叫:《(几乎)万事皆可用的 Codex》。
这不是营销话术,是字面意思。
本次更新的核心能力清单:
① Computer Use(计算机使用)
Codex 现在可以直接操作你 Mac 上的所有应用——看屏幕、点击、输入,像人一样。关键是:全程后台运行,不抢你的电脑。你继续干你的活,它在后台帮你干它的活。多个 Agent 可以同时并行,互不干扰。
② 内置浏览器 + 网页标注
Codex 自带浏览器,你可以直接在网页上用评论标注的方式给 AI 下指令。前端开发者和产品经理最爱——不用截图、不用描述,直接在页面上圈出来说"改这里"。
③ 图像生成
接入了 gpt-image-1.5,可以直接生成产品设计图、界面原型。开发者不需要再切到 ChatGPT 或 Midjourney,在 Codex 里一站解决。
④ 记忆能力
Codex 开始记住你的偏好、历史修正、工作习惯。下次执行任务时,它知道你喜欢什么风格的代码、你的团队有哪些规范,不用每次重复交代。
⑤ 自动调度(Automations)
你可以给 Codex 安排未来的任务:「每天早上9点检查 GitHub Issues,生成优先级清单」。它会自己唤醒、自己执行,定期汇报。AI 从工具变成了长期运行的任务代理。
⑥ 111 个插件
覆盖代码管理、持续集成、项目协作、数据处理,结合 MCP(模型上下文协议)服务,让 AI 能获取更完整的上下文并执行复杂操作。
二、Computer Use 是什么,为什么重要
Computer Use(计算机使用)这个概念,Anthropic 去年就提出来了,Claude 率先实现了「让 AI 操作浏览器」的能力。
但 Codex 这次的实现更进了一步:不只是浏览器,是你电脑上的所有应用。
理解这件事的意义,需要先理解当前 AI Agent 的核心瓶颈:
瓶颈:没有 API 的地方,AI 进不去。
传统的 AI 自动化,依赖 API 接口。没有 API 的软件,AI 就束手无策。你的设计软件、你的 CRM 系统、你公司内部的老系统……这些都没有 API,AI 以前完全没办法碰。
Computer Use 的出现,把这道墙拆了。
AI 现在可以像人一样操作任何软件——只要人能看着屏幕用,AI 就能用。不需要 API,不需要集成,直接上。
这是一个质变,不是量变。
三、和 Claude Code 的正面交锋
OpenAI 没有掩饰这次更新的竞争意图。
这次 Codex 更新,明显是对标 Anthropic 的 Claude Code。
过去半年,Claude Code 在开发者圈子里口碑极好——深度代码理解、长上下文、复杂任务执行能力强。不少开发者已经把 Claude Code 当成主力编程助手,甚至从 GitHub Copilot 迁移过来。
Codex 这次的反击是全面的:
- Claude Code 有 Computer Use → Codex 也有了,而且支持更多本地应用
- Claude Code 有长上下文 → Codex 加了记忆能力,跨会话记住你
- Claude Code 有工具调用 → Codex 上线 111 个插件 + MCP 支持
- Claude Code 适合开发者 → Codex 加了图像生成,往产品设计延伸
但两者目前仍有差异:
Codex 的 Computer Use 目前只支持 Mac,Windows 用户能用核心功能,但不能实现光标级的后台交互。这是一个明显的短板。
Claude Code 在代码理解的深度上,仍然被不少开发者认为更强,尤其是在大型代码库的分析上。
两个工具现在都值得用,取决于你的场景。
四、OpenAI 的更大野心:超级应用
Codex 这次更新不是终点,是 OpenAI 更大计划的一部分。
OpenAI 上个月已经确认:正在开发一款桌面端「超级应用」,将 ChatGPT、Codex、Atlas 浏览器整合为统一的使用体验。
Codex 负责人 Thibault Sottiaux 在媒体沟通会上直白表示:「我们正在以公开透明的方式打造这款超级应用。」
这意味着什么?
AI 的竞争正在从「模型层」转向「操作系统层」。
以前大家比的是谁的模型更聪明。现在大家比的是谁的 AI 能更深地嵌入你的工作流——你的电脑、你的文件、你的应用、你的日程。
Codex 的 Computer Use,就是在争夺这个入口。
五、实际意味着什么:场景拆解
对开发者:
最直接的价值是测试和调试自动化。以前需要手动点点点验证 UI 的场景,现在可以让 Codex 在后台自动跑。配合内置浏览器的网页标注功能,前端开发的迭代速度会明显提升。
自动调度功能对独立开发者尤其有用——让 Codex 每天自动检查 Issues、跑测试、生成报告,你只需要看结果。
对产品经理:
网页标注 + 图像生成的组合,可以大幅加速原型设计。在页面上直接标注「这里改成这样」,Codex 生成新的设计稿,不需要再用 Figma 画半天。
对非技术用户:
Computer Use 的潜力在于:它让 AI 帮你操作那些不懂怎么用的软件。不会用 Excel 的复杂函数?让 Codex 帮你操作。不知道怎么配置某个软件?让 Codex 看着屏幕帮你做。
当然,这个场景目前还需要一定的操作门槛,普通用户还需要等产品进一步打磨。
六、需要注意的几个问题
1. Mac 独占的 Computer Use
Windows 用户目前无法体验光标级后台交互,这是一个明显的限制。OpenAI 没有给出 Windows 支持的时间表。
2. 安全边界
让 AI 在后台操作你的电脑,带来的安全问题不容忽视。你需要明确:
- Codex 能访问哪些应用?
- 它的操作记录存在哪里?
- 如何防止误操作?
目前 OpenAI 对这些问题的透明度不高,建议先在非关键场景测试。
3. 记忆能力的隐私问题
Codex 记住你的偏好和历史操作,意味着你的工作习惯数据在 OpenAI 的服务器上。企业用户需要评估合规风险。
4. 插件质量参差不齐
111 个插件一次性上线,质量不可能整齐划一。建议先用核心功能,插件慢慢筛选。
七、行动清单
现在可以做的:
- Mac 用户:更新 Codex 桌面客户端,测试 Computer Use 功能,找一个你每天重复做的操作,让它帮你自动化
- 所有开发者:试用内置浏览器的网页标注功能,用在前端调试场景
- 关注 Automations:设置一个简单的定时任务(如每日 GitHub Issues 汇总),感受 AI Agent 长期运行的能力
暂时观望的:
- Windows 用户:Computer Use 核心功能等后续更新
- 企业用户:等待 OpenAI 发布更详细的数据安全说明再大规模接入
八、一句话总结
Codex 这次更新,是 AI 第一次真正越过「聊天框」,坐进了你的操作系统。
它不再是你问它答的工具,而是一个可以在后台自主运行、操作软件、调度任务、记住你习惯的 Agent。
这个方向,比「更聪明的模型」更重要。
因为聪明的模型,大家都会有。但深入你工作流的 Agent,才是真正难以替代的护城河。

夜雨聆风