文 | 老K(下班后的AI研究员)
昨天下班刷到一条消息,差点从工位上弹起来。
OpenAI官方博客发了一篇文章,标题叫《Codex for (almost) everything》。
翻译成人话就是:Codex不再只是帮你写代码的,它现在能操控你Mac上的所有App了。
看屏幕、点按钮、打字、切换应用——全套人类操作,它都会了。而且是在后台默默干活,不影响你用电脑。
你的电脑,从此多了一个"影子员工"。
作为一个每天跟AI工具打交道的产品经理,我的判断是:这次升级不是"功能加点",是"物种进化"。从"对话式助手"到"自主式代理"——Codex跨过了那条线。
先说结论:
1. Codex能看屏幕+点鼠标+打字=操控Mac上所有应用
2. 多个AI同时后台干活,互不干扰
3. 它能记住你的偏好,还能给自己安排未来任务
4. 90+新插件打通了几乎所有主流开发工具
5. 目前仅macOS可用,全球300万+开发者已在使用
一、最大的变化:它能"看见"你的屏幕了
以前的Codex是什么?你跟它说"帮我写个Python脚本",它吭哧吭哧写完,你自己去跑。
现在呢?
它能看到你屏幕上显示的内容,用自己的光标去点按钮、输入文字、切换App。
技术上叫"Computer Use"(电脑使用能力),但这个名字太温和了。准确地说,它现在是一个能操控你整台电脑的AI代理。

多个终端窗口同时运行——Codex可以在后台帮你并行处理
它能做什么?举几个真实场景:
- 你在写PPT,让Codex后台帮你在Chrome里查资料,查完自动总结粘贴到Notion
- 你在开会,让Codex后台帮你在Figma里调设计稿的间距和颜色
- 你在摸鱼,让Codex后台帮你在终端里跑测试,发现bug自动修
- 关键是——这些操作不需要目标App有API。没接口?没关系,Codex像人一样看屏幕点鼠标
OpenAI的说法是:这让Codex能对任何安装在电脑上的应用进行自动化操控。
CNET给这次升级的定性是:"OpenAI超级应用战略的第一步。"
二、多智能体并行:3个AI同时帮你干活
一个AI不够?那就来三个。
这次升级最实用的功能之一:支持在Mac上并行运行多个Codex智能体。每个智能体独立处理不同的子任务,互不干扰,也不影响你自己的操作。
举个实际的工作流:
智能体A:在VS Code里重构后端API
智能体B:在浏览器里测试前端页面
智能体C:在GitHub上审查PR,定位问题代码
你自己:坐着喝咖啡,偶尔扫一眼进度
这不是科幻——这是OpenAI今天发布的真实功能。
他们甚至做了一个"Summary Pane"总结面板,让你一眼看清每个智能体在干什么、用了哪些资料、产出了什么结果。
三、记忆功能:它记得你喜欢什么
每次打开ChatGPT都要重新自我介绍?Codex现在有了Memory(记忆)功能。
它能记住:
- 你的编码风格偏好(用Tab还是空格、变量命名习惯)
- 你之前纠正过的错误(下次不再犯)
- 你的项目上下文(在做什么、用什么框架)
- 你收集过的信息(之前查的资料、做的笔记)
更厉害的是主动建议能力:它会综合你的项目上下文、插件数据和记忆,主动告诉你下一步该做什么。
OpenAI官方举的例子:Codex能识别你Google Docs中未处理的评论,从Slack、Notion、代码仓库拉取相关背景,整理成有优先级的行动列表,帮你开启工作日。
翻译成大白话:你的AI助手终于不是金鱼记忆了,而且它还会主动帮你安排今天的工作。
四、长期任务:它能给自己"安排"未来的活
这个功能最让我意外。
Codex现在支持线程复用——自动化任务可以复用已有的对话,继承历史上下文。更关键的是,它能给自己安排未来的任务。

桌面上多个窗口同时运行——这就是Codex多智能体并行的日常
实际场景:
- 今天让它审查一个PR,它审完后自动安排明天再看一次看有没有新评论
- 让它追踪一个Slack频道的讨论,每周自动汇总给你
- 一个任务没做完,跨天甚至跨周继续推进,不丢上下文
从"你说一步它做一步"变成"它自己规划、自己推进、自己交付"——这是AI从"助手"到"同事"的质变。
五、90+新插件:打通几乎所有开发工具
OpenAI这次一口气发了超过90种新插件,分三类:
再加上内置浏览器——开发者可以直接在网页上标注修改意见,Codex看到后自动改代码。前端开发的效率提升是指数级的。
六、跟普通人有什么关系?三个最直接的影响
影响1:"AI同事"不再是比喻
以前说"AI是你的同事",是个比喻。现在Codex真的能像同事一样:看屏幕、操作应用、多线程干活、记住你的偏好、自己安排明天的工作。
差别只有一个:它不要工资。
影响2:没有API的应用也能自动化了
以前想自动化一个操作,前提是人家有API。那些"老古董"软件、封闭系统、内部工具?只能手动。
现在Codex通过"看屏幕+点鼠标"的方式,理论上能自动化任何你能手动操作的事情。
副业场景想象:
- 让Codex帮你批量发布内容到多个平台(公众号/小红书/知乎/头条)
- 让Codex帮你监控竞品的价格变动,发现降价自动截图通知你
- 让Codex帮你自动化客服回复——看到客户消息,查知识库,写回复,发送
- 让Codex帮你批量处理Excel/PDF文件,即使那个软件没有Python库
影响3:开发者的工作方式要变了
不是"AI帮你写代码"这种程度的变——是"你变成指挥官,AI变成执行团队"这种程度的变。
你的角色从"动手写"变成"动嘴指挥+审查质量"。这对所有写代码的人来说,既是解放,也是挑战。
七、泼点冷水
第一,"Computer Use"目前仅macOS可用。Windows和Linux用户?等着。EU和UK用户也在排队。
第二,模拟人类操作=速度不快。像人一样点鼠标打字,效率远不如直接调API。适合自动化"必须手动操作"的场景,但别指望它替代所有脚本。
第三,安全问题。你真的放心让一个AI在后台操控你的电脑?它如果点错了什么,后果谁承担?目前OpenAI没有公布详细的安全机制。
第四,Anthropic的Claude Code已经在编程领域把ChatGPT按了好几个月了。Codex这次是在"编程之外"的战场发力——系统操控、多智能体、记忆。但核心编程能力能不能追上Claude,还得看实测。
八、我的判断
OpenAI这次的战略意图很明确:不跟Claude在"纯编程"赛道死磕,而是把Codex变成一个"全能AI工作站"。
写代码是基本功,操控电脑是升维打击。
对于普通人来说,最大的信号是:AI正在从"对话框里的工具"变成"桌面上的同事"。这个转变的速度,比大多数人预期的快得多。
不需要现在就慌——macOS首发、功能还在早期、体验未必完美。但你需要开始思考一个问题:
当AI能帮你操控电脑干活的时候,你的不可替代性在哪里?
答案不是"学会用AI",而是"学会指挥AI"。
作者:老K | 31岁产品经理 | 深圳
公众号「下班后的AI研究员」
每天深度拆解一个AI热点,帮你把AI变成赚钱工具。
觉得有用?转发给你那个还在手动操作电脑的同事。
夜雨聆风