OpenAI刚给你的Mac加了个影子员工:能看屏幕、点应用、3个同时帮你干活

文 | 老K（下班后的AI研究员）

昨天下班刷到一条消息，差点从工位上弹起来。

OpenAI官方博客发了一篇文章，标题叫《Codex for (almost) everything》。

翻译成人话就是：Codex不再只是帮你写代码的，它现在能操控你Mac上的所有App了。

看屏幕、点按钮、打字、切换应用——全套人类操作，它都会了。而且是在后台默默干活，不影响你用电脑。

你的电脑，从此多了一个"影子员工"。

作为一个每天跟AI工具打交道的产品经理，我的判断是：这次升级不是"功能加点"，是"物种进化"。从"对话式助手"到"自主式代理"——Codex跨过了那条线。

先说结论：

1. Codex能看屏幕+点鼠标+打字=操控Mac上所有应用

2. 多个AI同时后台干活，互不干扰

3. 它能记住你的偏好，还能给自己安排未来任务

4. 90+新插件打通了几乎所有主流开发工具

5. 目前仅macOS可用，全球300万+开发者已在使用

一、最大的变化：它能"看见"你的屏幕了

以前的Codex是什么？你跟它说"帮我写个Python脚本"，它吭哧吭哧写完，你自己去跑。

现在呢？

它能看到你屏幕上显示的内容，用自己的光标去点按钮、输入文字、切换App。

技术上叫"Computer Use"（电脑使用能力），但这个名字太温和了。准确地说，它现在是一个能操控你整台电脑的AI代理。

多个终端窗口同时运行——Codex可以在后台帮你并行处理

它能做什么？举几个真实场景：

- 你在写PPT，让Codex后台帮你在Chrome里查资料，查完自动总结粘贴到Notion

- 你在开会，让Codex后台帮你在Figma里调设计稿的间距和颜色

- 你在摸鱼，让Codex后台帮你在终端里跑测试，发现bug自动修

- 关键是——这些操作不需要目标App有API。没接口？没关系，Codex像人一样看屏幕点鼠标

OpenAI的说法是：这让Codex能对任何安装在电脑上的应用进行自动化操控。

CNET给这次升级的定性是："OpenAI超级应用战略的第一步。"

二、多智能体并行：3个AI同时帮你干活

一个AI不够？那就来三个。

这次升级最实用的功能之一：支持在Mac上并行运行多个Codex智能体。每个智能体独立处理不同的子任务，互不干扰，也不影响你自己的操作。

举个实际的工作流：

智能体A：在VS Code里重构后端API

智能体B：在浏览器里测试前端页面

智能体C：在GitHub上审查PR，定位问题代码

你自己：坐着喝咖啡，偶尔扫一眼进度

这不是科幻——这是OpenAI今天发布的真实功能。

他们甚至做了一个"Summary Pane"总结面板，让你一眼看清每个智能体在干什么、用了哪些资料、产出了什么结果。

三、记忆功能：它记得你喜欢什么

每次打开ChatGPT都要重新自我介绍？Codex现在有了Memory（记忆）功能。

它能记住：

- 你的编码风格偏好（用Tab还是空格、变量命名习惯）

- 你之前纠正过的错误（下次不再犯）

- 你的项目上下文（在做什么、用什么框架）

- 你收集过的信息（之前查的资料、做的笔记）

更厉害的是主动建议能力：它会综合你的项目上下文、插件数据和记忆，主动告诉你下一步该做什么。

OpenAI官方举的例子：Codex能识别你Google Docs中未处理的评论，从Slack、Notion、代码仓库拉取相关背景，整理成有优先级的行动列表，帮你开启工作日。

翻译成大白话：你的AI助手终于不是金鱼记忆了，而且它还会主动帮你安排今天的工作。

四、长期任务：它能给自己"安排"未来的活

这个功能最让我意外。

Codex现在支持线程复用——自动化任务可以复用已有的对话，继承历史上下文。更关键的是，它能给自己安排未来的任务。

桌面上多个窗口同时运行——这就是Codex多智能体并行的日常

实际场景：

- 今天让它审查一个PR，它审完后自动安排明天再看一次看有没有新评论

- 让它追踪一个Slack频道的讨论，每周自动汇总给你

- 一个任务没做完，跨天甚至跨周继续推进，不丢上下文

从"你说一步它做一步"变成"它自己规划、自己推进、自己交付"——这是AI从"助手"到"同事"的质变。

五、90+新插件：打通几乎所有开发工具

OpenAI这次一口气发了超过90种新插件，分三类：

类别	代表插件	能干什么
技能插件	图像生成(gpt-image-1.5)	在开发流程中直接生成/修改图片
应用集成	CircleCI、GitLab、Microsoft Suite	打通CI/CD、项目管理、办公套件
MCP服务器	Neon by Databricks、Render	跨平台上下文获取，跨工具执行任务

再加上内置浏览器——开发者可以直接在网页上标注修改意见，Codex看到后自动改代码。前端开发的效率提升是指数级的。

六、跟普通人有什么关系？三个最直接的影响

影响1："AI同事"不再是比喻

以前说"AI是你的同事"，是个比喻。现在Codex真的能像同事一样：看屏幕、操作应用、多线程干活、记住你的偏好、自己安排明天的工作。

差别只有一个：它不要工资。

影响2：没有API的应用也能自动化了

以前想自动化一个操作，前提是人家有API。那些"老古董"软件、封闭系统、内部工具？只能手动。

现在Codex通过"看屏幕+点鼠标"的方式，理论上能自动化任何你能手动操作的事情。

副业场景想象：

- 让Codex帮你批量发布内容到多个平台（公众号/小红书/知乎/头条）

- 让Codex帮你监控竞品的价格变动，发现降价自动截图通知你

- 让Codex帮你自动化客服回复——看到客户消息，查知识库，写回复，发送

- 让Codex帮你批量处理Excel/PDF文件，即使那个软件没有Python库

影响3：开发者的工作方式要变了

不是"AI帮你写代码"这种程度的变——是"你变成指挥官，AI变成执行团队"这种程度的变。

你的角色从"动手写"变成"动嘴指挥+审查质量"。这对所有写代码的人来说，既是解放，也是挑战。

七、泼点冷水

第一，"Computer Use"目前仅macOS可用。Windows和Linux用户？等着。EU和UK用户也在排队。

第二，模拟人类操作=速度不快。像人一样点鼠标打字，效率远不如直接调API。适合自动化"必须手动操作"的场景，但别指望它替代所有脚本。

第三，安全问题。你真的放心让一个AI在后台操控你的电脑？它如果点错了什么，后果谁承担？目前OpenAI没有公布详细的安全机制。

第四，Anthropic的Claude Code已经在编程领域把ChatGPT按了好几个月了。Codex这次是在"编程之外"的战场发力——系统操控、多智能体、记忆。但核心编程能力能不能追上Claude，还得看实测。

八、我的判断

OpenAI这次的战略意图很明确：不跟Claude在"纯编程"赛道死磕，而是把Codex变成一个"全能AI工作站"。

写代码是基本功，操控电脑是升维打击。

对于普通人来说，最大的信号是：AI正在从"对话框里的工具"变成"桌面上的同事"。这个转变的速度，比大多数人预期的快得多。

不需要现在就慌——macOS首发、功能还在早期、体验未必完美。但你需要开始思考一个问题：

当AI能帮你操控电脑干活的时候，你的不可替代性在哪里？

答案不是"学会用AI"，而是"学会指挥AI"。

作者：老K | 31岁产品经理 | 深圳

公众号「下班后的AI研究员」

每天深度拆解一个AI热点，帮你把AI变成赚钱工具。

觉得有用？转发给你那个还在手动操作电脑的同事。