OpenClaw还没整明白,Codex又来了,这回不只是程序员工具,更是你的电脑助手

说一个我的真实感受:AI变化太快了,快到你刚学会用一个工具,它就已经变了。
上周OpenAI给Codex做了一次大更新,Sam Altman自己出来说——Codex正在经历”ChatGPT时刻”。
我当时心想,又一个ChatGPT时刻?
结果去看了实测视频,还真有点被震到。
有人让Codex干三件事:修一段有噪声的音频、给播客做封面图、生成一段AI视频。三件事跨三个Adobe专业软件——Audition、Photoshop、Firefly。
全程这个人没碰鼠标,没碰键盘。Codex自己在电脑上切换窗口、点按钮、调参数、导出文件。
你看过《钢铁侠》吗?就是那种感觉。贾维斯在操作电脑,Tony Stark在旁边看着。
但这不是科幻片。这是2026年5月真实发生的事。

Codex到底是什么 ?
很多人一听”Codex”就觉得跟自己没关系——我又不写代码。
三个月前这么想是对的。现在不对了。
Codex是OpenAI对标Claude Code的产品,最早确实是个编程工具。但这次更新之后,它往里塞了六块能力:Computer Use(操作你的电脑)、内置浏览器、图像生成、90多个新插件、记忆、自动化。
Codex的负责人说了一句话:每周超过300万开发者在用Codex,其中50%已经不只是拿它写代码了。
你看这个数字——一半的人已经不是在用它编程了。
它更像什么?像一个坐在你电脑前、会用所有软件的助手。你不用告诉它怎么操作Photoshop,它自己会打开、会调参、会导出。你只需要说”帮我做一张XX风格的封面”。

为什么Codex突然压过Claude Code?
说实话,Claude Code在编程能力上一直是行业标杆。SWE-bench测试80.8%的得分,至今最高。它的AGENTS.md、子智能体架构、多Agent协作,都是行业引领者。
但Codex走了一条不同的路。
Claude Code是终端工具,黑底白字,命令行操作。对程序员来说很爽,对普通人来说——你让一个不会用终端的人去跑Claude Code,等于让一个不会开车的人去开赛车。
Codex做了一个有界面的桌面应用。打开就能用,不用配环境,不用敲命令。然后它加了一个杀手锏:Computer Use。
Claude的Computer Use今年3月就上了,但是走的研究路线,独立模式,需要配置。OpenAI直接把Computer Use打包进Codex主界面,点一下安装插件就行。
还有一个现实因素:GPT-5.5真的变强了。有人拿同一个复杂任务分别跑Codex和Claude Code,Codex一次就搞定了,Claude Code要好几个来回。当然这不代表Codex全面碾压——处理复杂本地代码库的时候Claude Code还是更强。但对普通人来说,”一次搞定”这个体验太重要了。

OpenClaw、Claude Code、Hermes Agent、Codex怎么选 ?
有人可能会问:OpenClaw不是也能操作电脑吗?
对,OpenClaw是我现在每天在用的工具。它确实能控制鼠标、键盘、浏览器,甚至能接飞书、接手机。而且它开源免费。
但有个很现实的问题——OpenClaw的配置门槛不低。纯命令行,需要自己配模型、配API Key、写配置文件。我用了好一阵子才折腾明白。Codex的Computer Use本质上是把类似OpenClaw的能力做成了GUI版本,有界面、有项目隔离、有一键安装。OpenClaw能做的它基本都有,还多了OpenAI原厂的支持。
有意思的是,OpenClaw的创始人Peter Steinberger后来加入了OpenAI。所以Codex这次的Computer Use,某种意义上就是OpenClaw理念的官方版本。
至于Hermes Agent,走的是另一个方向——专注做好AI Agent的协作和调度,更像是一个后台的智能调度中心,不直接操作你的电脑界面。
所以如果你问我这几个工具怎么选:
- 你会写代码、追求极致能力
→Claude Code - 你要操作电脑、做日常工作的自动化
→Codex(或者OpenClaw,如果你不怕折腾) - 你要多Agent协作、后台调度
→Hermes Agent - 你不想花钱、愿意折腾、想自己掌控一切
→OpenClaw

变化太快,亦步亦趋就行
老实说,看完Codex这一波更新,我没有兴奋,反而有一点点焦虑。
不是因为害怕AI替代我。而是——变化太快了。
三个月前Claude Code还是编程Agent之王,三个月后风向就变了。你刚搞明白MCP是什么,Codex已经出了90个插件。你刚学会用Computer Use,它已经能自动操作Adobe全家桶了。
学不完。真的学不完。
但后来我想明白了。Codex的负责人Alexander在采访里说了一句话,我觉得特别好。他说:
「我以为多模态(视频、音频)的进展会更快。实际上,通过代码操控电脑的代理才是正道。」
翻译成大白话:AI不需要变得更像人,它需要变得更能干活。
所以作为普通用户,你不需要追着每个新工具跑。你只需要想清楚一件事:你的工作里,有哪些动作是重复的、可以被说清楚的、结果可以被检查的?
这些动作,就是AI能帮你干的。
不是AI来了你要学编程。是AI终于学会了用你的电脑。
方向没错,亦步亦趋,就行了。
真实经历总结,AI辅助内容生成
夜雨聆风