有人问 Riley Brown——带着 7 个工程师全体切换到 Codex 的人——你现在还用 Claude Code 吗?
他没有直接回答。他按下 Command J,打开终端,输入 claude,然后说:"当然用。在 Codex 里面用。"
这大概是我听过的最能说明问题的回答。
Greg Isenberg 主持的这期播客,开场就坦白:我从没下载过 Codex,也不在那个圈子里。他把 Riley 叫来,让对方"说服我"。
两个人聊了一个多小时。Greg 一开始半信半疑,结尾时说了一句话:"你基本上是在说,Codex 是做最多事情最快的方式。"
Riley 回答:"是的。"
我把这段对话从头到尾梳理了一遍,把最值得记录的东西写下来。
先说结论:为什么 2025 年的终端界面,让位给了 2026 年的 GUI
Riley 用了一个对比:
2025 年,是 TUI(终端界面)的时代。Claude Code 在终端里跑,你要写 CLAUDE.md,要手动创建 skill 文件,要忍受没有图形化的一切。
"那段日子我很怀念,"他说,"在终端里用 Claude Code,真的很有趣。"
但有趣归有趣,问题是:90% 的人不想打开终端。
商业端的人,市场运营的人,创业者,内容创作者——他们需要 AI agent 帮自己干活,但他们不想学命令行。
所以所有公司现在都在收敛到同一个界面设计:「左边是对话列表,中间是 AI,右边是 AI 正在操作的东西。」
Claude 的桌面版在做,Cursor 在做,Codex 也在做。
区别只有一个:「Riley 认为 Codex 目前做得最好。」
Codex 到底是什么?一句话说清楚
官方介绍不重要,Riley 给的定义更实用:
❝Codex 是一个状态最先进的 AI agent,跑在你的电脑上,可以帮你构建 app、创建任何类型的文档、控制你的电脑、以及创建自动化流程。
❞
关键词:「一个界面,全部搞定。」
你不需要打开 Claude 写文档、打开 Cursor 写代码、打开 Notion 做研究、打开 Zapier 配自动化。
Codex 里面:
写 Word 文档 ✓ 做 PPT ✓ 跑代码、构建 app ✓ 导出到 Canva ✓ 连接 Notion、Slack、Gmail ✓ 设置定时自动化任务 ✓
Riley 举了个例子:他让 AI 帮他分析 Greg 的 YouTube 频道,找出"Greg 做错了什么",写成一份批评报告。做完之后,他直接说:"好,把这个变成每周五早上 9 点自动执行的任务。"
AI 回答说好,然后就创建了这个定时任务。
就这么简单。
关于 Claude Co-work 的那段批评,值得单独说
Riley 说了一句话,可能会冒犯一些人:
"我之所以从 Claude 转走,很大一部分原因是他们把 Claude Code 和 Co-work 拆开了。"
Anthropic 的逻辑是:做知识工作的人用 Co-work,写代码的人用 Claude Code。两个产品,两套权限,两套限制。
Riley 不理解这个逻辑。他认为这是人为制造的割裂。
"我为什么不能在一个界面里既写代码,又生成文档?为什么我必须在两个产品之间来回切换?"
他没有恶意,他只是觉得——「这是一个产品决策,不是技术限制。」
而 Codex 正好在这里打了进来。
(当然,你也可以在 Codex 的终端里跑 Claude Code,所以这并不是"放弃 Claude",更像是"把 Claude 包进来用"。)
Browser Use:从"有点意思"到"真的快了"
Riley 说,在这之前,他对 browser use 一直半信半疑。
"很酷,但是慢。像拨号上网一样慢。"
然后他在 Codex 里试了一次:让 AI 做一个棋盘游戏,然后用 browser use 控制浏览器,让 AI 自己下棋,黑白双方都是 AI。
他录下来了。你可以看到鼠标在屏幕上移动,落子,换方,继续落子——流畅,快速,连贯。
"这是我第一次看到 browser use,心想:哦,它真的开始快了。"
他接着说了一个预测,我觉得比任何 AI 发布会都更值得认真对待:
「"三个月之内,AI 控制浏览器的速度,会跟人类一样快。"」
如果这是真的,意味着什么?
意味着你现在能做的每一件"需要打开浏览器操作"的事情,都可以委托给 AI。
不是"让 AI 帮你想",是"让 AI 帮你做"。
Skills、Plugins、MCPs——这些词说的其实是同一件事
Riley 对这堆术语做了一个非常接地气的总结:
"我把这些词全部叫做 skills。就是给你的 AI 装备工具,让它能用你已经在用的软件。"
Codex 里:
「Plugins」:官方集成,需要 OpenAI 审核。Slack、Notion、Canva、Remotion、Expo 都是 plugin。 「Skills」:你自己创建的。一个 skill 本质上就是一个文件夹 + 一个 skill.md指令文件。
创建 skill 的方法:直接告诉 AI,"帮我创建一个 skill,每次我要做 X 事情,就用这个 skill。"
AI 会问几个问题,然后自动生成。
Riley 展示了他自己创建的一个 skill:「YouTube researcher」——输入一个 YouTube 频道,自动拉取最近 10 个视频的字幕,生成分析报告。
这个 skill 是他自己在 Codex 里创建的,花了几分钟。
Chronicle:最有争议的新功能
Codex 最近推出了一个叫 「Chronicle」 的功能。
它的作用:「持续观察你的屏幕,把你在做什么存成 AI 的记忆。」
这样当你切换任务、开新对话时,AI 已经知道你在干什么,不需要你再重新解释背景。
Riley 的态度很坦诚:"我测了两天,还不知道效果好不好。我是个测试狂,开了所有权限。但我不建议你不经了解就开这个功能。"
优点很明显:不用再重复解释自己在做什么。
隐患也很明显:你的屏幕内容会被持续记录。
如果你用的是工作电脑,存有敏感信息,这个功能需要谨慎评估。
GPT 5.5 和 Images 2.0
这两个是 Codex 里内置的。
Riley 对 GPT Images 2.0 的评价:
"这不是在争论。它就是目前最好的图像模型。没有之一。"
你可以让 Codex 生成 10 个不同版本的缩略图,然后把它们放进 Word 文档、PPT 或者网页里。
关于 GPT 5.5 的价格:通过 API 调用比 5.4 贵一倍,也比 Opus 4.7 贵 20%。
但 Riley 的观察是:「它更"懂你的意图",所以往往更直接地给出你想要的结果,消耗的 token 反而可能更少。」
他的判断:衡量模型价值的标准,不应该是 token 效率,而是"完成一个任务花了多少钱和时间"。
Remotion:写代码生成视频,不是玩笑
「Remotion」(Codex 有官方 plugin)可以用代码生成动态图形视频。
AI 会写代码,Remotion 把代码渲染成视频。
Riley 创建了一个叫 「Internet Image Puller」 的 skill:输入一个品牌名,AI 自动抓取这个品牌的 logo、颜色、字体、图片,打包成 HTML 文件,然后 Remotion 直接调用这些素材生成视频。
结果:品牌视频,一次 prompt,全自动。
他说他们有几个 Remotion 视频超过了 100 万次观看。
给第一天用 Codex 的人:4 件事
Riley 给出了具体的入门路径:
「第一件事:玩一个游戏,然后让 AI 用 browser use 跟自己下棋。」
目的不是做出什么有用的东西,是让你直观感受 AI 控制浏览器是什么感觉。这个感受会改变你对未来的预期。
「第二件事:让 AI 做一项深度研究,然后转成三种格式。」
输入一个你真正感兴趣的主题,让 AI 用最大算力搜索,把所有信息整理成表格,然后生成一份 Word 文档和一份 PPT。
目的:感受"一个平台生成所有类型内容"是什么体验。
「第三件事:做一个 3D 模拟,或者尝试 one-shot 一个移动 app。」
Riley 用一个 prompt 生成了一个复刻 Replit 的 vibe coding 工具——生成时间花了 80 分钟,但是一次成功了。
「第四件事:列出你每天最烦的一件重复性工作,把它变成自动化任务。」
先手动做一次,让 AI 观察你是怎么做的,然后告诉它:"把这个变成每周 X 自动执行的任务。"
Riley 的建议:「先做,再自动化。不要试图在没做过之前就设计自动化。」
一个关于工具迁移的老实话
Riley 说了一句话,我觉得很重要:
"我不会嘲笑任何人用任何工具。如果你在 Cursor 里用 Claude Code,那就很好用,就继续用。从一个热门工具跳到另一个热门工具,不是正确的策略。"
他自己切换到 Codex,是因为他带的 7 个工程师也都切过来了,大家在一起用,觉得"真的很好",然后他们在此基础上建立了整个工作流。
这不是冲动,是系统性的评估之后的决定。
所以,如果你现在用的工具已经在运转——不用为了赶时髦而切换。
但如果你正在寻找一个"能把所有事情放进一个界面"的工具,可以认真看一下 Codex。
「你现在用的是什么 AI 工具组合?评论区告诉我——是 Claude Code + Cursor,还是已经切过来了?」
❝原文链接:https://www.youtube.com/watch?v=LWx4FGam2aQ&t=1804s
❞
夜雨聆风