乐于分享
好东西不私藏

不会写代码的 PM,用 Codex App 一个下午做出了 6 个产品

不会写代码的 PM,用 Codex App 一个下午做出了 6 个产品


Claude Code 用户 / PM / 副业人 / 不碰代码的产品人,这篇写给你们。


一个下午,一个人,6 个产品全跑完 · 从 iOS App 到投资人 Deck。

设计稿、实际代码、落地页、Tally 表单、Remotion 启动视频、投资人 Deck、Vercel 真实上线、TestFlight 真机可分发 · 8 个环节、6 个产品,一个人,一个 App 里全跑完。这不是模拟器截图,是真实上线可分发的交付。

Codex App 不是又一个 AI 编程工具,是 OpenAI 把 AI Agent 做成了一套操作系统。

Projects 项目管理 + Automations 定时自动化 + Skill API 自定义能力 + 111 个内置插件 + Local / Worktree / Cloud 三种运行模式。组合起来才是”操作系统”三个字的意思 · 多任务并发、后台任务自己跑、能力可以扩展、环境可以切换。

产品还没对大众开放,ChatGPT Plus / Pro / Business 的开发者用户能下载 Developer Preview。Twitter 上 2.8 万播放、484 点赞、938 个书签 · 书签是”我要回来”的行为,不是”点完走人”。

这篇是给这几批人看的 ·
– Claude Code 的老用户,§ 六告诉你一件让人不舒服但必须想清楚的事 · 你在 AI 工具分层里到底站哪个位置
– PM / 副业人 / 独立开发者,4 大功能怎么配 + 6 个产品怎么并发 + 第一个副业 MVP 怎么开工
– 不碰代码的产品人,AI 从工程师玩具变成操作系统的那个节点已经到了,调度层的工具长这个样


§ 一 先说清楚这是什么 · 别跟 Codex CLI 搞混

OpenAI 叫 Codex 的东西至少有 3 个。

第一个是 2021 年那个 Codex,代码补全模型,给早期的 GitHub Copilot 用,已经退役了。第二个是 Codex CLI,OpenAI 去年放出来的命令行工具,终端里敲命令跟模型交互,偏工程师。

第三个是这次发布的 Codex 桌面 App,一个 GUI 应用。这两个不是同一个产品。

底层模型 GPT-5.4,默认推理档位 Extra High。官方口号 Build faster with Codex, A coding agent that helps you build and ship with AI。

已经在用的企业客户,Duolingo、Vanta、Virgin Atlantic、Miro、Rakuten。都是海外头部科技公司,直接进入生产环境的那批。

它跟 Claude Code 不在一个形态上。Claude Code 是终端 CLI,工程师舒服;Codex App 是桌面 GUI,侧边栏 + 面板 + 内置终端 + 插件市场,更像一个”能跑 Agent 的操作系统壳子”,后面几节你会看到具体差别。

为啥 OpenAI 要做 Super App 而不是继续加强 CLI。因为 CLI 这个形态天然圈住了工程师,想要触达”不碰代码的产品人 / PM / 副业人”,必须换形态。GUI 面板 + 111 个开箱插件 + 无代码 Automation,这三件事凑在一起才能把 AI agent 从”程序员的玩具”变成”每个人的操作系统”。

CLI 给工程师用,App 给所有人用。这一步,OpenAI 迈过来了。


§ 二 功能 ① · Projects 项目管理 · 多项目并行不用多开终端

核心价值一句话 · 把”多对话”收进”多项目”,每个项目底下跑多条并行的 Agent 线程,开着 5 个项目不乱。

怎么用 · 完整操作步骤

  1. 1. 左侧边栏,点 New chat 上面那个 Projects 图标,进入项目列表
  2. 2. 右上角 Create Project,填项目名字和描述(比如”闲鱼机器人项目” / “副业周报自动化”)
  3. 3. 进 Project 内部,侧边出现 Thread 列表(每个 Thread 就是一条对话线程)
  4. 4. 点 New Thread,每条 Thread 独立跑自己的 Agent,互不干扰
  5. 5. 右侧 Project sidebar(默认展开,在主面板右边),统一看所有 Thread 状态,谁跑完了谁卡住了一目了然
  6. 6. 队列区域里待执行的消息可以拖动重排,想先跑哪个拖到最上面
  7. 7. 同一条 Thread 可以从某条消息处 Fork 出新分支(右键消息 → Fork from here),等于”我这个方向试试看,不行回到原路”

Projects 的完整能力清单

Projects 模块的细节能力,列出 7 条 ·

  • – 多项目(Multiple projects)
  • – 并行 Agent 线程(Parallel agent threads)
  • – 对话分叉(Conversation forking),刚才第 7 步说的 Fork
  • – Handoff between Local and Worktree,本地跑着跑着切到分支隔离模式继续
  • – Queue message reordering,待执行消息重排
  • – Thread 重命名 / 搜索 / 跳最近
  • – 整个 Project 下所有本地 Thread 一键归档

跟 Claude Code 对照着看

Claude Code 走 CLI,多任务靠你手动 tmux 或者多开几个终端窗口。你得自己记住哪个窗口在干哪个项目,session 管理完全靠肌肉记忆,关机重启全丢。Codex App 把这一层做成可视化面板,状态持久化,对”同时推多个副业又不想被配置卡住”的人来说,门槛差了一个台阶。

避坑

Thread Fork 这个功能很容易被忽略,但它解决的问题非常具体 · 你让 Agent 做一个需求,它给了方案 A,你想”要不试试方案 B”,但又不想废掉方案 A 的上下文。这时候 Fork 出去试 B,B 不成再回 A 继续。这是 Claude Code 里要手动备份 session 才能做到的事。

副业人手头 5 个项目(一个 iOS App、一个公众号、一个闲鱼店、一个 Discord bot、一个博客),不用 5 个终端窗口了,一个 App 全装下,项目之间切换不用重新装上下文。


§ 三 功能 ② · Automations 定时自动化 · 不写 cron 不碰 crontab

核心价值一句话 · 自然语言指令就能建一个定时触发的 Agent 任务,不写一行代码,不配 cron 表达式。

怎么用 · 完整操作流程(以日历周报为例)

  1. 1. 在 Plugins 面板连上 Google Calendar 和 Gmail(这两个是 Codex App 内置插件,点击 Authorize 授权一次就成)
  2. 2. 新开一条对话,输入”列出本周日历事件”
  3. 3. Agent 自动调 Calendar 插件,读本周事件,返回结构化清单
  4. 4. 继续输入”把这份周报发邮件给我”
  5. 5. Agent 自动调 Gmail 插件,填主题、填正文、发送
  6. 6. 邮件落到收件箱,主题自动生成(如 Weekly Calendar Recap: April 13-19, 2026)

关键一步 · 固化为 Automation

这是个一次性任务,接下来固化它 ·

7. 在这条对话的右上角,有个 Save as Automation 按钮,点它
8. 弹出配置面板,选触发条件。可见的触发类型至少 4 种 ·
– 时间触发(每周一 09:00 / 每天 08:00 / 每月 1 日这种)
– 邮件触发(收到来自 XXX 的邮件时)
– 日历触发(新事件创建时 / 事件开始前 15 分钟)
– 文件触发(Google Drive 里某个文件更新时)
9. 填名字(比如”每周日历周报”),保存

这条任务从此自己跑。每周一早上 09:00,Agent 自动读完日历,整理周报,发邮件。你不用再开 App,不用再输入一遍指令。

Steering vs Queueing · 两种工作模式

具体有两种工作模式,Codex App 都支持 ·

  • – Steering,实时对话引导,你边看它干边插话调整。适合 · 没做过的事、需要监督的任务、会有反复迭代的事。
  • – Queueing,批量排一堆指令,Agent 依次执行。适合 · 已经固化流程的事、重复任务、你不想盯着的事。

判断逻辑 · 这个任务你已经做过 3 次以上而且每次流程几乎一致 → 走 Queueing → 再升级到 Automation 定时跑。没做过的、流程不稳定的 → 走 Steering。

跟 Claude Code 对照着看

Claude Code 要做定时任务,你得自己写 bash 脚本 + macOS launchd 或者 cron entry,再把 claude CLI 包一层。能做,但门槛不低,一般用户不会走到这步。Codex App 把这一层砍平到 UI 按钮,一个 form 填完。

避坑

触发条件的”邮件触发”和”文件触发”这两个虽然灵活,但容易触发过度(每次收到邮件都跑 Agent)。建议起手先用”时间触发”,固定点跑,观察几周确定 Agent 确实在干对的事,再考虑切事件驱动。

以前这类重复任务,要么自己搞定时脚本,要么手动做。一句话配完 Automation,Agent 第二天就替你跑,不用你再开 App,不用再输一遍指令。938 个书签等的就是这个。


§ 四 功能 ③ · 自定义 Skill API · 把任意 API 变成 Codex 能调的能力

核心价值一句话 · Codex App 内置 111 个插件,不够用,你可以在图形界面里自己写一个 Skill,把任意 API 变成 Agent 能调的能力。

怎么用 · 建一个 YouTube Research Skill

完整流程 ·

  1. 1. Plugins 面板 → 右上角 Create Skill(或 Custom Skill)
  2. 2. 填 Skill 名字(YouTube Research)和描述。描述很关键,Agent 根据这个描述判断”这个场景要不要调这个 Skill”,写清楚”用途是查 YouTube 视频 / 频道数据”
  3. 3. 配 API 接口 · 填 endpoint(YouTube Data API v3 的 search endpoint)、auth token(你的 YouTube API Key)、query 参数的 schema
  4. 4. 前置条件 · YouTube Data API 需要在 Google Cloud Console 申请 API Key,免费额度每天 10000 单位调用够用
  5. 5. 保存,Skill 生效,在 Plugins 列表里出现

实际调用效果

  1. 6. 新开对话,输入”找过去 7 天关于 Claude Code 的 YouTube 高赞视频,列出标题 + 观看数 + 发布时间”
  2. 7. Codex Agent 识别这是 YouTube Research Skill 的场景,自动调用
  3. 8. 返回结构化结果,格式是表格

包装成 Automation 定时跑

  1. 9. 选这条对话 → Save as Automation
  2. 10. 触发器设”每天 09:00″,保存
  3. 11. Skill 从此每天早上自动跑一遍,结果发邮件

跟 Claude Code 的 MCP 对照着看

Claude Code 走 MCP 协议,你要加一个自定义 Server,得写 Node.js 或 Python 的 MCP Server 代码 → 改 ~/.claude/mcp.json 或 claude_desktop_config.json → 重启 → 试错调试。Codex App 把这整套收进图形面板,定义 API 接口这一步在一个 form 里填完,没碰一个配置文件。

哪些人对这个差别最有感触,PM、不想碰配置文件的独立开发者、把 AI 当工具而不是把 AI 当同事的那批人。对工程师来说 MCP 也不是什么门槛,对 PM 来说”配置文件”这三个字就是门。

避坑

Skill 的描述(第 2 步那个)不要写成”调用 YouTube API”这种功能描述,要写成”用途是 XXX”的场景描述。Agent 识别是不是要调这个 Skill,靠的是场景匹配不是功能名字。描述写得越像”我什么时候需要这个能力”,Agent 调用准确率越高。

有 API 的东西都能接进来——YouTube 数据、选品接口、公众号后台——一次配完,永远在后台跑。能力的边界,由你决定。


§ 五 功能 ④ · 三种运行模式 · Local / Worktree / Cloud 各管各的

核心价值一句话 · 不同任务挑不同执行环境,不用一套方案通吃所有场景,Codex 自己知道该用哪套。

三种主模式

  • – Local 本地执行,Agent 在你电脑上跑,文件读写、命令执行都在本机。适合 · 改现有项目、跑测试、需要读本机环境变量的事、要看本地文件的事。
  • – Worktree 分支隔离,Agent 在独立的 git worktree 里跑,改动不污染主分支。适合 · 大改重构、实验性功能、多人协作怕互踩、一个需求试两套方案对比。
  • – Cloud 云端执行,任务整个扔云端跑,本机关机也在跑。适合 · 长任务(训练、批处理、爬虫)、不占本机资源的事、夜里跑白天看结果的事。

还有一个 Remote SSH(alpha 阶段),能远程连到你自己的服务器上执行,这个还在分批推送。

怎么切换 · 新建 Thread 时的选项

切换模式的操作点在新建 Thread 的那一刻。

  1. 1. 点 New Thread
  2. 2. 下拉选执行环境 · Local / Worktree / Cloud / Remote SSH(alpha)
  3. 3. 选完直接开始对话,Agent 从第一条消息就在那个环境里跑

正在跑的 Thread 也能切。本地跑着发现改动太大容易污染主分支,点右上角”切到 Worktree”,Agent 把当前上下文和状态搬到独立 worktree 里继续,主分支不受影响。

配套能力一览

  • – 内置终端(Integrated terminal),不用切出去开 iTerm
  • – Terminal readback by Codex,Agent 可以自己读 terminal 输出。你不用复制粘贴错误信息给 Agent,它自己看,自己判断是环境变量问题还是依赖问题还是代码问题,自己尝试修
  • – 多终端并行(Multiple terminals),一条 Thread 里同时开几个终端
  • – Approval controls / Sandbox controls,每个敏感操作要不要让 Agent 自己批,可以按项目细分
  • – Windows 原生 sandbox / 可选 WSL agent,Windows 用户也能享受隔离执行

跟 Claude Code 对照着看

Claude Code 默认在 local 跑,你启动的那个 shell 就是执行环境。Worktree 你要自己 git worktree add 然后再把 Claude 切过去。Cloud 模式更麻烦,得自己起云机器、SSH 进去、装 Claude、跑任务。Codex App 把三种模式做成 UI 选项,新建 Thread 的时候下拉选一个。

这套能跑出什么结果

@rileybrown 的演示里,他同时开了 6 条 Agent 线程,每条跑不同任务,并发推进 ·

交付物 产物类型
iOS App 设计 Mobile Design Skill 直接出设计稿
iOS App 搭建 实际代码,不是示意
落地页 + Tally 表单 能收集用户线索
Remotion 启动视频 动态视频,不是静态图
投资人 Deck Claude Opus 4.7 生成
Vercel 部署 真实上线,不是 localhost
TestFlight 上架 真机可分发,不是模拟器

从设计稿一路到 App Store 测试版可分发,6 个产品同时推,一个演示里做完。这不是演示,这是交付。

避坑

Cloud 模式跑长任务,别忘了设置”完成通知”(Settings → Notifications),不然任务跑完你不知道,还以为在排队。Worktree 模式下改动完要合并回主分支,有个 Merge to main 按钮,别手动 git merge,App 里的那个按钮会顺便把 Thread 的上下文也同步过去,手动 merge 会丢上下文。


§ 六 工具分层 · Codex App 和 Claude Code 不是竞争,是分工

@rileybrown 演示里有一件事值得单独说清楚。

他在 Codex App 的内置 Terminal 里打开了 Claude Code。投资人 Deck 那段,他用的是 Claude Opus 4.7。在 OpenAI 的 App 里,跑的是 Anthropic 的 coding agent。

这不是意外,也不是品牌背叛。这是工具分层的结果。

三层结构 ·

  • – Codex App 是调度层,GPT-5.4 管任务队列、触发时机、并发控制、Project / Thread / Automation 这些上层概念
  • – Claude Code 是执行层,具体代码编写、调试、重构这些硬活
  • – GPT-5.4 和 Claude Opus 4.7 是能力层,哪个任务用哪个模型,Codex App 自己挑

三层分工,每一层找最合适的工具。两个产品不在同一层,所以不是”OpenAI vs Anthropic 二选一”的竞争关系,是分工。

扒完想清楚一件事 · Claude Code 用户你一直以为自己是工作流里的主角,但 Codex App 出来之后,你慢慢会变成别人调度链里的执行层。 不是说 Claude Code 不重要,恰恰相反,它在执行层会越来越强,因为上层被 Codex App 接走了,Claude Code 可以专心做代码层的硬活。

但对你来说,下一个问题是 · 你想停留在执行层,还是把调度层也吃下来?

如果你每天打开电脑第一件事是开终端,CLI 是你舒服的形态,Claude Code 继续用,不碰调度层完全可以,让别人用 Codex App 给你派活你干就行。如果你想同时推多个项目、同时跑多个任务,那调度层你躲不掉,Codex App 这套 Project + Automation 就是给你准备的。

接下来不是”选哪个”的问题,是”你在这个分工里站哪个位置”的问题。


§ 七 现在能用吗 · 三步上手

当前状态 · Developer Preview,对 ChatGPT Plus / Pro / Business 的开发者用户开放。

下载地址 · openai.com/codex/app

部分新功能(电脑控制、浏览器控制)还在分批推送,官方说未来会开放给更广泛的用户。

现在有内测资格 · 三件事按顺序做

第一件事 · 建一个 Project,把手头最乱的那个方向装进去。

原来散在几个终端窗口和几十条对话里的东西,建一个 Project 收纳,再拆 Thread 跑。第一次感受到”多任务被一个 App 管起来”的感觉之后,回不去了。

第二件事 · 找一个每周都在重复做的任务,配成 Automation。

周报、日历整理、竞品定价巡检、数据拉取——随便一个,按 § 三的步骤配完,让 Agent 下周自己跑给你看。

第三件事 · 进 Plugins 面板扫一遍 111 个内置插件。

不用全装,找你工作里用到的那 3-5 个服务(Google Workspace / Slack / Notion / GitHub / Linear 这类),授权连上,之后用对话控制,不用打开浏览器切来切去。

还没内测资格 · 现在就可以做的事

把 openai.com/codex/app 存进书签。申请 waitlist,收到邀请第一时间试。

收到内测之前先把 § 三(Automations)和 § 四(Skill API)过一遍,把你准备配进去的任务想好——哪些重复任务、需要接哪个 API、Automation 触发条件想用哪种。

等到开放那天,你不是从零开始摸索,是直接按准备好的清单配。


§ 八 现在就去做这两件事

没拿到内测的,把 openai.com/codex/app 这个 URL 存进书签,把你想配的重复任务列下来,等 ChatGPT Plus / Pro 账号收到开放通知,第一天按顺序跑一遍。

已经有内测资格的,今晚就去下载,建第一个 Project,把你最重复的那个任务(每周的日历周报、每天的数据巡检、每月的对账邮件)用 § 三的步骤配成 Automation,让 Agent 明天早上自己跑给你看。

下一步不是选哪个,是你在分工里站哪个位置。


今日互动

你现在用哪个 AI 工具写代码?Claude Code 为主扣 1,已经在用 Codex App 扣 2,两个都有扣 3。评论区见,顺便说下你打算把哪个重复任务配成 Automation。


📬 顺手说一句 · 咨询业务

长期承接这三块 · 价格大概是官方的一半 ·

  • – Claude 官方订阅代开(Pro / Max 都能搞)
  • – ChatGPT 官方订阅代开(Plus / Pro 都能搞)
  • – Claude 各国 KYC 认证(美国 / 香港 / 新加坡 / 欧洲地区都能搞)

关注「麦总玩 AI」· 后台私信「订阅」或「KYC」· 报你要的档位,给你算细账。


参考 @rileybrown 发的 Codex App 教程视频。