不会写代码的 PM,用 Codex App 一个下午做出了 6 个产品-夜雨聆风

不会写代码的 PM,用 Codex App 一个下午做出了 6 个产品

Claude Code 用户 / PM / 副业人 / 不碰代码的产品人，这篇写给你们。

一个下午,一个人,6 个产品全跑完 · 从 iOS App 到投资人 Deck。

设计稿、实际代码、落地页、Tally 表单、Remotion 启动视频、投资人 Deck、Vercel 真实上线、TestFlight 真机可分发 · 8 个环节、6 个产品，一个人，一个 App 里全跑完。这不是模拟器截图，是真实上线可分发的交付。

Codex App 不是又一个 AI 编程工具，是 OpenAI 把 AI Agent 做成了一套操作系统。

Projects 项目管理 + Automations 定时自动化 + Skill API 自定义能力 + 111 个内置插件 + Local / Worktree / Cloud 三种运行模式。组合起来才是”操作系统”三个字的意思 · 多任务并发、后台任务自己跑、能力可以扩展、环境可以切换。

产品还没对大众开放，ChatGPT Plus / Pro / Business 的开发者用户能下载 Developer Preview。Twitter 上 2.8 万播放、484 点赞、938 个书签 · 书签是”我要回来”的行为，不是”点完走人”。

这篇是给这几批人看的 ·
– Claude Code 的老用户，§ 六告诉你一件让人不舒服但必须想清楚的事 · 你在 AI 工具分层里到底站哪个位置
– PM / 副业人 / 独立开发者，4 大功能怎么配 + 6 个产品怎么并发 + 第一个副业 MVP 怎么开工
– 不碰代码的产品人，AI 从工程师玩具变成操作系统的那个节点已经到了，调度层的工具长这个样

§ 一先说清楚这是什么 · 别跟 Codex CLI 搞混

OpenAI 叫 Codex 的东西至少有 3 个。

第一个是 2021 年那个 Codex，代码补全模型，给早期的 GitHub Copilot 用，已经退役了。第二个是 Codex CLI，OpenAI 去年放出来的命令行工具，终端里敲命令跟模型交互，偏工程师。

第三个是这次发布的 Codex 桌面 App，一个 GUI 应用。这两个不是同一个产品。

底层模型 GPT-5.4，默认推理档位 Extra High。官方口号 Build faster with Codex, A coding agent that helps you build and ship with AI。

已经在用的企业客户，Duolingo、Vanta、Virgin Atlantic、Miro、Rakuten。都是海外头部科技公司，直接进入生产环境的那批。

它跟 Claude Code 不在一个形态上。Claude Code 是终端 CLI，工程师舒服；Codex App 是桌面 GUI，侧边栏 + 面板 + 内置终端 + 插件市场，更像一个”能跑 Agent 的操作系统壳子”，后面几节你会看到具体差别。

为啥 OpenAI 要做 Super App 而不是继续加强 CLI。因为 CLI 这个形态天然圈住了工程师，想要触达”不碰代码的产品人 / PM / 副业人”，必须换形态。GUI 面板 + 111 个开箱插件 + 无代码 Automation，这三件事凑在一起才能把 AI agent 从”程序员的玩具”变成”每个人的操作系统”。

CLI 给工程师用，App 给所有人用。这一步，OpenAI 迈过来了。

§ 二功能 ① · Projects 项目管理 · 多项目并行不用多开终端

核心价值一句话 · 把”多对话”收进”多项目”，每个项目底下跑多条并行的 Agent 线程，开着 5 个项目不乱。

怎么用 · 完整操作步骤

1. 左侧边栏，点 New chat 上面那个 Projects 图标，进入项目列表
2. 右上角 Create Project，填项目名字和描述（比如”闲鱼机器人项目” / “副业周报自动化”）
3. 进 Project 内部，侧边出现 Thread 列表（每个 Thread 就是一条对话线程）
4. 点 New Thread，每条 Thread 独立跑自己的 Agent，互不干扰
5. 右侧 Project sidebar（默认展开，在主面板右边），统一看所有 Thread 状态，谁跑完了谁卡住了一目了然
6. 队列区域里待执行的消息可以拖动重排，想先跑哪个拖到最上面
7. 同一条 Thread 可以从某条消息处 Fork 出新分支（右键消息 → Fork from here），等于”我这个方向试试看，不行回到原路”

Projects 的完整能力清单

Projects 模块的细节能力，列出 7 条 ·

– 多项目（Multiple projects）
– 并行 Agent 线程（Parallel agent threads）
– 对话分叉（Conversation forking），刚才第 7 步说的 Fork
– Handoff between Local and Worktree，本地跑着跑着切到分支隔离模式继续
– Queue message reordering，待执行消息重排
– Thread 重命名 / 搜索 / 跳最近
– 整个 Project 下所有本地 Thread 一键归档

跟 Claude Code 对照着看

Claude Code 走 CLI，多任务靠你手动 tmux 或者多开几个终端窗口。你得自己记住哪个窗口在干哪个项目，session 管理完全靠肌肉记忆，关机重启全丢。Codex App 把这一层做成可视化面板，状态持久化，对”同时推多个副业又不想被配置卡住”的人来说，门槛差了一个台阶。

避坑

Thread Fork 这个功能很容易被忽略，但它解决的问题非常具体 · 你让 Agent 做一个需求，它给了方案 A，你想”要不试试方案 B”，但又不想废掉方案 A 的上下文。这时候 Fork 出去试 B，B 不成再回 A 继续。这是 Claude Code 里要手动备份 session 才能做到的事。

副业人手头 5 个项目（一个 iOS App、一个公众号、一个闲鱼店、一个 Discord bot、一个博客），不用 5 个终端窗口了，一个 App 全装下，项目之间切换不用重新装上下文。

§ 三功能 ② · Automations 定时自动化 · 不写 cron 不碰 crontab

核心价值一句话 · 自然语言指令就能建一个定时触发的 Agent 任务，不写一行代码，不配 cron 表达式。

怎么用 · 完整操作流程（以日历周报为例）

1. 在 Plugins 面板连上 Google Calendar 和 Gmail（这两个是 Codex App 内置插件，点击 Authorize 授权一次就成）
2. 新开一条对话，输入”列出本周日历事件”
3. Agent 自动调 Calendar 插件，读本周事件，返回结构化清单
4. 继续输入”把这份周报发邮件给我”
5. Agent 自动调 Gmail 插件，填主题、填正文、发送
6. 邮件落到收件箱，主题自动生成（如 Weekly Calendar Recap: April 13-19, 2026）

关键一步 · 固化为 Automation

这是个一次性任务，接下来固化它 ·

7. 在这条对话的右上角，有个 Save as Automation 按钮，点它
8. 弹出配置面板，选触发条件。可见的触发类型至少 4 种 ·
– 时间触发（每周一 09:00 / 每天 08:00 / 每月 1 日这种）
– 邮件触发（收到来自 XXX 的邮件时）
– 日历触发（新事件创建时 / 事件开始前 15 分钟）
– 文件触发（Google Drive 里某个文件更新时）
9. 填名字（比如”每周日历周报”），保存

这条任务从此自己跑。每周一早上 09:00，Agent 自动读完日历，整理周报，发邮件。你不用再开 App，不用再输入一遍指令。

Steering vs Queueing · 两种工作模式

具体有两种工作模式，Codex App 都支持 ·

– Steering，实时对话引导，你边看它干边插话调整。适合 · 没做过的事、需要监督的任务、会有反复迭代的事。
– Queueing，批量排一堆指令，Agent 依次执行。适合 · 已经固化流程的事、重复任务、你不想盯着的事。

判断逻辑 · 这个任务你已经做过 3 次以上而且每次流程几乎一致 → 走 Queueing → 再升级到 Automation 定时跑。没做过的、流程不稳定的 → 走 Steering。

跟 Claude Code 对照着看

Claude Code 要做定时任务，你得自己写 bash 脚本 + macOS launchd 或者 cron entry，再把 claude CLI 包一层。能做，但门槛不低，一般用户不会走到这步。Codex App 把这一层砍平到 UI 按钮，一个 form 填完。

避坑

触发条件的”邮件触发”和”文件触发”这两个虽然灵活，但容易触发过度（每次收到邮件都跑 Agent）。建议起手先用”时间触发”，固定点跑，观察几周确定 Agent 确实在干对的事，再考虑切事件驱动。

以前这类重复任务，要么自己搞定时脚本，要么手动做。一句话配完 Automation，Agent 第二天就替你跑，不用你再开 App，不用再输一遍指令。938 个书签等的就是这个。

§ 四功能 ③ · 自定义 Skill API · 把任意 API 变成 Codex 能调的能力

核心价值一句话 · Codex App 内置 111 个插件，不够用，你可以在图形界面里自己写一个 Skill，把任意 API 变成 Agent 能调的能力。

怎么用 · 建一个 YouTube Research Skill

完整流程 ·

1. Plugins 面板 → 右上角 Create Skill（或 Custom Skill）
2. 填 Skill 名字（YouTube Research）和描述。描述很关键，Agent 根据这个描述判断”这个场景要不要调这个 Skill”，写清楚”用途是查 YouTube 视频 / 频道数据”
3. 配 API 接口 · 填 endpoint（YouTube Data API v3 的 search endpoint）、auth token（你的 YouTube API Key）、query 参数的 schema
4. 前置条件 · YouTube Data API 需要在 Google Cloud Console 申请 API Key，免费额度每天 10000 单位调用够用
5. 保存，Skill 生效，在 Plugins 列表里出现

实际调用效果

6. 新开对话，输入”找过去 7 天关于 Claude Code 的 YouTube 高赞视频，列出标题 + 观看数 + 发布时间”
7. Codex Agent 识别这是 YouTube Research Skill 的场景，自动调用
8. 返回结构化结果，格式是表格

包装成 Automation 定时跑

9. 选这条对话 → Save as Automation
10. 触发器设”每天 09:00″，保存
11. Skill 从此每天早上自动跑一遍，结果发邮件

跟 Claude Code 的 MCP 对照着看

Claude Code 走 MCP 协议，你要加一个自定义 Server，得写 Node.js 或 Python 的 MCP Server 代码 → 改 ~/.claude/mcp.json 或 claude_desktop_config.json → 重启 → 试错调试。Codex App 把这整套收进图形面板，定义 API 接口这一步在一个 form 里填完，没碰一个配置文件。

哪些人对这个差别最有感触，PM、不想碰配置文件的独立开发者、把 AI 当工具而不是把 AI 当同事的那批人。对工程师来说 MCP 也不是什么门槛，对 PM 来说”配置文件”这三个字就是门。

避坑

Skill 的描述（第 2 步那个）不要写成”调用 YouTube API”这种功能描述，要写成”用途是 XXX”的场景描述。Agent 识别是不是要调这个 Skill，靠的是场景匹配不是功能名字。描述写得越像”我什么时候需要这个能力”，Agent 调用准确率越高。

有 API 的东西都能接进来——YouTube 数据、选品接口、公众号后台——一次配完，永远在后台跑。能力的边界，由你决定。

§ 五功能 ④ · 三种运行模式 · Local / Worktree / Cloud 各管各的

核心价值一句话 · 不同任务挑不同执行环境，不用一套方案通吃所有场景，Codex 自己知道该用哪套。

三种主模式

– Local 本地执行，Agent 在你电脑上跑，文件读写、命令执行都在本机。适合 · 改现有项目、跑测试、需要读本机环境变量的事、要看本地文件的事。
– Worktree 分支隔离，Agent 在独立的 git worktree 里跑，改动不污染主分支。适合 · 大改重构、实验性功能、多人协作怕互踩、一个需求试两套方案对比。
– Cloud 云端执行，任务整个扔云端跑，本机关机也在跑。适合 · 长任务（训练、批处理、爬虫）、不占本机资源的事、夜里跑白天看结果的事。

还有一个 Remote SSH（alpha 阶段），能远程连到你自己的服务器上执行，这个还在分批推送。

怎么切换 · 新建 Thread 时的选项

切换模式的操作点在新建 Thread 的那一刻。

1. 点 New Thread
2. 下拉选执行环境 · Local / Worktree / Cloud / Remote SSH（alpha）
3. 选完直接开始对话，Agent 从第一条消息就在那个环境里跑

正在跑的 Thread 也能切。本地跑着发现改动太大容易污染主分支，点右上角”切到 Worktree”，Agent 把当前上下文和状态搬到独立 worktree 里继续，主分支不受影响。

配套能力一览

– 内置终端（Integrated terminal），不用切出去开 iTerm
– Terminal readback by Codex，Agent 可以自己读 terminal 输出。你不用复制粘贴错误信息给 Agent，它自己看，自己判断是环境变量问题还是依赖问题还是代码问题，自己尝试修
– 多终端并行（Multiple terminals），一条 Thread 里同时开几个终端
– Approval controls / Sandbox controls，每个敏感操作要不要让 Agent 自己批，可以按项目细分
– Windows 原生 sandbox / 可选 WSL agent，Windows 用户也能享受隔离执行

跟 Claude Code 对照着看

Claude Code 默认在 local 跑，你启动的那个 shell 就是执行环境。Worktree 你要自己 git worktree add 然后再把 Claude 切过去。Cloud 模式更麻烦，得自己起云机器、SSH 进去、装 Claude、跑任务。Codex App 把三种模式做成 UI 选项，新建 Thread 的时候下拉选一个。

这套能跑出什么结果

@rileybrown 的演示里，他同时开了 6 条 Agent 线程，每条跑不同任务，并发推进 ·

交付物	产物类型
iOS App 设计	Mobile Design Skill 直接出设计稿
iOS App 搭建	实际代码，不是示意
落地页 + Tally 表单	能收集用户线索
Remotion 启动视频	动态视频，不是静态图
投资人 Deck	Claude Opus 4.7 生成
Vercel 部署	真实上线，不是 localhost
TestFlight 上架	真机可分发，不是模拟器

从设计稿一路到 App Store 测试版可分发，6 个产品同时推，一个演示里做完。这不是演示，这是交付。

避坑

Cloud 模式跑长任务，别忘了设置”完成通知”（Settings → Notifications），不然任务跑完你不知道，还以为在排队。Worktree 模式下改动完要合并回主分支，有个 Merge to main 按钮，别手动 git merge，App 里的那个按钮会顺便把 Thread 的上下文也同步过去，手动 merge 会丢上下文。

§ 六工具分层 · Codex App 和 Claude Code 不是竞争，是分工

@rileybrown 演示里有一件事值得单独说清楚。

他在 Codex App 的内置 Terminal 里打开了 Claude Code。投资人 Deck 那段，他用的是 Claude Opus 4.7。在 OpenAI 的 App 里，跑的是 Anthropic 的 coding agent。

这不是意外，也不是品牌背叛。这是工具分层的结果。

三层结构 ·

– Codex App 是调度层，GPT-5.4 管任务队列、触发时机、并发控制、Project / Thread / Automation 这些上层概念
– Claude Code 是执行层，具体代码编写、调试、重构这些硬活
– GPT-5.4 和 Claude Opus 4.7 是能力层，哪个任务用哪个模型，Codex App 自己挑

三层分工，每一层找最合适的工具。两个产品不在同一层，所以不是”OpenAI vs Anthropic 二选一”的竞争关系，是分工。

扒完想清楚一件事 · Claude Code 用户你一直以为自己是工作流里的主角，但 Codex App 出来之后，你慢慢会变成别人调度链里的执行层。 不是说 Claude Code 不重要，恰恰相反，它在执行层会越来越强，因为上层被 Codex App 接走了，Claude Code 可以专心做代码层的硬活。

但对你来说，下一个问题是 · 你想停留在执行层，还是把调度层也吃下来？

如果你每天打开电脑第一件事是开终端，CLI 是你舒服的形态，Claude Code 继续用，不碰调度层完全可以，让别人用 Codex App 给你派活你干就行。如果你想同时推多个项目、同时跑多个任务，那调度层你躲不掉，Codex App 这套 Project + Automation 就是给你准备的。

接下来不是”选哪个”的问题，是”你在这个分工里站哪个位置”的问题。

§ 七现在能用吗 · 三步上手

当前状态 · Developer Preview，对 ChatGPT Plus / Pro / Business 的开发者用户开放。

下载地址 · openai.com/codex/app

部分新功能（电脑控制、浏览器控制）还在分批推送，官方说未来会开放给更广泛的用户。

现在有内测资格 · 三件事按顺序做

第一件事 · 建一个 Project，把手头最乱的那个方向装进去。

原来散在几个终端窗口和几十条对话里的东西，建一个 Project 收纳，再拆 Thread 跑。第一次感受到”多任务被一个 App 管起来”的感觉之后，回不去了。

第二件事 · 找一个每周都在重复做的任务，配成 Automation。

周报、日历整理、竞品定价巡检、数据拉取——随便一个，按 § 三的步骤配完，让 Agent 下周自己跑给你看。

第三件事 · 进 Plugins 面板扫一遍 111 个内置插件。

不用全装，找你工作里用到的那 3-5 个服务（Google Workspace / Slack / Notion / GitHub / Linear 这类），授权连上，之后用对话控制，不用打开浏览器切来切去。

还没内测资格 · 现在就可以做的事

把 openai.com/codex/app 存进书签。申请 waitlist，收到邀请第一时间试。

收到内测之前先把 § 三（Automations）和 § 四（Skill API）过一遍，把你准备配进去的任务想好——哪些重复任务、需要接哪个 API、Automation 触发条件想用哪种。

等到开放那天，你不是从零开始摸索，是直接按准备好的清单配。

§ 八现在就去做这两件事

没拿到内测的，把 openai.com/codex/app 这个 URL 存进书签，把你想配的重复任务列下来，等 ChatGPT Plus / Pro 账号收到开放通知，第一天按顺序跑一遍。

已经有内测资格的，今晚就去下载，建第一个 Project，把你最重复的那个任务（每周的日历周报、每天的数据巡检、每月的对账邮件）用 § 三的步骤配成 Automation，让 Agent 明天早上自己跑给你看。

下一步不是选哪个，是你在分工里站哪个位置。

今日互动

你现在用哪个 AI 工具写代码？Claude Code 为主扣 1，已经在用 Codex App 扣 2，两个都有扣 3。评论区见，顺便说下你打算把哪个重复任务配成 Automation。

📬 顺手说一句 · 咨询业务

长期承接这三块 · 价格大概是官方的一半 ·

– Claude 官方订阅代开(Pro / Max 都能搞)
– ChatGPT 官方订阅代开(Plus / Pro 都能搞)
– Claude 各国 KYC 认证(美国 / 香港 / 新加坡 / 欧洲地区都能搞)

关注「麦总玩 AI」· 后台私信「订阅」或「KYC」· 报你要的档位,给你算细账。

参考 @rileybrown 发的 Codex App 教程视频。

§ 一 先说清楚这是什么 · 别跟 Codex CLI 搞混

§ 二 功能 ① · Projects 项目管理 · 多项目并行不用多开终端

怎么用 · 完整操作步骤

Projects 的完整能力清单

跟 Claude Code 对照着看

避坑

§ 三 功能 ② · Automations 定时自动化 · 不写 cron 不碰 crontab

怎么用 · 完整操作流程（以日历周报为例）

关键一步 · 固化为 Automation

Steering vs Queueing · 两种工作模式

跟 Claude Code 对照着看

避坑

§ 四 功能 ③ · 自定义 Skill API · 把任意 API 变成 Codex 能调的能力

怎么用 · 建一个 YouTube Research Skill

实际调用效果

包装成 Automation 定时跑

跟 Claude Code 的 MCP 对照着看

避坑

§ 五 功能 ④ · 三种运行模式 · Local / Worktree / Cloud 各管各的

三种主模式

怎么切换 · 新建 Thread 时的选项

配套能力一览

跟 Claude Code 对照着看

这套能跑出什么结果

避坑

§ 六 工具分层 · Codex App 和 Claude Code 不是竞争，是分工

§ 七 现在能用吗 · 三步上手

现在有内测资格 · 三件事按顺序做

还没内测资格 · 现在就可以做的事

§ 八 现在就去做这两件事

§ 一先说清楚这是什么 · 别跟 Codex CLI 搞混

§ 二功能 ① · Projects 项目管理 · 多项目并行不用多开终端

§ 三功能 ② · Automations 定时自动化 · 不写 cron 不碰 crontab

§ 四功能 ③ · 自定义 Skill API · 把任意 API 变成 Codex 能调的能力

§ 五功能 ④ · 三种运行模式 · Local / Worktree / Cloud 各管各的

§ 六工具分层 · Codex App 和 Claude Code 不是竞争，是分工

§ 七现在能用吗 · 三步上手

§ 八现在就去做这两件事