乐于分享
好东西不私藏

Codex App 教程(一):先把工作台搭好

Codex App 教程(一):先把工作台搭好

这是 Codex App 系列教程的第一篇。目标不是一次性讲完所有功能,而是帮你把 Codex App 的基础工作方式建立起来:安装准备、项目选择、线程管理、沙盒审批、上下文、模型选择,以及第一次让 Codex 安全地阅读项目。
本文基于 OpenAI 官方文档,并参考视频《 Codex (APP) 保姆级全攻略,海量实战教程,一期精通 Codex 》的演示顺序整理。

很多人第一次用 Codex App ,会把它当成一个更懂代码的聊天窗口。

这个理解只说对了一半。

Codex App 真正的价值,不是“你问一句,它答一句”,而是把 AI 放进一个真实项目里,让它能读文件、改代码、跑命令、看差异、查错误、做审查,并且在你的安全规则内持续工作。

所以第一篇先不急着做复杂功能。我们先解决一个更重要的问题:

怎样把 Codex App 配成一个可靠的工程工作台

这篇读完,你应该能做到:

理解 Codex App 和普通 AI 聊天的区别。
知道安装前要准备哪些工具。
看懂 Codex App 的项目、线程和右侧面板。
知道 Local 、 Worktree 、 Cloud 的基本区别。
理解沙盒和审批为什么重要。
能让 Codex 安全地阅读一个项目,并产出项目理解报告。

一、 Codex App 是什么?

OpenAI 官方对 Codex 的定位是软件开发 agent 。它面向的是完整的软件开发生命周期,而不是单点代码补全。

你可以把它理解成一个能进入项目现场工作的 AI 工程助手。

它可以做的事情包括:

阅读代码库,解释架构和调用链。
根据需求修改文件。
运行测试、构建、格式化命令。
根据报错继续定位问题。
审查 Git diff ,指出潜在 bug 。
使用浏览器查看本地页面。
通过 MCP 、 Plugins 、 Skills 调用外部工具。
在 Worktree 或 Cloud 中并行处理任务。

这和普通聊天工具最大的区别是: Codex App 不只回答问题,它可以直接参与项目操作。

普通聊天工具更像“问答”:

我:这段代码是什么意思?
AI:它大概是在做用户鉴权。

Codex App 更像“协作”:

我:请阅读这个项目的鉴权流程,画出登录态流转,并指出 token 过期处理在哪里。
Codex:搜索相关文件,读取实现,解释流程,列出文件路径,并给出下一步排查建议。

这就是为什么学习 Codex App 不能只学提示词。你还要学习项目边界、权限、上下文、 Git 状态和验证流程。

二、安装前需要准备什么?

视频里提到,安装 Codex App 前建议准备三个基础工具:

Git
Node.js
VS Code 或其他编辑器

这三个工具不一定每次都用到,但它们会直接影响 Codex 的工作质量。

1. Git :所有安全工作的底座

Git 是 Codex App 里很多能力的基础。

它会影响:

Review 面板能否展示 diff 。
Worktree 能否创建隔离工作区。
Codex 能否基于提交记录分析变化。
你能否安全回滚。
Cloud 任务能否通过仓库同步代码。

如果你的项目还没有 Git ,建议先初始化:

gitinit
gitadd.
gitcommit-m"Initial commit"

如果项目已经是 Git 仓库,开始使用 Codex 前先看一眼状态:

gitstatus

为什么这一步重要?

因为 Codex 修改文件后,你需要分清哪些改动是你原本就有的,哪些是 Codex 新增的。如果一开始工作区很乱,后面 Review 和回滚都会变麻烦。

新手建议:

第一次让 Codex 动手前,尽量保持工作区干净。
如果有未提交改动,明确告诉 Codex 不要覆盖。
做大任务前先提交一个安全点。

2. Node.js :前端和工具生态的基础

很多现代项目依赖 Node.js 。

即使你不是前端开发者,也经常会遇到:

npm install
pnpm install
npm run dev
npm test
vite
next
eslint
prettier
MCP server
插件脚本

Codex 经常需要运行这些命令来验证修改。

如果你的机器没有 Node.js ,它可能能读代码,但无法启动项目、运行测试或生成构建结果。

建议至少确认:

node-v
npm-v

如果项目使用 pnpmyarn,也要确认对应工具可用。

3. 编辑器: Codex 不是完整 IDE

Codex App 可以展示文件、 diff 、对话和浏览器,但它不是一个完整 IDE 。

复杂项目里,你仍然会需要编辑器做这些事:

快速跳转定义。
批量查看多个文件。
手动微调代码。
使用 IDE 插件。
对比复杂 diff 。
运行调试器。

视频里提到可以配合 VS Code 使用。你也可以用 Cursor 、 WebStorm 、 PyCharm 、 Zed 或其他编辑器。

更现实的使用方式是:

Codex 负责理解、修改、验证、总结。
编辑器负责手动阅读、精修、调试。
Git 负责保存安全点和回滚。

三、第一次打开 Codex App :先选对项目

Codex App 当前主要面向 macOS 和 Windows 桌面端。安装后,你会先登录账号,然后选择要工作的项目目录。

这里最关键的是:不要随便选一个过大的目录

错误做法:

选择 ~/Documents
选择整个用户目录
选择一个包含很多无关项目的大文件夹

更好的做法:

选择一个具体仓库
选择某个应用目录
选择一个你准备让 Codex 工作的项目根目录

原因有三个。

第一,项目越清晰, Codex 越容易理解边界。

第二,沙盒权限更好控制。

第三,上下文不会被无关文件污染。

如果你是 monorepo ,也就是一个仓库里有多个应用,可以先选择整个仓库,但第一次任务要限制范围:

请只阅读 apps/web 和 packages/ui,不要分析其他目录。

这比直接说“帮我看看这个项目”更稳。

四、理解 Codex App 的界面

Codex App 的界面可以分成三块:

左侧:项目、线程、自动化、插件等入口。
中间:当前线程对话。
右侧:文件、 diff 、浏览器、上下文、 Review 等辅助面板。

1. 左侧:管理项目和线程

左侧最重要的是 Project 和 Thread 。

Project 是项目边界。

一个 Project 通常对应一个本地代码目录。 Codex 会在这个目录里读取文件、修改文件、运行命令。

Thread 是任务上下文。

一个 Thread 就是一条任务线。它会保存:

你给的需求。
Codex 做过的分析。
它读过的文件。
它执行过的命令。
它产生的改动。
你们后续的讨论。

新手最常见的问题,是把所有任务塞进一个 Thread 。

例如:

先解释项目结构
再修登录 bug
再优化 UI
再写部署文档
再接入 MCP

这些事情如果都放在一个线程里,上下文会变得很复杂。 Codex 后面可能会混淆旧任务和新任务。

建议采用这个规则:

一个明确任务开一个线程。
一个大目标先开 Plan 线程。
一个功能实现开一个执行线程。
一个 bug 修复开一个排查线程。
完成后归档,不要长期堆着。

2. 中间:对话不是闲聊,而是任务控制台

中间的聊天区看起来像聊天软件,但你要把它当成任务控制台。

一个有效请求应该包含:

目标:你要它完成什么。
范围:可以看哪些文件,可以改哪些文件。
限制:不要做什么。
验证:完成后如何证明可用。
输出:你希望它怎么汇报。

差的提示:

帮我优化一下项目。

好的提示:

请只读不改。阅读 apps/web/src/auth 目录,解释登录态从提交表单到写入 session 的完整流程。输出关键文件、函数名、数据流和你认为最容易出 bug 的位置。

差别很大。

第一个请求没有边界。第二个请求把任务变成了可执行流程。

3. 右侧:不要忽略辅助面板

右侧面板是 Codex App 和普通聊天工具最大的差异之一。

你会在这里看到:

Codex 引用的文件。
当前 Git diff 。
Review 评论。
上下文使用量。
内置浏览器。
文件树。
任务状态。

新手容易只盯着聊天区看,这是不够的。

当 Codex 修改代码时,你要习惯打开 diff 。

当 Codex 说测试通过时,你要看命令输出。

当前端页面改完时,你要用浏览器看实际效果。

右侧面板是你验证 Codex 工作的地方。

五、 Local 、 Worktree 、 Cloud 先有个基本概念

Codex App 里常见三种工作模式:

Local
Worktree
Cloud

第一篇先讲概念,第二篇和第三篇再展开实战。

1. Local :直接在当前项目里工作

Local 模式最容易理解: Codex 直接在你选择的项目目录里工作。

适合:

解释项目。
小范围修改。
跑测试。
写文档。
修改你准备马上检查的文件。

风险:

会直接影响当前工作区。
如果你有未提交改动,容易混在一起。
不适合多个任务并行修改同一个项目。

新手第一天可以先用 Local ,但要尽量只读不改。

2. Worktree :隔离副本里工作

Worktree 基于 Git worktree 。它会创建一个隔离工作目录,让 Codex 可以在里面修改文件,不直接污染你的主工作区。

适合:

并行任务。
较大功能开发。
不确定方案试验。
自动化任务。
长时间运行的修改。

注意:

Worktree 通常基于 Git 追踪文件。未追踪文件、被忽略文件、本地 .env 文件不一定会自动过去。

所以 Worktree 启动后,要检查配置和依赖。

3. Cloud :云端执行任务

Cloud 模式适合把任务交给云端环境跑。

适合:

长任务。
GitHub 仓库任务。
生成 PR 。
你不想占用本机资源的工作。

风险:

云端可能没有你的本地环境。
私有依赖、数据库、环境变量需要额外配置。
任务描述必须更完整。

第一篇你只需要记住:

小任务用 Local 。
并行和试验用 Worktree 。
长任务和远程协作用 Cloud 。

六、沙盒和审批: Codex 的安全边界

Codex App 会读文件、写文件、跑命令,所以安全机制非常重要。

这里有两个概念:

Sandbox :沙盒。
Approval :审批。

1. Sandbox 管“能不能”

沙盒决定 Codex 和它启动的命令可以做什么。

例如:

可以读取哪些目录。
可以修改哪些文件。
能不能访问网络。
能不能运行某些系统命令。
是否能写到项目外部目录。

这不是形式主义。

如果你让 Codex 运行测试、构建、安装依赖,它启动的子进程也要受沙盒约束。

2. Approval 管“要不要问你”

审批决定 Codex 在遇到敏感操作时是否要停下来让你确认。

常见会触发审批的场景:

访问项目外文件。
联网下载依赖。
修改系统配置。
执行危险命令。
写入非工作区目录。

你看到审批弹窗时,不要机械点允许。

先看三点:

它要执行什么命令?
为什么需要这个权限?
有没有更小权限的替代方案?

3. 新手推荐权限策略

刚开始建议使用相对保守的设置。

可以允许:

读取当前项目。
修改当前项目文件。
运行测试和构建。
查看 Git 状态。

需要谨慎:

安装新依赖。
访问网络。
写入项目外目录。
修改全局配置。
删除文件。
执行 Git 重置、清理、强推。

如果 Codex 申请权限,你可以让它先解释:

在我授权之前,请说明这个命令的目的、风险,以及有没有不需要提升权限的替代方案。

这是非常重要的习惯。

七、上下文: Codex 为什么有时会“忘事”

Codex 工作时会使用上下文。

上下文可以理解成它当前能看到、能记住、能利用的信息。

它包括:

当前对话。
你提供的文件。
Codex 读取过的片段。
命令输出。
图片和截图。
AGENTS.md 规则。
MCP 或插件提供的信息。

上下文不是无限的。

当一个线程变得很长, Codex 会需要压缩历史。压缩可以继续任务,但也可能丢失一些细节。

1. 什么时候继续当前线程?

适合继续当前线程:

任务还没完成。
目标没有变化。
前面已经有重要分析。
你希望 Codex 沿着同一条线继续。

例如:

刚才你定位到问题在 session.ts,请继续只围绕这个文件修复。

2. 什么时候开新线程?

适合开新线程:

原任务已经结束。
你要做完全不同的事。
前面试错很多。
你想让 Codex 重新客观看待问题。
你担心旧上下文影响新判断。

例如,前一个线程一直在排查登录 bug 。现在你要做部署文档,就应该开新线程。

3. 怎么减少上下文浪费?

有几个实用方法:

不要无差别拖整个项目进对话。
先让 Codex 搜索,再读关键文件。
每个任务限制范围。
长任务阶段性总结。
完成后归档线程。
把长期规则写进 AGENTS.md ,而不是每次复制一大段。

八、模型选择:不要只追求最强

Codex App 里可以选择不同模型和推理强度。具体模型名称会随着产品更新变化,所以这里讲原则。

1. 简单任务用快模型

适合:

查找文件。
解释小段代码。
生成命令。
写简单文档。
修改文案。

这类任务不需要最高推理强度。

2. 复杂任务用强模型

适合:

跨模块 bug 。
架构调整。
数据迁移。
权限系统。
并发问题。
大型重构。

这类任务建议选择更强模型和更高推理强度。

3. 让 Codex 自己推荐

如果你不确定,可以直接问:

这个任务涉及登录、数据库和前端状态管理。请先判断适合使用什么模型和推理强度,并说明原因。

这比盲目固定一个模型更灵活。

九、第一次练习:让 Codex 只读不改

第一天最推荐的练习,不是让 Codex 写代码,而是让它阅读项目。

你可以用这个提示词:

请先只读不改。阅读当前项目后,输出一份项目理解报告:

1. 项目主要技术栈
2. 启动和测试命令
3. 目录结构说明
4. 核心业务模块
5. 关键入口文件
6. 当前项目可能存在的风险点
7. 建议写入 AGENTS.md 的项目规则

不要修改任何文件,不要安装依赖。

这个练习有三个好处。

第一,你能观察 Codex 如何搜索和阅读项目。

第二,你能判断它对项目的理解是否靠谱。

第三,你能把它总结出的规则沉淀成后续工作基础。

1. 如何检查它的报告?

看四点:

文件路径是否真实存在。
启动命令是否来自 package scripts 或项目文档。
目录说明是否符合代码内容。
风险点是否有证据,而不是泛泛而谈。

如果它说得太泛,可以追问:

请把每个结论都附上对应文件路径或命令来源。没有证据的结论请标注为推测。

2. 让它补一份操作清单

理解项目后,可以让它继续输出:

请基于刚才的项目理解,给我一份新手上手清单。要求按顺序列出:安装依赖、启动、本地验证、运行测试、常见问题排查。

这会把 Codex 从“解释项目”带到“帮助你上手项目”。

十、第一篇的总结

这一篇只讲基础,但这些基础决定了后面能不能稳定使用 Codex 。

你需要记住:

Codex App 是工程工作台,不只是聊天窗口。
项目目录要选清楚,不要一上来选过大的目录。
一个任务尽量一个线程。
Local 适合小任务, Worktree 适合隔离并行, Cloud 适合远程长任务。
沙盒和审批是安全边界,不是多余步骤。
上下文会影响 Codex 的判断质量。
第一次练习建议只读不改,先让 Codex 产出项目理解报告。

下一篇会进入真正的开发流程:如何用 Plan 模式拆任务,如何让 Codex 实现功能,如何用 Steer 纠偏,如何用 Browser 验证页面,如何用 Review 检查 diff ,最后如何用 Git 安全提交和回滚。

参考资料

OpenAI 官方文档:Codex App Overview[1]
OpenAI 官方文档:Codex App Features[2]
OpenAI 官方文档:Sandboxing[3]
OpenAI 官方文档:AGENTS.md[4]
视频参考:Codex (APP) 保姆级全攻略,海量实战教程,一期精通 Codex[5]

参考链接

[1] Codex App Overview: https://developers.openai.com/codex/app

[2] Codex App Features: https://developers.openai.com/codex/app/features

[3] Sandboxing: https://developers.openai.com/codex/concepts/sandboxing

[4] AGENTS.md: https://developers.openai.com/codex/guides/agents-md

[5] Codex (APP) 保姆级全攻略,海量实战教程,一期精通 Codex: https://www.bilibili.com/video/BV1Kk9kBAEJv/?spm_id_from=333.1387.homepage.video_card.click&vd_source=b5e784467105cb6f7ba5ef98491a2de4