codex app 进阶教程–都是技巧
教程目标
本教程帮助你掌握 OpenAI Codex App 的核心工作方式:如何让 Codex 在本地项目中读取、创建和修改文件,如何使用插件、技能、自动化、浏览器与电脑控制能力,以及如何用更安全的方式把任务交给 AI 智能体完成。
读完后,你应该能做到三件事:
-
知道什么任务适合交给 Codex,什么任务仍需要自己判断。 -
能把文件、项目、权限、插件、技能和自动化组织成稳定工作流。 -
能审查 Codex 的输出,避免权限过宽、文件改错、结果不可复核等问题。
适用人群
-
已经会用 ChatGPT、Claude 等 AI 工具,想进一步把 AI 用到真实文件和工作流中的用户。 -
需要处理文档、表格、邮件、网页、代码、报告、图片和演示稿的知识工作者。 -
希望用 AI 辅助编程、内容创作、数据分析、项目管理和自动化任务的技术爱好者。 -
想在本地电脑上建立可复用 SOP、个人知识库、项目协作流程的人。
1. 理解 Codex 的基本概念
Codex 是 OpenAI 的 AI 智能体工具。它不只是回答问题,还可以在你授权的范围内跨文件、工具和流程执行任务,例如整理资料、修改文档、分析数据、生成网页、开发应用、检查代码、创建演示稿、测试网页流程等。
更准确地说:
-
**ChatGPT 更像“对话和思考助手”**:适合问答、讨论、头脑风暴、草稿写作。 -
**Codex 更像“可执行任务的工作代理”**:适合需要读取资料、创建文件、运行命令、修改项目、调用工具、反复验证的任务。
Codex 不是替代你的判断。你仍然需要决定目标、边界、权限、是否采纳结果,以及最终内容是否可以发布或提交。
1.1 Codex 能做什么
常见任务包括:
-
整理本地文件夹,提取关键信息,生成 Markdown、Word、PDF、Excel 或 PPT。 -
分析 CSV、Excel、日志、调研材料,生成报告和图表。 -
阅读代码库,定位文件,修 bug,做重构,补测试,生成变更说明。 -
调用插件读取 Gmail、Slack、Linear、Google Drive 等外部信息。 -
使用浏览器或电脑控制能力测试网页、操作本地应用、截取证据。 -
把稳定流程封装成技能,让下次直接复用。 -
把重复任务设置成自动化,让 Codex 定时执行并把结果交给你审阅。
1.2 Codex 和普通聊天工具的差异
|
|
|
|
|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
2. 建立项目、线程和文件边界
Codex 的基本工作单位是线程和项目。
-
线程:类似 ChatGPT 里的一个聊天。一个线程可以独立存在,也可以放进某个项目。 -
项目:连接到你电脑上的一个文件夹,用来组织同一类任务、资料和输出文件。 -
项目文件夹:Codex 在本地工作时,默认主要围绕这个文件夹读取、创建和修改文件。
2.1 创建第一个项目
建议给 Codex 单独建一个总文件夹,例如:
Codex/ 客流分析/ 短视频文案/ 公司周报/ 网站改版/操作步骤:
打开 Codex App。 新建线程,选择创建项目或绑定已有文件夹。 把本次任务需要的文件放进项目文件夹。 在输入框中说明目标、输入文件、输出格式和完成标准。 示例提示词:
请先检查这个项目文件夹,告诉我里面有哪些文件、每个文件大概是什么用途,然后建议一个可以安全完成的小任务。先不要修改文件。2.2 文件访问不是“全电脑默认开放”
进阶使用里最重要的安全认知是:Codex 默认不应该被理解成“可以随便访问电脑上的任何文件”。在本地项目中,它通常只能在你指定的项目文件夹和你授权的工具范围内工作。
当任务需要访问项目外文件、联网、安装依赖、运行可能影响系统的命令、操作其他应用时,Codex 可能会请求更高权限。初学阶段建议坚持:
-
先把要处理的资料复制到项目文件夹。 -
默认权限能完成就不要开更高权限。 -
需要扩大权限时,先让 Codex 说明原因、涉及路径和预期结果。 -
对删除、覆盖、批量移动、提交、部署等操作保持人工确认。
2.3 处理本地文件的正确姿势
假设你有一个文件夹包含 60 张收据照片,可以这样做:
-
新建一个项目,例如“收据整理”。 -
把收据照片放进项目文件夹。 -
对 Codex 说:
请读取这个项目中的收据图片,提取日期、商家、金额、类别,生成一个 Excel 表格和一份 Markdown 汇总。不要删除或改动原始图片。完成后告诉我输出文件路径和你无法识别的图片清单。这样写比“帮我分析下载文件夹里的收据”更好,因为它限定了输入目录、输出格式、不要改动原文件、完成后需要证据。
2.4 用 @ 引用文件和上下文
在支持文件引用的界面中,你可以使用
@选择项目文件、插件或上下文对象。引用文件时要尽量具体:请基于 @调研记录.md 和 @访谈摘录.xlsx,生成一份 1500 字以内的商业分析摘要。只使用这两个文件中的信息,不要自行扩展案例。如果文件很多,不要只说“看一下这里的文件”,最好先让 Codex 列出它看到的文件,再指定要处理哪些。
3. 掌握权限、沙盒和安全审查
Codex 的能力越强,越需要清楚权限边界。进阶用户不是“把所有权限都打开”,而是知道什么时候该开放,什么时候该收住。
3.1 常见权限层级
不同版本和环境的界面名称可能略有差异,但基本逻辑类似:
-
默认权限:适合入门和大多数文档、代码、数据处理任务。 -
项目内文件读写:Codex 能在当前项目文件夹中创建和修改文件。 -
联网或插件权限:Codex 可以访问外部信息源或已授权服务。 -
终端命令权限:Codex 可以运行测试、构建、脚本、依赖安装等命令。 -
电脑控制权限:Codex 可以通过屏幕、鼠标和键盘操作应用。 -
完整权限或高级权限:只在你理解风险、任务确实需要时使用。
3.2 高风险操作清单
遇到这些操作,要先让 Codex 解释再执行:
-
删除、覆盖、批量重命名、批量移动文件。 -
修改系统配置、浏览器配置、密钥文件、证书、登录态。 -
安装依赖、升级工具、改 shell 配置或环境变量。 -
执行部署、发布、发邮件、发消息、提交表单、购买或付款。 -
访问包含隐私、合同、财务、医疗、法律内容的文件。 -
让电脑控制功能进入已登录的敏感后台。
3.3 推荐的安全提示词
你可以先读取项目文件并给出计划。在修改任何文件前,请列出要修改的文件、修改目的和验证方式。不要删除文件,不要访问项目外路径,不要联网,除非我明确同意。对于代码项目,可以这样说:
请先定位问题并说明根因,再做最小修改。修改后运行相关测试。最后列出改动文件、验证命令和剩余风险。
4. 用线程和多代理并行工作
Codex App 的一个核心价值,是把多个任务分成不同线程同时推进,而不是把所有事塞进一个聊天里。
4.1 什么时候开新线程
适合开新线程的情况:
-
一个线程做数据清洗,另一个线程写报告。 -
一个线程分析代码库,另一个线程修复构建错误。 -
一个线程生成 PPT,另一个线程准备讲稿。 -
一个线程探索方案,另一个线程只做审查。
不建议把互相冲突的任务放在多个线程里同时改同一批文件,除非你清楚工作树和合并方式。
4.2 使用 Steer 中途纠偏
Codex 执行任务时,如果你发现它理解偏了,不一定要中断重来。可以直接补充新指令,并使用 Steer 让它调整方向。
示例:
方向修正:不要写成教程风格,改成老板能直接看的汇报稿。保留已整理出的数据,但重写结论部分。好的纠偏要说明三件事:保留什么、改变什么、不要做什么。
4.3 并行任务的命名方法
建议给线程取清晰名字:
-
客流分析 – 数据清洗 -
客流分析 – 报告正文 -
客流分析 – PPT 生成 -
网站改版 – UI 实现 -
网站改版 – 测试验收
这样后面搜索、复盘、继续任务都会更容易。
5. 使用 Git、差异审查和工作树
如果你的项目是代码库,Codex 的工作不应该止步于“改完了”。你需要看差异、跑测试、确认没有误改。
5.1 改代码前先让 Codex 找边界
示例提示词:
请先阅读项目结构,找出这个功能相关的文件。先不要修改代码,先告诉我你准备改哪些文件、为什么改、如何验证。5.2 审查 diff
Codex App 支持在任务线程中查看改动差异。你应该重点检查:
-
是否修改了无关文件。 -
是否删除了有用逻辑。 -
是否引入新依赖。 -
是否只改了表象,没有修根因。 -
是否有测试或可复核的验证结果。
5.3 工作树和并行开发
Codex App 支持用独立工作树让多个代理在同一仓库上探索不同方向。这样可以降低直接污染主工作区的风险。
适合使用工作树的情况:
-
同时尝试两个实现方案。 -
一个线程做功能,一个线程做测试。 -
一个线程重构,一个线程验证兼容性。 -
让 Codex 先在隔离环境中试错,再把稳定改动带回主分支。
6. 利用持久记忆和 AGENTS.md
Codex 可以通过项目说明和记忆机制理解你的偏好。这里要区分两类东西:
-
显式项目规则:通常写在 AGENTS.md 中,适合保存项目约定、写作格式、测试要求、交付标准。 -
自动或辅助记忆:Codex 可能根据你的历史使用生成偏好摘要,适合帮助它理解你的长期习惯。
6.1 AGENTS.md 适合写什么
适合放进 AGENTS.md 的内容:
# 项目工作约定- 修改前先说明计划。- 文档输出使用中文,语气正式但不要空泛。- 数据分析不得超出原始表格和用户需求的交集。- 代码改动后必须运行 lint、typecheck 或相关测试。- 最终回复列出改动文件、验证结果和剩余风险。这类规则越具体越有用。不要只写“写得好一点”“认真一点”,而要写清楚判断标准。
6.2 让 Codex 记住一次成功流程
当一次输出符合预期,可以说:
这个版本的结构和语气是我想要的。请把它整理成项目规则,写入 AGENTS.md,之后同类报告都按这个格式来。如果只是临时偏好,不要写进长期规则。长期规则太多,会让 Codex 后续任务变得僵硬。
6.3 自动记忆的使用边界
自动记忆适合辅助上下文,但不应该替代当前文件和当前指令。对于容易变化的事实,例如软件版本、价格、政策、接口文档、公司负责人、最新功能,仍要让 Codex 现场核对。
7. 安装和使用插件
插件是 Codex 连接外部工具和数据源的桥梁。它可以让 Codex 使用 Google Drive、Gmail、Slack、Linear、浏览器、文档、表格、演示稿等能力,具体取决于你安装和授权了哪些插件。
7.1 插件适合解决什么问题
使用插件的典型场景:
-
从 Gmail 中筛选合作邮件。 -
从 Slack 中整理项目讨论。 -
从 Google Drive 中读取最新文档。 -
从 Linear 或 GitHub 中整理 issue 和 PR。 -
用 Presentations 插件创建或修改 PPT。 -
用 Spreadsheets 插件处理表格。 -
用 Browser Use 测试网页。
7.2 安装插件
一般流程:
-
打开 Codex 左上角的 Plugins 或插件入口。 -
浏览插件库,选择需要的插件。 -
按提示授权对应服务。 -
回到线程中,让 Codex 使用该插件完成任务。
授权插件前要确认:这个插件会访问哪些账户、哪些文件、哪些权限。
7.3 插件使用示例
假设你想分析最近两周的邮件:
请使用 Gmail 插件查看我过去两周的邮件,找出所有品牌合作邀约。请整理成表格:发件人、品牌、合作类型、预算信息、截止时间、建议回复。不要发送邮件,只生成草稿建议。如果界面支持直接引用插件,可以通过
@Gmail之类的方式选择;如果不支持,直接在任务里明确“使用 Gmail 插件”即可。
8. 创建和优化技能
技能是可重复使用的工作流程模板。插件解决“连接什么工具”,技能解决“按什么流程做事”。
一个简单判断:
-
需要外部数据或工具:用插件。 -
需要固定流程、格式、语气、检查清单:用技能。 -
既要外部数据,又要固定流程:插件和技能一起用。
8.1 创建技能的两种方法
方法一:直接创建
请创建一个名为“品牌合作邮件分析”的技能。用途:分析 Gmail 中的合作邀约,输出合作方、预算、风险、建议回复。要求:中文表格输出,最后给出优先级排序。方法二:从成功工作流反推(推荐)
先让 Codex 完成一次真实任务。 反复调整,直到输出结构、语气和检查项都满意。 再说: 请把刚才这个稳定流程整理成一个技能。包含触发场景、输入要求、处理步骤、输出格式、质量检查清单。8.2 使用技能
在 Codex 线程中,通常可以输入
$来选择技能。例如:$品牌合作邮件分析 请分析最近两周的合作邮件,并生成跟进清单。技能不是一次写完就永远不变。每次使用后,如果发现少了检查项或格式不顺,可以让 Codex 更新技能。
8.3 技能写得好的标准
好的技能应该包含:
-
适用场景:什么时候用,什么时候不用。 -
输入要求:需要哪些文件、插件或上下文。 -
操作步骤:先检查什么,再生成什么。 -
输出格式:标题、表格、段落、文件类型。 -
质量标准:哪些内容必须核对,哪些风险要提醒。 -
禁止事项:不要扩展、不要发送、不要删除、不要编造。
9. 生成图像和多媒体素材
Codex 可以通过图像生成技能或相关插件调用 GPT Image 等能力,创建图片、素材、网页视觉、产品图、游戏资产等。
9.1 生成产品图片
示例流程:
-
创建项目,例如“产品内容”。 -
放入产品照片、品牌色、参考图。 -
写清楚输出目标:数量、比例、场景、风格、用途。 -
让 Codex 保存图片,并生成文件清单。
示例提示词:
请基于项目里的毛衣照片,生成 5 张电商详情页可用的模特场景图。要求:竖版 4:5,背景简洁,突出衣服材质,不要改变毛衣颜色。生成后列出每张图的文件名和适合使用的位置。9.2 图像任务的质量检查
生成图片后不要只看“好不好看”,还要检查:
-
产品是否变形、颜色是否偏差。 -
文字是否拼错或乱码。 -
人物手部、边缘、材质是否异常。 -
图片尺寸是否适合平台。 -
是否侵犯品牌、肖像、版权或平台规则。
9.3 和其他能力组合
图像生成经常和其他技能组合:
-
先用文档技能写广告文案,再生成配图。 -
先用表格整理产品卖点,再批量生成图片提示词。 -
先用浏览器检查网页,再让 Codex 替换不合适的图片。 -
先生成游戏资产,再让 Codex 写入前端项目并测试显示效果。
10. 控制浏览器和电脑
浏览器控制和电脑控制是 Codex 的进阶能力。它们很强,但也更需要边界。
10.1 浏览器控制适合什么
Browser Use 适合:
-
测试本地网页按钮、导航、表单、响应式布局。 -
检查页面是否加载成功。 -
截图记录前后变化。 -
抓取你明确允许访问的网页信息。 -
复现用户路径中的 bug。
示例提示词:
请打开本地网页 http://localhost:3000,测试首页导航、搜索框和提交按钮。每发现一个问题,请记录复现步骤、截图位置和建议修复方式。不要登录任何敏感账号。10.2 电脑控制适合什么
Computer Use 可以模拟点击、输入、切换窗口等操作,适合处理没有 API 或插件的桌面应用。
适合场景:
-
在设计工具中导出素材。 -
在演示软件中检查版式。 -
在浏览器中操作只支持图形界面的后台。 -
在本地应用中执行重复但可观察的步骤。
不适合场景:
-
金融交易、付款、医疗、法律、身份认证等高风险流程。 -
大量不可逆操作。 -
需要输入密码、验证码、密钥的流程。 -
你无法复核结果的黑箱操作。
10.3 电脑控制的安全提示词
你可以使用 Computer Use 观察和操作界面。遇到登录、付款、发送、删除、提交表单、授权、修改账号设置时必须停下来说明情况。每完成一个阶段,请告诉我你做了什么,并保留可复核截图或路径。
11. 设置自动化任务
自动化让 Codex 按计划重复执行任务。它适合稳定、明确、可复核的工作,而不是一次性探索任务。
11.1 什么任务适合自动化
适合自动化的任务:
-
每周五生成工作总结。 -
每天早上整理昨日新增文件。 -
定期检查 issue 或 bug 报告。 -
每周清理一份数据导出并生成摘要。 -
定期汇总项目进展、风险和待办。
不适合自动化的任务:
-
目标还没稳定的探索型任务。 -
需要频繁人工判断的任务。 -
涉及付款、发送、发布、删除的任务。 -
输入数据来源不稳定且缺少检查规则的任务。
11.2 创建自动化
建议先在普通线程里跑通一次,再创建自动化。
示例:
请每周五下午 5 点回到这个线程,读取本项目本周新增和修改的文件,生成一份周报:完成事项、未完成事项、风险、下周建议。结果只生成 Markdown,不要发送到任何外部平台。11.3 管理和审阅自动化
自动化完成后,通常应该把结果交给你审阅。你需要检查:
-
是否用了正确的数据源。 -
是否遗漏了关键文件。 -
是否产生了不应发布的敏感内容。 -
是否需要人工补充背景判断。
如果你在本地运行 Codex,自动化效果还依赖电脑是否开机、Codex 是否运行、网络和插件授权是否有效。
12. 使用 Chronicle 功能(研究预览)
Chronicle 是 Codex 的研究预览能力之一。如果你的版本中可见,它可以帮助 Codex 理解你最近在屏幕上处理的工作上下文。
12.1 什么时候使用 Chronicle
适合场景:
-
你刚在浏览器、文档、PPT、表格里看过一批资料,希望 Codex 帮你总结当前工作。 -
你想让 Codex 根据最近活动判断“我现在在做什么”。 -
你需要把跨应用的工作过程整理成下一步计划。
示例提示词:
请结合 Chronicle 中最近的上下文,判断我现在主要在推进什么任务,并给出 3 个 Codex 可以继续帮我完成的具体动作。12.2 隐私注意事项
Chronicle 可能涉及屏幕活动记录。使用前要确认:
-
当前屏幕是否包含隐私、客户资料、密钥、聊天记录或财务信息。 -
是否处在允许记录屏幕的工作环境。 -
是否需要临时关闭或限制记录范围。
13. 推荐进阶工作流
下面是几个可以直接套用的组合流程。
13.1 文档审稿工作流
请审核 @报告草稿.md。先列出问题清单,按严重程度排序。然后直接在文档中补齐缺漏、修正不准确表述、统一标题层级。不要改变原本的核心立场。最后列出修改摘要和仍需人工确认的内容。适合:教程、报告、申请书、项目文档、公众号长文。
13.2 数据分析工作流
请读取项目中的 Excel 文件和需求说明。只分析“需求”和“数据字段”同时支持的内容,不要自行扩展。输出:字段理解、可做分析、不能做分析、核心结论、图表建议。适合:客流分析、销售报表、用户反馈、运营数据。
13.3 代码修复工作流
请复现这个 bug,找到根因,并做最小修复。修改前先说明涉及文件。修改后运行相关测试,并给出验证证据。不要做无关重构,不要引入新依赖。适合:前端 bug、后端接口、脚本错误、构建失败。
13.4 网页验收工作流
请启动或访问这个本地网页,用浏览器测试桌面和移动端视图。检查:页面是否空白、按钮是否可点、文字是否重叠、图片是否加载、主要流程是否走通。发现问题请截图并给出修复建议。适合:落地页、工具页、小游戏、后台界面。
13.5 自动化周报工作流
每周五 17:00,读取这个项目本周新增和修改的文件,生成周报。结构:本周完成、关键进展、风险、下周建议、需要我确认的事项。只生成 Markdown,不要发送到外部平台。适合:个人周报、项目复盘、团队进展总结。
14. 常见错误和修正方式
14.1 只给任务,不给边界
不推荐:
帮我整理一下这个文件夹。推荐:
请读取这个项目文件夹,按文件类型整理清单,生成 index.md。不要移动、删除或重命名任何原文件。14.2 让 Codex 自行扩展事实
不推荐:
根据这个表格写一份很完整的商业方案。推荐:
请只基于表格中已有字段和我给出的需求写方案。如果某个结论缺少数据支撑,请单独列为“不能确认”。14.3 不要求验证
不推荐:
修好这个项目。推荐:
请修复报错,并运行能证明修复有效的测试或启动命令。最后告诉我验证命令、结果和仍未覆盖的风险。14.4 长期规则写得太空
不推荐写入 AGENTS.md:
以后都要写得专业一点。推荐写入 AGENTS.md:
正式报告使用中文,先给结论,再给依据;每个建议必须对应数据或材料证据;不能确认的内容放入“需补充材料”,不要写成确定结论。
15. 完成任务前的检查清单
每次让 Codex 完成一个比较重要的任务,都建议按这个清单收尾:
-
是否说明了实际读取或修改了哪些文件。 -
是否列出了输出文件路径。 -
是否保留了原始文件。 -
是否跑了必要的测试、预览、截图或数据核对。 -
是否说明了哪些内容来自文件,哪些是推断。 -
是否标出了无法确认的信息。 -
是否有权限、隐私、外部发送或删除风险。 -
是否给出了下一步可以直接执行的动作。
总结
Codex 的进阶用法不是“让 AI 随便操作电脑”,而是把任务拆成可授权、可执行、可审查、可复用的工作流。
你需要重点掌握九个能力:
-
项目和线程:用项目绑定文件夹,用线程拆分任务。 -
文件处理:在明确边界内读取、创建、修改文件。 -
权限控制:默认小权限,必要时再扩大。 -
多代理并行:用多个线程同时推进不同任务。 -
Git 和差异审查:看 diff、跑测试、保留回滚能力。 -
记忆和 AGENTS.md:把稳定偏好写成项目规则。 -
插件系统:连接外部工具和数据源。 -
技能系统:把成功流程沉淀成可复用 SOP。 -
自动化:让稳定任务定时执行,并保留人工审阅。
一句话记住:ChatGPT 帮你想清楚,Codex 帮你把事情推进到文件、代码、表格、网页和可验证结果。
官方参考资料
-
What is Codex? – OpenAI Academy -
How to get started with Codex – OpenAI Academy -
Working with Codex – OpenAI Academy -
Plugins and skills – OpenAI Academy -
Automations – OpenAI Academy -
Introducing the Codex app – OpenAI -
Codex use cases – OpenAI Developers
夜雨聆风