乐于分享
好东西不私藏

codex app 进阶教程–都是技巧

codex app 进阶教程–都是技巧

教程目标

本教程帮助你掌握 OpenAI Codex App 的核心工作方式:如何让 Codex 在本地项目中读取、创建和修改文件,如何使用插件、技能、自动化、浏览器与电脑控制能力,以及如何用更安全的方式把任务交给 AI 智能体完成。

读完后,你应该能做到三件事:

  1. 知道什么任务适合交给 Codex,什么任务仍需要自己判断。
  2. 能把文件、项目、权限、插件、技能和自动化组织成稳定工作流。
  3. 能审查 Codex 的输出,避免权限过宽、文件改错、结果不可复核等问题。

适用人群

  • 已经会用 ChatGPT、Claude 等 AI 工具,想进一步把 AI 用到真实文件和工作流中的用户。
  • 需要处理文档、表格、邮件、网页、代码、报告、图片和演示稿的知识工作者。
  • 希望用 AI 辅助编程、内容创作、数据分析、项目管理和自动化任务的技术爱好者。
  • 想在本地电脑上建立可复用 SOP、个人知识库、项目协作流程的人。

1. 理解 Codex 的基本概念

Codex 是 OpenAI 的 AI 智能体工具。它不只是回答问题,还可以在你授权的范围内跨文件、工具和流程执行任务,例如整理资料、修改文档、分析数据、生成网页、开发应用、检查代码、创建演示稿、测试网页流程等。

更准确地说:

  • **ChatGPT 更像“对话和思考助手”**:适合问答、讨论、头脑风暴、草稿写作。
  • **Codex 更像“可执行任务的工作代理”**:适合需要读取资料、创建文件、运行命令、修改项目、调用工具、反复验证的任务。

Codex 不是替代你的判断。你仍然需要决定目标、边界、权限、是否采纳结果,以及最终内容是否可以发布或提交。

1.1 Codex 能做什么

常见任务包括:

  • 整理本地文件夹,提取关键信息,生成 Markdown、Word、PDF、Excel 或 PPT。
  • 分析 CSV、Excel、日志、调研材料,生成报告和图表。
  • 阅读代码库,定位文件,修 bug,做重构,补测试,生成变更说明。
  • 调用插件读取 Gmail、Slack、Linear、Google Drive 等外部信息。
  • 使用浏览器或电脑控制能力测试网页、操作本地应用、截取证据。
  • 把稳定流程封装成技能,让下次直接复用。
  • 把重复任务设置成自动化,让 Codex 定时执行并把结果交给你审阅。

1.2 Codex 和普通聊天工具的差异

对比项
普通聊天工具
Codex
主要形态
问答、草稿、讨论
任务执行、文件修改、工具调用
工作对象
你粘贴进去的内容为主
项目文件夹、插件数据、浏览器、终端、应用界面
输出结果
文本回答为主
文件、代码、表格、网页、报告、提交差异、验证结果
权限边界
通常不能直接动本地文件
在你授权范围内读取、创建、修改文件和运行工具
适合场景
想清楚问题
把任务推进到可检查的结果

2. 建立项目、线程和文件边界

Codex 的基本工作单位是线程项目

  • 线程:类似 ChatGPT 里的一个聊天。一个线程可以独立存在,也可以放进某个项目。
  • 项目:连接到你电脑上的一个文件夹,用来组织同一类任务、资料和输出文件。
  • 项目文件夹:Codex 在本地工作时,默认主要围绕这个文件夹读取、创建和修改文件。

2.1 创建第一个项目

建议给 Codex 单独建一个总文件夹,例如:

Codex/  客流分析/  短视频文案/  公司周报/  网站改版/

操作步骤:

  1. 打开 Codex App。
  2. 新建线程,选择创建项目或绑定已有文件夹。
  3. 把本次任务需要的文件放进项目文件夹。
  4. 在输入框中说明目标、输入文件、输出格式和完成标准。

示例提示词:

请先检查这个项目文件夹,告诉我里面有哪些文件、每个文件大概是什么用途,然后建议一个可以安全完成的小任务。先不要修改文件。

2.2 文件访问不是“全电脑默认开放”

进阶使用里最重要的安全认知是:Codex 默认不应该被理解成“可以随便访问电脑上的任何文件”。在本地项目中,它通常只能在你指定的项目文件夹和你授权的工具范围内工作。

当任务需要访问项目外文件、联网、安装依赖、运行可能影响系统的命令、操作其他应用时,Codex 可能会请求更高权限。初学阶段建议坚持:

  • 先把要处理的资料复制到项目文件夹。
  • 默认权限能完成就不要开更高权限。
  • 需要扩大权限时,先让 Codex 说明原因、涉及路径和预期结果。
  • 对删除、覆盖、批量移动、提交、部署等操作保持人工确认。

2.3 处理本地文件的正确姿势

假设你有一个文件夹包含 60 张收据照片,可以这样做:

  1. 新建一个项目,例如“收据整理”。
  2. 把收据照片放进项目文件夹。
  3. 对 Codex 说:
请读取这个项目中的收据图片,提取日期、商家、金额、类别,生成一个 Excel 表格和一份 Markdown 汇总。不要删除或改动原始图片。完成后告诉我输出文件路径和你无法识别的图片清单。

这样写比“帮我分析下载文件夹里的收据”更好,因为它限定了输入目录、输出格式、不要改动原文件、完成后需要证据。

2.4 用 @ 引用文件和上下文

在支持文件引用的界面中,你可以使用 @ 选择项目文件、插件或上下文对象。引用文件时要尽量具体:

请基于 @调研记录.md 和 @访谈摘录.xlsx,生成一份 1500 字以内的商业分析摘要。只使用这两个文件中的信息,不要自行扩展案例。

如果文件很多,不要只说“看一下这里的文件”,最好先让 Codex 列出它看到的文件,再指定要处理哪些。


3. 掌握权限、沙盒和安全审查

Codex 的能力越强,越需要清楚权限边界。进阶用户不是“把所有权限都打开”,而是知道什么时候该开放,什么时候该收住。

3.1 常见权限层级

不同版本和环境的界面名称可能略有差异,但基本逻辑类似:

  • 默认权限:适合入门和大多数文档、代码、数据处理任务。
  • 项目内文件读写:Codex 能在当前项目文件夹中创建和修改文件。
  • 联网或插件权限:Codex 可以访问外部信息源或已授权服务。
  • 终端命令权限:Codex 可以运行测试、构建、脚本、依赖安装等命令。
  • 电脑控制权限:Codex 可以通过屏幕、鼠标和键盘操作应用。
  • 完整权限或高级权限:只在你理解风险、任务确实需要时使用。

3.2 高风险操作清单

遇到这些操作,要先让 Codex 解释再执行:

  • 删除、覆盖、批量重命名、批量移动文件。
  • 修改系统配置、浏览器配置、密钥文件、证书、登录态。
  • 安装依赖、升级工具、改 shell 配置或环境变量。
  • 执行部署、发布、发邮件、发消息、提交表单、购买或付款。
  • 访问包含隐私、合同、财务、医疗、法律内容的文件。
  • 让电脑控制功能进入已登录的敏感后台。

3.3 推荐的安全提示词

你可以先读取项目文件并给出计划。在修改任何文件前,请列出要修改的文件、修改目的和验证方式。不要删除文件,不要访问项目外路径,不要联网,除非我明确同意。

对于代码项目,可以这样说:

请先定位问题并说明根因,再做最小修改。修改后运行相关测试。最后列出改动文件、验证命令和剩余风险。


4. 用线程和多代理并行工作

Codex App 的一个核心价值,是把多个任务分成不同线程同时推进,而不是把所有事塞进一个聊天里。

4.1 什么时候开新线程

适合开新线程的情况:

  • 一个线程做数据清洗,另一个线程写报告。
  • 一个线程分析代码库,另一个线程修复构建错误。
  • 一个线程生成 PPT,另一个线程准备讲稿。
  • 一个线程探索方案,另一个线程只做审查。

不建议把互相冲突的任务放在多个线程里同时改同一批文件,除非你清楚工作树和合并方式。

4.2 使用 Steer 中途纠偏

Codex 执行任务时,如果你发现它理解偏了,不一定要中断重来。可以直接补充新指令,并使用 Steer 让它调整方向。

示例:

方向修正:不要写成教程风格,改成老板能直接看的汇报稿。保留已整理出的数据,但重写结论部分。

好的纠偏要说明三件事:保留什么、改变什么、不要做什么。

4.3 并行任务的命名方法

建议给线程取清晰名字:

  • 客流分析 – 数据清洗
  • 客流分析 – 报告正文
  • 客流分析 – PPT 生成
  • 网站改版 – UI 实现
  • 网站改版 – 测试验收

这样后面搜索、复盘、继续任务都会更容易。


5. 使用 Git、差异审查和工作树

如果你的项目是代码库,Codex 的工作不应该止步于“改完了”。你需要看差异、跑测试、确认没有误改。

5.1 改代码前先让 Codex 找边界

示例提示词:

请先阅读项目结构,找出这个功能相关的文件。先不要修改代码,先告诉我你准备改哪些文件、为什么改、如何验证。

5.2 审查 diff

Codex App 支持在任务线程中查看改动差异。你应该重点检查:

  • 是否修改了无关文件。
  • 是否删除了有用逻辑。
  • 是否引入新依赖。
  • 是否只改了表象,没有修根因。
  • 是否有测试或可复核的验证结果。

5.3 工作树和并行开发

Codex App 支持用独立工作树让多个代理在同一仓库上探索不同方向。这样可以降低直接污染主工作区的风险。

适合使用工作树的情况:

  • 同时尝试两个实现方案。
  • 一个线程做功能,一个线程做测试。
  • 一个线程重构,一个线程验证兼容性。
  • 让 Codex 先在隔离环境中试错,再把稳定改动带回主分支。

6. 利用持久记忆和 AGENTS.md

Codex 可以通过项目说明和记忆机制理解你的偏好。这里要区分两类东西:

  • 显式项目规则:通常写在 AGENTS.md 中,适合保存项目约定、写作格式、测试要求、交付标准。
  • 自动或辅助记忆:Codex 可能根据你的历史使用生成偏好摘要,适合帮助它理解你的长期习惯。

6.1 AGENTS.md 适合写什么

适合放进 AGENTS.md 的内容:

# 项目工作约定- 修改前先说明计划。- 文档输出使用中文,语气正式但不要空泛。- 数据分析不得超出原始表格和用户需求的交集。- 代码改动后必须运行 lint、typecheck 或相关测试。- 最终回复列出改动文件、验证结果和剩余风险。

这类规则越具体越有用。不要只写“写得好一点”“认真一点”,而要写清楚判断标准。

6.2 让 Codex 记住一次成功流程

当一次输出符合预期,可以说:

这个版本的结构和语气是我想要的。请把它整理成项目规则,写入 AGENTS.md,之后同类报告都按这个格式来。

如果只是临时偏好,不要写进长期规则。长期规则太多,会让 Codex 后续任务变得僵硬。

6.3 自动记忆的使用边界

自动记忆适合辅助上下文,但不应该替代当前文件和当前指令。对于容易变化的事实,例如软件版本、价格、政策、接口文档、公司负责人、最新功能,仍要让 Codex 现场核对。


7. 安装和使用插件

插件是 Codex 连接外部工具和数据源的桥梁。它可以让 Codex 使用 Google Drive、Gmail、Slack、Linear、浏览器、文档、表格、演示稿等能力,具体取决于你安装和授权了哪些插件。

7.1 插件适合解决什么问题

使用插件的典型场景:

  • 从 Gmail 中筛选合作邮件。
  • 从 Slack 中整理项目讨论。
  • 从 Google Drive 中读取最新文档。
  • 从 Linear 或 GitHub 中整理 issue 和 PR。
  • 用 Presentations 插件创建或修改 PPT。
  • 用 Spreadsheets 插件处理表格。
  • 用 Browser Use 测试网页。

7.2 安装插件

一般流程:

  1. 打开 Codex 左上角的 Plugins 或插件入口。
  2. 浏览插件库,选择需要的插件。
  3. 按提示授权对应服务。
  4. 回到线程中,让 Codex 使用该插件完成任务。

授权插件前要确认:这个插件会访问哪些账户、哪些文件、哪些权限。

7.3 插件使用示例

假设你想分析最近两周的邮件:

请使用 Gmail 插件查看我过去两周的邮件,找出所有品牌合作邀约。请整理成表格:发件人、品牌、合作类型、预算信息、截止时间、建议回复。不要发送邮件,只生成草稿建议。

如果界面支持直接引用插件,可以通过 @Gmail 之类的方式选择;如果不支持,直接在任务里明确“使用 Gmail 插件”即可。


8. 创建和优化技能

技能是可重复使用的工作流程模板。插件解决“连接什么工具”,技能解决“按什么流程做事”。

一个简单判断:

  • 需要外部数据或工具:用插件。
  • 需要固定流程、格式、语气、检查清单:用技能。
  • 既要外部数据,又要固定流程:插件和技能一起用。

8.1 创建技能的两种方法

方法一:直接创建

请创建一个名为“品牌合作邮件分析”的技能。用途:分析 Gmail 中的合作邀约,输出合作方、预算、风险、建议回复。要求:中文表格输出,最后给出优先级排序。

方法二:从成功工作流反推(推荐)

  1. 先让 Codex 完成一次真实任务。
  2. 反复调整,直到输出结构、语气和检查项都满意。
  3. 再说:
请把刚才这个稳定流程整理成一个技能。包含触发场景、输入要求、处理步骤、输出格式、质量检查清单。

8.2 使用技能

在 Codex 线程中,通常可以输入 $ 来选择技能。例如:

$品牌合作邮件分析 请分析最近两周的合作邮件,并生成跟进清单。

技能不是一次写完就永远不变。每次使用后,如果发现少了检查项或格式不顺,可以让 Codex 更新技能。

8.3 技能写得好的标准

好的技能应该包含:

  • 适用场景:什么时候用,什么时候不用。
  • 输入要求:需要哪些文件、插件或上下文。
  • 操作步骤:先检查什么,再生成什么。
  • 输出格式:标题、表格、段落、文件类型。
  • 质量标准:哪些内容必须核对,哪些风险要提醒。
  • 禁止事项:不要扩展、不要发送、不要删除、不要编造。

9. 生成图像和多媒体素材

Codex 可以通过图像生成技能或相关插件调用 GPT Image 等能力,创建图片、素材、网页视觉、产品图、游戏资产等。

9.1 生成产品图片

示例流程:

  1. 创建项目,例如“产品内容”。
  2. 放入产品照片、品牌色、参考图。
  3. 写清楚输出目标:数量、比例、场景、风格、用途。
  4. 让 Codex 保存图片,并生成文件清单。

示例提示词:

请基于项目里的毛衣照片,生成 5 张电商详情页可用的模特场景图。要求:竖版 4:5,背景简洁,突出衣服材质,不要改变毛衣颜色。生成后列出每张图的文件名和适合使用的位置。

9.2 图像任务的质量检查

生成图片后不要只看“好不好看”,还要检查:

  • 产品是否变形、颜色是否偏差。
  • 文字是否拼错或乱码。
  • 人物手部、边缘、材质是否异常。
  • 图片尺寸是否适合平台。
  • 是否侵犯品牌、肖像、版权或平台规则。

9.3 和其他能力组合

图像生成经常和其他技能组合:

  • 先用文档技能写广告文案,再生成配图。
  • 先用表格整理产品卖点,再批量生成图片提示词。
  • 先用浏览器检查网页,再让 Codex 替换不合适的图片。
  • 先生成游戏资产,再让 Codex 写入前端项目并测试显示效果。

10. 控制浏览器和电脑

浏览器控制和电脑控制是 Codex 的进阶能力。它们很强,但也更需要边界。

10.1 浏览器控制适合什么

Browser Use 适合:

  • 测试本地网页按钮、导航、表单、响应式布局。
  • 检查页面是否加载成功。
  • 截图记录前后变化。
  • 抓取你明确允许访问的网页信息。
  • 复现用户路径中的 bug。

示例提示词:

请打开本地网页 http://localhost:3000,测试首页导航、搜索框和提交按钮。每发现一个问题,请记录复现步骤、截图位置和建议修复方式。不要登录任何敏感账号。

10.2 电脑控制适合什么

Computer Use 可以模拟点击、输入、切换窗口等操作,适合处理没有 API 或插件的桌面应用。

适合场景:

  • 在设计工具中导出素材。
  • 在演示软件中检查版式。
  • 在浏览器中操作只支持图形界面的后台。
  • 在本地应用中执行重复但可观察的步骤。

不适合场景:

  • 金融交易、付款、医疗、法律、身份认证等高风险流程。
  • 大量不可逆操作。
  • 需要输入密码、验证码、密钥的流程。
  • 你无法复核结果的黑箱操作。

10.3 电脑控制的安全提示词

你可以使用 Computer Use 观察和操作界面。遇到登录、付款、发送、删除、提交表单、授权、修改账号设置时必须停下来说明情况。每完成一个阶段,请告诉我你做了什么,并保留可复核截图或路径。


11. 设置自动化任务

自动化让 Codex 按计划重复执行任务。它适合稳定、明确、可复核的工作,而不是一次性探索任务。

11.1 什么任务适合自动化

适合自动化的任务:

  • 每周五生成工作总结。
  • 每天早上整理昨日新增文件。
  • 定期检查 issue 或 bug 报告。
  • 每周清理一份数据导出并生成摘要。
  • 定期汇总项目进展、风险和待办。

不适合自动化的任务:

  • 目标还没稳定的探索型任务。
  • 需要频繁人工判断的任务。
  • 涉及付款、发送、发布、删除的任务。
  • 输入数据来源不稳定且缺少检查规则的任务。

11.2 创建自动化

建议先在普通线程里跑通一次,再创建自动化。

示例:

请每周五下午 5 点回到这个线程,读取本项目本周新增和修改的文件,生成一份周报:完成事项、未完成事项、风险、下周建议。结果只生成 Markdown,不要发送到任何外部平台。

11.3 管理和审阅自动化

自动化完成后,通常应该把结果交给你审阅。你需要检查:

  • 是否用了正确的数据源。
  • 是否遗漏了关键文件。
  • 是否产生了不应发布的敏感内容。
  • 是否需要人工补充背景判断。

如果你在本地运行 Codex,自动化效果还依赖电脑是否开机、Codex 是否运行、网络和插件授权是否有效。


12. 使用 Chronicle 功能(研究预览)

Chronicle 是 Codex 的研究预览能力之一。如果你的版本中可见,它可以帮助 Codex 理解你最近在屏幕上处理的工作上下文。

12.1 什么时候使用 Chronicle

适合场景:

  • 你刚在浏览器、文档、PPT、表格里看过一批资料,希望 Codex 帮你总结当前工作。
  • 你想让 Codex 根据最近活动判断“我现在在做什么”。
  • 你需要把跨应用的工作过程整理成下一步计划。

示例提示词:

请结合 Chronicle 中最近的上下文,判断我现在主要在推进什么任务,并给出 3 个 Codex 可以继续帮我完成的具体动作。

12.2 隐私注意事项

Chronicle 可能涉及屏幕活动记录。使用前要确认:

  • 当前屏幕是否包含隐私、客户资料、密钥、聊天记录或财务信息。
  • 是否处在允许记录屏幕的工作环境。
  • 是否需要临时关闭或限制记录范围。

13. 推荐进阶工作流

下面是几个可以直接套用的组合流程。

13.1 文档审稿工作流

请审核 @报告草稿.md。先列出问题清单,按严重程度排序。然后直接在文档中补齐缺漏、修正不准确表述、统一标题层级。不要改变原本的核心立场。最后列出修改摘要和仍需人工确认的内容。

适合:教程、报告、申请书、项目文档、公众号长文。

13.2 数据分析工作流

请读取项目中的 Excel 文件和需求说明。只分析“需求”和“数据字段”同时支持的内容,不要自行扩展。输出:字段理解、可做分析、不能做分析、核心结论、图表建议。

适合:客流分析、销售报表、用户反馈、运营数据。

13.3 代码修复工作流

请复现这个 bug,找到根因,并做最小修复。修改前先说明涉及文件。修改后运行相关测试,并给出验证证据。不要做无关重构,不要引入新依赖。

适合:前端 bug、后端接口、脚本错误、构建失败。

13.4 网页验收工作流

请启动或访问这个本地网页,用浏览器测试桌面和移动端视图。检查:页面是否空白、按钮是否可点、文字是否重叠、图片是否加载、主要流程是否走通。发现问题请截图并给出修复建议。

适合:落地页、工具页、小游戏、后台界面。

13.5 自动化周报工作流

每周五 17:00,读取这个项目本周新增和修改的文件,生成周报。结构:本周完成、关键进展、风险、下周建议、需要我确认的事项。只生成 Markdown,不要发送到外部平台。

适合:个人周报、项目复盘、团队进展总结。


14. 常见错误和修正方式

14.1 只给任务,不给边界

不推荐:

帮我整理一下这个文件夹。

推荐:

请读取这个项目文件夹,按文件类型整理清单,生成 index.md。不要移动、删除或重命名任何原文件。

14.2 让 Codex 自行扩展事实

不推荐:

根据这个表格写一份很完整的商业方案。

推荐:

请只基于表格中已有字段和我给出的需求写方案。如果某个结论缺少数据支撑,请单独列为“不能确认”。

14.3 不要求验证

不推荐:

修好这个项目。

推荐:

请修复报错,并运行能证明修复有效的测试或启动命令。最后告诉我验证命令、结果和仍未覆盖的风险。

14.4 长期规则写得太空

不推荐写入 AGENTS.md:

以后都要写得专业一点。

推荐写入 AGENTS.md:

正式报告使用中文,先给结论,再给依据;每个建议必须对应数据或材料证据;不能确认的内容放入“需补充材料”,不要写成确定结论。


15. 完成任务前的检查清单

每次让 Codex 完成一个比较重要的任务,都建议按这个清单收尾:

  • 是否说明了实际读取或修改了哪些文件。
  • 是否列出了输出文件路径。
  • 是否保留了原始文件。
  • 是否跑了必要的测试、预览、截图或数据核对。
  • 是否说明了哪些内容来自文件,哪些是推断。
  • 是否标出了无法确认的信息。
  • 是否有权限、隐私、外部发送或删除风险。
  • 是否给出了下一步可以直接执行的动作。

总结

Codex 的进阶用法不是“让 AI 随便操作电脑”,而是把任务拆成可授权、可执行、可审查、可复用的工作流。

你需要重点掌握九个能力:

  1. 项目和线程:用项目绑定文件夹,用线程拆分任务。
  2. 文件处理:在明确边界内读取、创建、修改文件。
  3. 权限控制:默认小权限,必要时再扩大。
  4. 多代理并行:用多个线程同时推进不同任务。
  5. Git 和差异审查:看 diff、跑测试、保留回滚能力。
  6. 记忆和 AGENTS.md:把稳定偏好写成项目规则。
  7. 插件系统:连接外部工具和数据源。
  8. 技能系统:把成功流程沉淀成可复用 SOP。
  9. 自动化:让稳定任务定时执行,并保留人工审阅。

一句话记住:ChatGPT 帮你想清楚,Codex 帮你把事情推进到文件、代码、表格、网页和可验证结果。

官方参考资料

  • What is Codex? – OpenAI Academy
  • How to get started with Codex – OpenAI Academy
  • Working with Codex – OpenAI Academy
  • Plugins and skills – OpenAI Academy
  • Automations – OpenAI Academy
  • Introducing the Codex app – OpenAI
  • Codex use cases – OpenAI Developers