codex app 进阶教程–都是技巧-夜雨聆风

codex app 进阶教程–都是技巧

教程目标

本教程帮助你掌握 OpenAI Codex App 的核心工作方式：如何让 Codex 在本地项目中读取、创建和修改文件，如何使用插件、技能、自动化、浏览器与电脑控制能力，以及如何用更安全的方式把任务交给 AI 智能体完成。

读完后，你应该能做到三件事：

知道什么任务适合交给 Codex，什么任务仍需要自己判断。
能把文件、项目、权限、插件、技能和自动化组织成稳定工作流。
能审查 Codex 的输出，避免权限过宽、文件改错、结果不可复核等问题。

适用人群

已经会用 ChatGPT、Claude 等 AI 工具，想进一步把 AI 用到真实文件和工作流中的用户。
需要处理文档、表格、邮件、网页、代码、报告、图片和演示稿的知识工作者。
希望用 AI 辅助编程、内容创作、数据分析、项目管理和自动化任务的技术爱好者。
想在本地电脑上建立可复用 SOP、个人知识库、项目协作流程的人。

1. 理解 Codex 的基本概念

Codex 是 OpenAI 的 AI 智能体工具。它不只是回答问题，还可以在你授权的范围内跨文件、工具和流程执行任务，例如整理资料、修改文档、分析数据、生成网页、开发应用、检查代码、创建演示稿、测试网页流程等。

更准确地说：

**ChatGPT 更像“对话和思考助手”**：适合问答、讨论、头脑风暴、草稿写作。
**Codex 更像“可执行任务的工作代理”**：适合需要读取资料、创建文件、运行命令、修改项目、调用工具、反复验证的任务。

Codex 不是替代你的判断。你仍然需要决定目标、边界、权限、是否采纳结果，以及最终内容是否可以发布或提交。

1.1 Codex 能做什么

常见任务包括：

整理本地文件夹，提取关键信息，生成 Markdown、Word、PDF、Excel 或 PPT。
分析 CSV、Excel、日志、调研材料，生成报告和图表。
阅读代码库，定位文件，修 bug，做重构，补测试，生成变更说明。
调用插件读取 Gmail、Slack、Linear、Google Drive 等外部信息。
使用浏览器或电脑控制能力测试网页、操作本地应用、截取证据。
把稳定流程封装成技能，让下次直接复用。
把重复任务设置成自动化，让 Codex 定时执行并把结果交给你审阅。

1.2 Codex 和普通聊天工具的差异

对比项	普通聊天工具	Codex
主要形态	问答、草稿、讨论	任务执行、文件修改、工具调用
工作对象	你粘贴进去的内容为主	项目文件夹、插件数据、浏览器、终端、应用界面
输出结果	文本回答为主	文件、代码、表格、网页、报告、提交差异、验证结果
权限边界	通常不能直接动本地文件	在你授权范围内读取、创建、修改文件和运行工具
适合场景	想清楚问题	把任务推进到可检查的结果

2. 建立项目、线程和文件边界

Codex 的基本工作单位是线程和项目。

线程：类似 ChatGPT 里的一个聊天。一个线程可以独立存在，也可以放进某个项目。
项目：连接到你电脑上的一个文件夹，用来组织同一类任务、资料和输出文件。
项目文件夹：Codex 在本地工作时，默认主要围绕这个文件夹读取、创建和修改文件。

2.1 创建第一个项目

建议给 Codex 单独建一个总文件夹，例如：

Codex/ 客流分析/ 短视频文案/ 公司周报/ 网站改版/

操作步骤：

打开 Codex App。
新建线程，选择创建项目或绑定已有文件夹。
把本次任务需要的文件放进项目文件夹。
在输入框中说明目标、输入文件、输出格式和完成标准。

示例提示词：

请先检查这个项目文件夹，告诉我里面有哪些文件、每个文件大概是什么用途，然后建议一个可以安全完成的小任务。先不要修改文件。

2.2 文件访问不是“全电脑默认开放”

进阶使用里最重要的安全认知是：Codex 默认不应该被理解成“可以随便访问电脑上的任何文件”。在本地项目中，它通常只能在你指定的项目文件夹和你授权的工具范围内工作。

当任务需要访问项目外文件、联网、安装依赖、运行可能影响系统的命令、操作其他应用时，Codex 可能会请求更高权限。初学阶段建议坚持：

先把要处理的资料复制到项目文件夹。
默认权限能完成就不要开更高权限。
需要扩大权限时，先让 Codex 说明原因、涉及路径和预期结果。
对删除、覆盖、批量移动、提交、部署等操作保持人工确认。

2.3 处理本地文件的正确姿势

假设你有一个文件夹包含 60 张收据照片，可以这样做：

新建一个项目，例如“收据整理”。
把收据照片放进项目文件夹。
对 Codex 说：

请读取这个项目中的收据图片，提取日期、商家、金额、类别，生成一个 Excel 表格和一份 Markdown 汇总。不要删除或改动原始图片。完成后告诉我输出文件路径和你无法识别的图片清单。

这样写比“帮我分析下载文件夹里的收据”更好，因为它限定了输入目录、输出格式、不要改动原文件、完成后需要证据。

2.4 用 @ 引用文件和上下文

在支持文件引用的界面中，你可以使用 @ 选择项目文件、插件或上下文对象。引用文件时要尽量具体：

请基于 @调研记录.md 和 @访谈摘录.xlsx，生成一份 1500 字以内的商业分析摘要。只使用这两个文件中的信息，不要自行扩展案例。

如果文件很多，不要只说“看一下这里的文件”，最好先让 Codex 列出它看到的文件，再指定要处理哪些。

3. 掌握权限、沙盒和安全审查

Codex 的能力越强，越需要清楚权限边界。进阶用户不是“把所有权限都打开”，而是知道什么时候该开放，什么时候该收住。

3.1 常见权限层级

不同版本和环境的界面名称可能略有差异，但基本逻辑类似：

默认权限：适合入门和大多数文档、代码、数据处理任务。
项目内文件读写：Codex 能在当前项目文件夹中创建和修改文件。
联网或插件权限：Codex 可以访问外部信息源或已授权服务。
终端命令权限：Codex 可以运行测试、构建、脚本、依赖安装等命令。
电脑控制权限：Codex 可以通过屏幕、鼠标和键盘操作应用。
完整权限或高级权限：只在你理解风险、任务确实需要时使用。

3.2 高风险操作清单

遇到这些操作，要先让 Codex 解释再执行：

删除、覆盖、批量重命名、批量移动文件。
修改系统配置、浏览器配置、密钥文件、证书、登录态。
安装依赖、升级工具、改 shell 配置或环境变量。
执行部署、发布、发邮件、发消息、提交表单、购买或付款。
访问包含隐私、合同、财务、医疗、法律内容的文件。
让电脑控制功能进入已登录的敏感后台。

3.3 推荐的安全提示词

你可以先读取项目文件并给出计划。在修改任何文件前，请列出要修改的文件、修改目的和验证方式。不要删除文件，不要访问项目外路径，不要联网，除非我明确同意。

对于代码项目，可以这样说：

请先定位问题并说明根因，再做最小修改。修改后运行相关测试。最后列出改动文件、验证命令和剩余风险。

4. 用线程和多代理并行工作

Codex App 的一个核心价值，是把多个任务分成不同线程同时推进，而不是把所有事塞进一个聊天里。

4.1 什么时候开新线程

适合开新线程的情况：

一个线程做数据清洗，另一个线程写报告。
一个线程分析代码库，另一个线程修复构建错误。
一个线程生成 PPT，另一个线程准备讲稿。
一个线程探索方案，另一个线程只做审查。

不建议把互相冲突的任务放在多个线程里同时改同一批文件，除非你清楚工作树和合并方式。

4.2 使用 Steer 中途纠偏

Codex 执行任务时，如果你发现它理解偏了，不一定要中断重来。可以直接补充新指令，并使用 Steer 让它调整方向。

示例：

方向修正：不要写成教程风格，改成老板能直接看的汇报稿。保留已整理出的数据，但重写结论部分。

好的纠偏要说明三件事：保留什么、改变什么、不要做什么。

4.3 并行任务的命名方法

建议给线程取清晰名字：

客流分析 – 数据清洗
客流分析 – 报告正文
客流分析 – PPT 生成
网站改版 – UI 实现
网站改版 – 测试验收

这样后面搜索、复盘、继续任务都会更容易。

5. 使用 Git、差异审查和工作树

如果你的项目是代码库，Codex 的工作不应该止步于“改完了”。你需要看差异、跑测试、确认没有误改。

5.1 改代码前先让 Codex 找边界

示例提示词：

请先阅读项目结构，找出这个功能相关的文件。先不要修改代码，先告诉我你准备改哪些文件、为什么改、如何验证。

5.2 审查 diff

Codex App 支持在任务线程中查看改动差异。你应该重点检查：

是否修改了无关文件。
是否删除了有用逻辑。
是否引入新依赖。
是否只改了表象，没有修根因。
是否有测试或可复核的验证结果。

5.3 工作树和并行开发

Codex App 支持用独立工作树让多个代理在同一仓库上探索不同方向。这样可以降低直接污染主工作区的风险。

适合使用工作树的情况：

同时尝试两个实现方案。
一个线程做功能，一个线程做测试。
一个线程重构，一个线程验证兼容性。
让 Codex 先在隔离环境中试错，再把稳定改动带回主分支。

6. 利用持久记忆和 AGENTS.md

Codex 可以通过项目说明和记忆机制理解你的偏好。这里要区分两类东西：

显式项目规则：通常写在 AGENTS.md 中，适合保存项目约定、写作格式、测试要求、交付标准。
自动或辅助记忆：Codex 可能根据你的历史使用生成偏好摘要，适合帮助它理解你的长期习惯。

6.1 AGENTS.md 适合写什么

适合放进 AGENTS.md 的内容：

# 项目工作约定- 修改前先说明计划。- 文档输出使用中文，语气正式但不要空泛。- 数据分析不得超出原始表格和用户需求的交集。- 代码改动后必须运行 lint、typecheck 或相关测试。- 最终回复列出改动文件、验证结果和剩余风险。

这类规则越具体越有用。不要只写“写得好一点”“认真一点”，而要写清楚判断标准。

6.2 让 Codex 记住一次成功流程

当一次输出符合预期，可以说：

这个版本的结构和语气是我想要的。请把它整理成项目规则，写入 AGENTS.md，之后同类报告都按这个格式来。

如果只是临时偏好，不要写进长期规则。长期规则太多，会让 Codex 后续任务变得僵硬。

6.3 自动记忆的使用边界

自动记忆适合辅助上下文，但不应该替代当前文件和当前指令。对于容易变化的事实，例如软件版本、价格、政策、接口文档、公司负责人、最新功能，仍要让 Codex 现场核对。

7. 安装和使用插件

插件是 Codex 连接外部工具和数据源的桥梁。它可以让 Codex 使用 Google Drive、Gmail、Slack、Linear、浏览器、文档、表格、演示稿等能力，具体取决于你安装和授权了哪些插件。

7.1 插件适合解决什么问题

使用插件的典型场景：

从 Gmail 中筛选合作邮件。
从 Slack 中整理项目讨论。
从 Google Drive 中读取最新文档。
从 Linear 或 GitHub 中整理 issue 和 PR。
用 Presentations 插件创建或修改 PPT。
用 Spreadsheets 插件处理表格。
用 Browser Use 测试网页。

7.2 安装插件

一般流程：

打开 Codex 左上角的 Plugins 或插件入口。
浏览插件库，选择需要的插件。
按提示授权对应服务。
回到线程中，让 Codex 使用该插件完成任务。

授权插件前要确认：这个插件会访问哪些账户、哪些文件、哪些权限。

7.3 插件使用示例

假设你想分析最近两周的邮件：

请使用 Gmail 插件查看我过去两周的邮件，找出所有品牌合作邀约。请整理成表格：发件人、品牌、合作类型、预算信息、截止时间、建议回复。不要发送邮件，只生成草稿建议。

如果界面支持直接引用插件，可以通过 @Gmail 之类的方式选择；如果不支持，直接在任务里明确“使用 Gmail 插件”即可。

8. 创建和优化技能

技能是可重复使用的工作流程模板。插件解决“连接什么工具”，技能解决“按什么流程做事”。

一个简单判断：

需要外部数据或工具：用插件。
需要固定流程、格式、语气、检查清单：用技能。
既要外部数据，又要固定流程：插件和技能一起用。

8.1 创建技能的两种方法

方法一：直接创建

请创建一个名为“品牌合作邮件分析”的技能。用途：分析 Gmail 中的合作邀约，输出合作方、预算、风险、建议回复。要求：中文表格输出，最后给出优先级排序。

方法二：从成功工作流反推（推荐）

先让 Codex 完成一次真实任务。
反复调整，直到输出结构、语气和检查项都满意。
再说：

请把刚才这个稳定流程整理成一个技能。包含触发场景、输入要求、处理步骤、输出格式、质量检查清单。

8.2 使用技能

在 Codex 线程中，通常可以输入 $ 来选择技能。例如：

$品牌合作邮件分析请分析最近两周的合作邮件，并生成跟进清单。

技能不是一次写完就永远不变。每次使用后，如果发现少了检查项或格式不顺，可以让 Codex 更新技能。

8.3 技能写得好的标准

好的技能应该包含：

适用场景：什么时候用，什么时候不用。
输入要求：需要哪些文件、插件或上下文。
操作步骤：先检查什么，再生成什么。
输出格式：标题、表格、段落、文件类型。
质量标准：哪些内容必须核对，哪些风险要提醒。
禁止事项：不要扩展、不要发送、不要删除、不要编造。

9. 生成图像和多媒体素材

Codex 可以通过图像生成技能或相关插件调用 GPT Image 等能力，创建图片、素材、网页视觉、产品图、游戏资产等。

9.1 生成产品图片

示例流程：

创建项目，例如“产品内容”。
放入产品照片、品牌色、参考图。
写清楚输出目标：数量、比例、场景、风格、用途。
让 Codex 保存图片，并生成文件清单。

示例提示词：

请基于项目里的毛衣照片，生成 5 张电商详情页可用的模特场景图。要求：竖版 4:5，背景简洁，突出衣服材质，不要改变毛衣颜色。生成后列出每张图的文件名和适合使用的位置。

9.2 图像任务的质量检查

生成图片后不要只看“好不好看”，还要检查：

产品是否变形、颜色是否偏差。
文字是否拼错或乱码。
人物手部、边缘、材质是否异常。
图片尺寸是否适合平台。
是否侵犯品牌、肖像、版权或平台规则。

9.3 和其他能力组合

图像生成经常和其他技能组合：

先用文档技能写广告文案，再生成配图。
先用表格整理产品卖点，再批量生成图片提示词。
先用浏览器检查网页，再让 Codex 替换不合适的图片。
先生成游戏资产，再让 Codex 写入前端项目并测试显示效果。

10. 控制浏览器和电脑

浏览器控制和电脑控制是 Codex 的进阶能力。它们很强，但也更需要边界。

10.1 浏览器控制适合什么

Browser Use 适合：

测试本地网页按钮、导航、表单、响应式布局。
检查页面是否加载成功。
截图记录前后变化。
抓取你明确允许访问的网页信息。
复现用户路径中的 bug。

示例提示词：

请打开本地网页 http://localhost:3000，测试首页导航、搜索框和提交按钮。每发现一个问题，请记录复现步骤、截图位置和建议修复方式。不要登录任何敏感账号。

10.2 电脑控制适合什么

Computer Use 可以模拟点击、输入、切换窗口等操作，适合处理没有 API 或插件的桌面应用。

适合场景：

在设计工具中导出素材。
在演示软件中检查版式。
在浏览器中操作只支持图形界面的后台。
在本地应用中执行重复但可观察的步骤。

不适合场景：

金融交易、付款、医疗、法律、身份认证等高风险流程。
大量不可逆操作。
需要输入密码、验证码、密钥的流程。
你无法复核结果的黑箱操作。

10.3 电脑控制的安全提示词

你可以使用 Computer Use 观察和操作界面。遇到登录、付款、发送、删除、提交表单、授权、修改账号设置时必须停下来说明情况。每完成一个阶段，请告诉我你做了什么，并保留可复核截图或路径。

11. 设置自动化任务

自动化让 Codex 按计划重复执行任务。它适合稳定、明确、可复核的工作，而不是一次性探索任务。

11.1 什么任务适合自动化

适合自动化的任务：

每周五生成工作总结。
每天早上整理昨日新增文件。
定期检查 issue 或 bug 报告。
每周清理一份数据导出并生成摘要。
定期汇总项目进展、风险和待办。

不适合自动化的任务：

目标还没稳定的探索型任务。
需要频繁人工判断的任务。
涉及付款、发送、发布、删除的任务。
输入数据来源不稳定且缺少检查规则的任务。

11.2 创建自动化

建议先在普通线程里跑通一次，再创建自动化。

示例：

请每周五下午 5 点回到这个线程，读取本项目本周新增和修改的文件，生成一份周报：完成事项、未完成事项、风险、下周建议。结果只生成 Markdown，不要发送到任何外部平台。

11.3 管理和审阅自动化

自动化完成后，通常应该把结果交给你审阅。你需要检查：

是否用了正确的数据源。
是否遗漏了关键文件。
是否产生了不应发布的敏感内容。
是否需要人工补充背景判断。

如果你在本地运行 Codex，自动化效果还依赖电脑是否开机、Codex 是否运行、网络和插件授权是否有效。

12. 使用 Chronicle 功能（研究预览）

Chronicle 是 Codex 的研究预览能力之一。如果你的版本中可见，它可以帮助 Codex 理解你最近在屏幕上处理的工作上下文。

12.1 什么时候使用 Chronicle

适合场景：

你刚在浏览器、文档、PPT、表格里看过一批资料，希望 Codex 帮你总结当前工作。
你想让 Codex 根据最近活动判断“我现在在做什么”。
你需要把跨应用的工作过程整理成下一步计划。

示例提示词：

请结合 Chronicle 中最近的上下文，判断我现在主要在推进什么任务，并给出 3 个 Codex 可以继续帮我完成的具体动作。

12.2 隐私注意事项

Chronicle 可能涉及屏幕活动记录。使用前要确认：

当前屏幕是否包含隐私、客户资料、密钥、聊天记录或财务信息。
是否处在允许记录屏幕的工作环境。
是否需要临时关闭或限制记录范围。

13. 推荐进阶工作流

下面是几个可以直接套用的组合流程。

13.1 文档审稿工作流

请审核 @报告草稿.md。先列出问题清单，按严重程度排序。然后直接在文档中补齐缺漏、修正不准确表述、统一标题层级。不要改变原本的核心立场。最后列出修改摘要和仍需人工确认的内容。

适合：教程、报告、申请书、项目文档、公众号长文。

13.2 数据分析工作流

请读取项目中的 Excel 文件和需求说明。只分析“需求”和“数据字段”同时支持的内容，不要自行扩展。输出：字段理解、可做分析、不能做分析、核心结论、图表建议。

适合：客流分析、销售报表、用户反馈、运营数据。

13.3 代码修复工作流

请复现这个 bug，找到根因，并做最小修复。修改前先说明涉及文件。修改后运行相关测试，并给出验证证据。不要做无关重构，不要引入新依赖。

适合：前端 bug、后端接口、脚本错误、构建失败。

13.4 网页验收工作流

请启动或访问这个本地网页，用浏览器测试桌面和移动端视图。检查：页面是否空白、按钮是否可点、文字是否重叠、图片是否加载、主要流程是否走通。发现问题请截图并给出修复建议。

适合：落地页、工具页、小游戏、后台界面。

13.5 自动化周报工作流

每周五 17:00，读取这个项目本周新增和修改的文件，生成周报。结构：本周完成、关键进展、风险、下周建议、需要我确认的事项。只生成 Markdown，不要发送到外部平台。

适合：个人周报、项目复盘、团队进展总结。

14. 常见错误和修正方式

14.1 只给任务，不给边界

不推荐：

帮我整理一下这个文件夹。

14.2 让 Codex 自行扩展事实

不推荐：

根据这个表格写一份很完整的商业方案。

14.3 不要求验证

不推荐：

修好这个项目。

14.4 长期规则写得太空

不推荐写入 AGENTS.md：

以后都要写得专业一点。

推荐写入 AGENTS.md：

正式报告使用中文，先给结论，再给依据；每个建议必须对应数据或材料证据；不能确认的内容放入“需补充材料”，不要写成确定结论。

15. 完成任务前的检查清单

每次让 Codex 完成一个比较重要的任务，都建议按这个清单收尾：

是否说明了实际读取或修改了哪些文件。
是否列出了输出文件路径。
是否保留了原始文件。
是否跑了必要的测试、预览、截图或数据核对。
是否说明了哪些内容来自文件，哪些是推断。
是否标出了无法确认的信息。
是否有权限、隐私、外部发送或删除风险。
是否给出了下一步可以直接执行的动作。

总结

Codex 的进阶用法不是“让 AI 随便操作电脑”，而是把任务拆成可授权、可执行、可审查、可复用的工作流。

你需要重点掌握九个能力：

项目和线程：用项目绑定文件夹，用线程拆分任务。
文件处理：在明确边界内读取、创建、修改文件。
权限控制：默认小权限，必要时再扩大。
多代理并行：用多个线程同时推进不同任务。
Git 和差异审查：看 diff、跑测试、保留回滚能力。
记忆和 AGENTS.md：把稳定偏好写成项目规则。
插件系统：连接外部工具和数据源。
技能系统：把成功流程沉淀成可复用 SOP。
自动化：让稳定任务定时执行，并保留人工审阅。

一句话记住：ChatGPT 帮你想清楚，Codex 帮你把事情推进到文件、代码、表格、网页和可验证结果。

官方参考资料

What is Codex? – OpenAI Academy
How to get started with Codex – OpenAI Academy
Working with Codex – OpenAI Academy
Plugins and skills – OpenAI Academy
Automations – OpenAI Academy
Introducing the Codex app – OpenAI
Codex use cases – OpenAI Developers