OpenAI Codex 完整使用教程

要查看键盘快捷键，按下问号
查看键盘快捷键

取消发布，移至草稿

目录
1. Codex 是什么
2. Codex 在 OpenAI 生态中的位置
3. 四大使用界面
4. 快速开始：安装与认证
5. 第一个任务：实战演练
6. 高效使用 Codex 的核心技巧
7. AGENTS.md：让 Codex 记住你的规则
8. Plan 模式：先规划后编码
9. 配置 Codex：config.toml 详解
10. MCP：连接外部系统
11. Skills：将工作流打包复用
12. Automations：自动化重复任务
13. 测试与代码审查
14. Slash 命令参考
15. CLI 进阶用法
16. Spec 驱动开发工作流
17. 企业与团队使用指南
18. 定价与套餐
19. 与其他 AI 编码工具对比
20. 常见错误与排查
21. 社区技巧精华
22. Codex 的局限与适用边界
23. 术语表
1. Codex 是什么

Codex 是 OpenAI 推出的 AI 编程 Agent（智能体）产品，而不仅仅是一个代码补全工具。

理解 Codex 的关键在于区分以下三个层次：

与普通 AI 代码补全工具不同，Codex 可以：

检查整个代码仓库，理解项目结构与依赖
编辑多个文件，而非仅建议单行代码
执行命令：运行测试、lint 检查、构建命令
后台独立工作：你工作时 Codex 同步处理任务
代码审查：对 PR 进行自动审查（OpenAI 内部 100% 的 PR 都由Codex 审查）
管理 Git 工作流：创建分支、提交commit、开启 PR

设计哲学

「把 Codex 当作一个你需要配置和逐步改进的队友，而不是一次性的助手」

2. Codex 在 OpenAI 生态中的位置

选择模型的原则：

需要一次性推理、综合分析 → 使用通用模型（GPT-5.5）
需要在代码库中导航、修改文件、运行测试 → 使用 Codex 专属模型
预算敏感型任务 → 使用 codex-mini-latest（GPT-5.4-mini 级别）

注意（2026年4月更新）：GPT-5.5是最新旗舰模型，性能显著提升（Terminal-Bench 2.0 达 82.7%，幻觉率下降约 60%），但 Token 成本约为 GPT-5.4 的 2 倍。

3. 四大使用界面

3.1 Codex CLI（推荐入门）

安装方式：npm i -g
@openai/codex
适用场景：终端优先工作流、快速迭代、精细控制审批
特点：开源（Rust 编写）、macOS/Linux 一流支持、Windows 使用 WSL2

# 安装npm i -g @openai/codex # 验证安装codex --version # 首次登录codex login # 启动交互会话codex

3.2 IDE 扩展（VS Code / Cursor /Windsurf）

安装：在 VS Code 扩展市场搜索“Codex”（openai.chatgpt）或code --install-extension openai.chatgpt
适用场景：编辑器内嵌使用，在不离开编辑器的情况下编写和提交代码
特点：与文件编辑流程无缝集成、支持Plan 模式（v0.4.69+）

在 VS Code 启用 Plan 模式：

点击 Codex 面板的 “+” 按钮
在下拉菜单中选择 “Plan mode”
状态栏会显示当前模式

3.3 Codex App（桌面应用）

下载：
chatgpt.com/codex
（macOS /Windows）
适用场景：并行运行多个 CodexAgent、项目级任务管理
特点：内置 Git Worktree 支持（隔离分支操作）可视化 Diff 审查面板 Skills 和 Automations 管理 Chrome 扩展、浏览器内嵌功能

3.4 Codex Cloud（后台云端任务）

访问：
chatgpt.com/codex
Web 界面
官方文档：
developers.openai.com/codex/cloud
适用场景：需要后台运行的任务、GitHub 集成工作流、CI/CD 辅助
特点：沙箱隔离执行、可审查的 Diff 输出、GitHub PR 自动审查

4. 快速开始：安装与认证

系统要求

访问权限

Codex 包含在以下 ChatGPT 套餐中：

Plus、Pro、Business、Enterprise/Edu：完整访问
Free、Go：有限访问（更严格的速率限制）

企业用户注意：在托管工作区中，仅有ChatGPT 订阅不保证 Codex 访问权限，需向管理员确认或在
chatgpt.com/codex
的设置中确认。

安装 CLI

shell

# 全局安装npm i -g @openai/codex # 验证版本codex --version# 输出：codex-cli 0.77.0（版本号随更新变化） # 登录认证（推荐使用 ChatGPT 登录）codex login

登录方式选择：

ChatGPT 登录（推荐）：使用套餐内包含的 Codex 配额
API Key 登录：按 Token 计费，适合企业策略要求

5. 第一个任务：实战演练

创建演示仓库

mkdir codex-demo && cd codex-demogit init

创建

pricing.py

（包含一个已知Bug）：

# pricing.pydef apply_discount(price: float, discount_percent: float) -> float:    """Apply a percentage discount to a price.     BUG: 折扣被计算为 (discount_percent / 10) 而非 (discount_percent / 100)。    20% 折扣会导致价格加倍，而非减少。    """    if discount_percent < 0:        raise ValueError("discount_percent must be >= 0")    return price * (1 - discount_percent / 10)  # Bug 在这里！  def cart_total(items: list[dict], discount_percent: float = 0) -> float:    """Compute the total for a list of cart items after a discount."""    subtotal = sum(item["price"] * item["quantity"] for item in items)    return apply_discount(subtotal, discount_percent)

创建 test_pricing.py：

# test_pricing.pyfrom pricing import apply_discount, cart_total  def test_no_discount_returns_original_price():    assert apply_discount(100.0, 0) == 100.0  def test_twenty_percent_discount_on_100_is_80():    # 此测试将 FAIL，直到 Bug 被修复    assert apply_discount(100.0, 20) == 80.0  def test_cart_total_with_discount():    items = [        {"price": 10.0, "quantity": 2},        {"price": 5.0, "quantity": 1},    ]    # 小计 25.0，9 折后期望 22.5    assert cart_total(items, discount_percent=10) == 22.5

git add . && git commit -m "初始演示：带已知 Bug 的定价模块"

让 Codex 修复 Bug

在项目目录启动 Codex：

cd codex-democodex

首次运行会询问权限模式：

auto（全自动）：Codex 自主执行所有命令
ask me first（审批模式）：执行前逐步确认

输入以下提示词：

Fix the failing test in test_pricing.py::test_twenty_percent_discount_on_100_is_80.Run pytest after fixing to confirm all tests pass.

Codex 将会：

分析测试失败原因
找到 apply_discount 中的 Bug
将 discount_percent / 10 修正为discount_percent / 100
运行 pytest 验证

结构化提示词模板

高质量提示词包含以下四个要素：

**Goal（目标）**：要修改或构建什么？**Context（上下文）**：哪些文件、文件夹、文档或错误与此任务相关？（使用 @ 引用文件）**Constraints（约束）**：遵循哪些架构标准、安全要求或代码规范？**Done when（完成标准）**：什么情况算完成？（测试通过、行为改变、Bug 不再复现）

示例（差）：

Improve this codebase.

示例（好）：

Context:- 文件：pricing.py- 函数：apply_discount- 当前行为：负数折扣抛出 ValueError- 期望行为：当 discount_percent > 100 时，也抛出 ValueError，  消息为 "discount_percent must be between 0 and 100" Task:- 添加该验证逻辑- 在 test_pricing.py 中添加对应测试- 不要修改 apply_discount 的公开签名- 修改后运行 pytest

6. 高效使用 Codex 的核心技巧

技巧 1：给出真实目标

明确的完成标准 > 模糊的描述。

技巧 2：提供正确的上下文

使用 @ 语法引用文件：

@pricing.py 中的 apply_discount 函数有问题，请修复...

对于大型任务，还需提供：

相关文件的名称（即使 Codex 能自己找到）
测试命令、构建命令、lint 命令名称
指向相关 Issue 或 Spec 的链接

技巧 3：要求中间思考（Intermediate Thinking）

对于复杂任务，先让 Codex 规划再执行：

我想为 pricing.py 添加多货币支持。 在编辑任何内容之前：1. 列出你预期修改的文件及原因2. 用 5-10 个要点概述实现方案3. 说明你的假设和开放性问题4. 识别变更中风险最高的部分 等我批准后再进行修改。

什么时候要求中间思考：

跨越多个文件的修改
对代码库来说架构上的新做法
难以测试的变更（diff 是唯一的验证信号）
影响范围大的变更（出错代价高）

技巧 4：推理级别选择

使用语音输入（Codex App 内置）来加速提示词输入，减少打字量。

技巧 5：一个线程对应一个工作单元

每个任务开启独立线程
同一问题范围内继续使用同一线程（保留推理轨迹）
工作真正分叉时才使用 /fork

7. AGENTS.md：让 Codex记住你的规则

AGENTS.md 是 Codex 的「持久记忆文件」，自动加载到每个会话的上下文中。

快速创建

# 在 CLI 中运行，自动生成 AGENTS.md 模板/init

AGENTS.md 应该包含什么

# AGENTS.md ## 项目概述这是一个 Python 定价计算库，用于电商结算系统。 ## 目录结构- pricing/ — 核心定价逻辑- tests/ — pytest 测试套件- docs/ — API 文档 ## 运行项目bashpip install -e .python -m pytest tests/

构建和测试命令

运行所有测试：python -m pytest
运行特定测试：python -m pytest tests/test_pricing.py
代码风格检查：ruff check .
类型检查：mypy .

工程规范

所有公共函数必须有类型注解
新功能需要 >= 80% 的测试覆盖率
使用 Black 格式化代码
不要修改公共 API 签名（向后兼容）

完成标准

所有测试通过
无 mypy 类型错误
ruff 检查无报错
PR 描述包含变更原因

禁止事项

不要直接推送到 main 分支
不要删除现有测试
不要使用 print 调试（使用 logging）

### AGENTS.md 的层级结构

~/.codex/AGENTS.md ← 个人全局默认（所有项目） your-repo/AGENTS.md ←仓库级共享规范 your-repo/src/AGENTS.md ← 子目录本地规则（覆盖上层）

### 最佳实践 1. **从简单开始**：短而精准 > 长而模糊2. **基于真实摩擦迭代**：每次 Codex 重复同一个错误，就更新 AGENTS.md3. **要求回顾**：`请回顾刚才的任务并建议需要添加到 AGENTS.md 的规则`4. **超大时拆分**：主文件保持简洁，通过引用指向专项 Markdown 文件 --- ## 8. Plan 模式：先规划后编码 Plan 模式让 Codex 在写代码之前先收集上下文、提出澄清性问题、构建完整计划。 ### 启用方式 | 界面 | 操作 ||------|------|| CLI | 输入 `/plan` 或按 `Shift+Tab` || VS Code 扩展 | 点击 "+" 选择 "Plan mode"（需 v0.4.69+） || Codex App | 界面切换 Plan 模式 | ### 使用场景 **适合使用 Plan 模式：**- 任务复杂或模糊难以描述- 跨越多个文件的架构变更- 不确定最佳实现路径- 首次接触大型代码库 **不需要 Plan 模式：**- 单文件小改动- 明确的 Bug 修复- 清晰的单步任务

我想改进定价模块，但还没完全想清楚该怎么做。请先向我提问，挑战我的假设，帮我把模糊的想法转化为清晰的实施计划，然后再写任何代码。

### PLANS.md 模板（高级工作流） 对于复杂的多步工作，可配置 Codex 遵循 `PLANS.md` 执行计划模板： markdown# 执行计划模板 ## 任务[任务描述] ## 影响分析- 预计修改的文件：- 下游影响：- 需要新建的文件： ## 实施步骤1. [ ] 步骤 12. [ ] 步骤 2... ## 验收标准- [ ] 所有测试通过- [ ] 类型检查无误- [ ] 人工审查完成

9. 配置 Codex：config.toml详解

配置文件层级

~/.codex/config.toml    ← 个人默认配置.codex/config.toml      ← 仓库特定配置命令行参数               ← 单次覆盖（仅 CLI）

打开配置文件（Codex App）：Settings→ Configuration → Open config.toml

常用配置示例

# ~/.codex/config.toml # 默认模型model = "codex-mini-latest" # 推理级别：low / medium / high / extra_highreasoning_effort = "medium" # 审批模式：full_auto / on_failure / suggestapproval_mode = "on_failure" # 沙箱模式[sandbox]enabled = trueread_only_dirs = ["/etc"] # MCP 服务器[[mcp_servers]]name = "github"url = "https://mcp.github.com" # 配置文件（Profiles）[profiles.strict]approval_mode = "suggest"reasoning_effort = "high" [profiles.fast]model = "codex-mini-latest"approval_mode = "full_auto"reasoning_effort = "low"

沙箱与权限控制

Codex 有两个关键安全旋钮：

建议：

新用户：保持默认权限，之后逐步放开
受信仓库中的稳定工作流：可使用full_auto
生产代码或首次探索：使用 suggest或 on_failure

10. MCP：连接外部系统

MCP（Model Context Protocol）是Codex 连接外部工具和系统的开放标准。

何时使用 MCP

所需上下文在仓库之外（如 issuetracker、数据库、监控系统）
数据频繁变化（不适合手动复制粘贴）
需要跨用户/项目复用的集成

支持的协议

STDIO：本地进程通信
Streamable HTTP + OAuth：远程服务认证

添加 MCP 服务器

方式 1：在 Codex App 中 Settings →MCP servers → 添加或选择推荐服务器

方式 2：在 CLI 中

codex mcp add --name github --url https://mcp.github.com

方式 3：直接修改 config.toml

[[mcp_servers]]name = "linear"url = "https://mcp.linear.app" [[mcp_servers]]name = "custom-docs"command = "node"args = ["/path/to/mcp-server.js"]

常用 MCP 集成场景

建议：不要一次接入所有工具。先接一两个真正能消除手动循环的工具，再逐步扩展。

11. Skills：将工作流打包复用

Skill 是可以反复调用的打包工作流，存放在SKILL.md 文件中。

Skill 的核心价值

如果你反复使用同样的提示词或反复纠正同样的工作流，它应该成为一个Skill。

Skill 存储位置

~/.agents/skills/           ← 个人 Skill（所有项目）.agents/skills/             ← 仓库共享 Skill（团队使用）

SKILL.md 示例结构

---name: pr-reviewdescription: 根据我们团队的代码审查清单审查 PR。  触发词：review PR、代码审查、check this PR--- # PR 审查工作流 ## 概述根据以下清单审查当前分支的代码变更。 ## 审查维度1. 功能正确性2. 测试覆盖率（≥ 80%）3. 安全性（SQL 注入、XSS、硬编码凭证）4. 性能（N+1 查询、缺少分页）5. 代码可读性（命名、函数大小） ## 输出格式- CRITICAL：必须修复才能合并- HIGH：应在合并前修复- MEDIUM：建议修复- LOW：可选的改进

创建第一个 Skill

使用内置的

$skill-creator

skill 来脚手架你的 Skill：

使用 skill-creator 帮我创建一个 Skill，用于：每次提交前自动生成符合 Conventional Commits 格式的 commit 消息

适合打包为 Skill 的工作流

日志分析（Log Triage）
发布说明起草
PR 审查（依据清单）
迁移规划
监控数据 / 事故摘要
标准调试流程
Release Note 生成

12. Automations：自动化重复任务

Automation 是在固定时间表上运行 Skill 的调度机制（仅 Codex App 支持）。

创建 Automation

在 Codex App 中：Automations 标签页 →新建

可配置项：

项目：在哪个 Git 仓库运行
提示词：要运行的 Skill 或任务描述
频率：每天、每周、每小时等
执行环境：Git Worktree（隔离）或本地环境

适合自动化的任务

Skill vs Automation 的关系

Skill 定义「方法」，Automation 定义「时间表」。如果工作流还需要大量人工引导，先打包成 Skill。一旦可预测，再设置Automation。

13. 测试与代码审查

测试驱动开发（TDD）与 Codex

# 先写测试，再让 Codex 实现先写 test_apply_discount_rejects_over_100 测试（应失败）：- 测试 apply_discount(100, 110) 抛出 ValueError- 测试信息包含 "must be between 0 and 100" 然后修改 apply_discount 使其通过，不改变已有测试。

100% 测试覆盖率的重要性（社区共识）：

AI 会利用代码库中任何可用路径来满足提示词，哪怕那些路径从未被使用
全覆盖的测试明确定义了「允许什么」「禁止什么」
测试不仅是捕捉 Bug 的工具，也是约束 AI 行为的关键

代码审查工作流

# CLI 中的代码审查/review # 审查选项/review --base main              # 对比基础分支（PR 风格）/review --uncommitted            # 审查未提交的变更/review --commit abc123          # 审查特定 commit/review --instructions @code_review.md  # 自定义审查指令

自动化 PR 审查（Codex Cloud）

在 GitHub 集成设置中：

自动审查：每个 PR 都触发 Codex 审查
按需审查：在 PR 评论中
@Codex
触发

在 AGENTS.md 中引用 code_review.md可让审查行为跨仓库保持一致。

验证循环

修改 → 测试 → Lint → 类型检查 → 审查 diff → 接受

在 Codex App 中：

打开 Diff 面板直接查看变更
点击特定行提供反馈（该反馈作为上下文传递给下一轮 Codex）

14. Slash 命令参考

CLI Slash 命令

命令	说明
/plan	切换到 Plan 模式（或 Shift+Tab ）
/init	在当前目录生成 AGENTS.md 模板
/resume	恢复已保存的会话
/resume --last	恢复最近的会话
/fork	创建新线程（保留原始记录）
/compact	压缩长会话历史（自动摘要早期上下文）
/agent	在并行 Agent 线程间切换
/model	切换 AI 模型
/status	查看当前会话状态和 Token 使用
/review	代码审查（多选项）
/new	切换到新会话（清空状态）
/experimental	切换实验性功能
/theme	选择语法高亮主题
/apps	在 Codex 中直接使用 ChatGPT 应用
/quit	结束会话

Bash 命令直通（CLI 内）

!ls           # 列出文件!pwd          # 当前目录!git status   # 查看 Git 状态!pytest       # 运行测试

输出显示在会话历史中，Codex 可直接引用。

15. CLI 进阶用法

会话管理

# 退出时获得 session ID，之后可恢复# 按 Ctrl+C 退出，记录显示的 Session ID # 恢复特定会话codex resume <SESSION_ID> # 恢复最近会话codex resume --last

会话文件存储在 ~/.codex/sessions/（JSON Lines 格式），包含：时间戳、消息内容、Token 使用量等。

跨界面共享：CLI 会话和 VS Code 扩展使用相同的文件，可以在终端开始，在编辑器继续！

使用 @ 引用文件

@pricing.py 中的 apply_discount 有一个折扣计算 Bug，请修复并确保 @test_pricing.py 中的测试通过

非交互模式（自动化脚本）

# 非交互模式（适合 CI/CD）codex --non-interactive "生成本次发布的 Release Notes" \  --output release-notes.md # 带配置文件运行codex --profile strict "审查本次 PR 变更"

MCP 集成命令

# 添加 MCP 服务器codex mcp add --name github --url https://mcp.github.com # 列出已配置的 MCP 服务器codex mcp list

16. Spec 驱动开发工作流

Spec 驱动开发（Spec-DrivenDevelopment）是结合 Codex 的一种强大工作模式。

工作流概述

编写 Spec 文档 → 提交到仓库 → Codex 读取 Spec → 实现功能

Step 1：编写 Spec 文档

# specs/pricing-multicurrency.md ## 功能：多货币支持 ### 目标允许 cart_total 函数以指定货币返回结果。 ### 接口变更pythondef cart_total(    items: list[dict],    discount_percent: float = 0,    currency: str = "USD") -> float:    ...

汇率来源

从
config.py
中读取EXCHANGE_RATES 字典
不支持的货币抛出 ValueError

测试要求

默认 USD 行为不变（向后兼容）
支持 EUR、GBP、JPY
不支持的货币正确抛出异常

Step 2：引导 Codex 使用 Spec

请阅读

@specs/pricing-multicurrency

.md，按照 Spec 的要求实现多货币支持。在编辑任何文件之前，先确认你理解了 Spec 的所有要求。

### 优势 1. **可审查**：Spec 文档作为 PR 的一部分，业务和技术双方都能审查2. **可复用**：同一 Spec 可被多个 Agent 读取3. **版本化**：Spec 历史留在 Git 中，可追溯需求变更4. **减少误解**：模糊需求在写 Spec 时就被澄清 --- ## 17. 企业与团队使用指南 ### 访问控制（RBAC） Codex 支持基于角色的访问控制：- **Admin**：管理工作区设置、配置策略- **Member**：使用 Codex，受策略限制- **审批流**：高风险操作需要额外授权 ### 团队 AGENTS.md 最佳实践 markdown# AGENTS.md（团队共享版本） ## 代码规范- 遵循 Google Python Style Guide- 函数最大 50 行- 文件最大 800 行- 使用 Black + isort 格式化 ## PR 要求- 标题使用 Conventional Commits 格式- 必须包含测试- 覆盖率不低于 80%- 添加到 CHANGELOG.md ## 禁止事项- 不使用 eval()- 不硬编码 API Key- 不直接推送 main/master- 不绕过 CI 检查

30-60-90 天团队引入计划

第一个月（探索）：

每人独立实验 CLI 和 IDE 扩展
在小型非关键任务上使用
记录哪些类型的任务效果最好

第二个月（标准化）：

建立团队共享 AGENTS.md
引入 2-3 个团队 Skill
在 PR 审查中启用 Codex 自动审查
制定数据安全策略（哪些仓库可用Codex）

第三个月（扩展）：

将稳定工作流设置为 Automation
将 Codex 集成进 CI/CD（非交互模式）
建立 Token 使用量监控与成本管理

安全检查清单

为每个组织授权 Codex GitHub App
确认 RBAC 角色分配
审查沙箱权限配置
检查 API Key 未硬编码
确认敏感仓库的访问策略
记录哪些 Automation 已启用

18. 定价与套餐

⚠️注意：定价信息频繁变化，以下为截至 2026 年 5 月的快照，请务必通过官方链接核实。

ChatGPT 套餐包含的 Codex

套餐	Codex 访问	速率限制
Free	有限访问	严格
Go	有限访问	严格
Plus	完整访问	标准
Pro（$200/月）	完整访问 + 优先	宽松
Business	完整访问	标准
Enterprise/Edu	完整访问 + RBAC	可配置

Token 成本提示

GPT-5.5 约为 GPT-5.4 每 Token 成本的 2倍。

成本优化建议：

常规编码任务 → codex-mini-latest（最经济）
复杂架构任务 → gpt-5.5（最强性能）
批量操作/维护任务 → codex-mini-latest + full_auto

官方定价链接：

developers.openai.com/codex/pricing
developers.openai.com/api/docs/pricing

19. 与其他 AI 编码工具对比

Codex vs Claude Code

维度	Codex	Claude Code
底层模型	GPT-5.x / Codex 专属模型	Claude 3.x / Claude 4.x
主要界面	CLI + 桌面 App + Cloud	CLI
背景任务	Codex Cloud（强）	有限
GitHub 集成	深度集成（PR 审查）	基础
沙箱	内置云端沙箱	本地执行
开源	CLI 开源（Rust）	CLI 闭源

Codex vs GitHub Copilot

维度	Codex	GitHub Copilot
工作模式	Agent（自主执行）	补全+建议（辅助）
代码执行	可执行命令、运行测试	仅建议代码
上下文范围	整个仓库	当前文件上下文
适用场景	独立完成完整任务	加速人工编写
GitHub 集成	PR 审查、分支管理	PR 摘要（有限）

适用场景选择

选 Codex 当：

维护任务、小修复、格式调整的批量处理
需要并行执行多个独立任务
需要 GitHub PR 自动审查
后台长时间运行的任务

选其他工具当：

需要深度、实时代码建议（Copilot）
大型架构重构（仍需人工主导）
对依赖和网络访问有强需求（CodexCloud 沙箱无网络）

20. 常见错误与排查

安装问题

codex command not found

# npm 全局 bin 不在 PATH 中# 重启终端，或使用 nvm 等 Node 版本管理器echo $PATHnpm config get prefix# 将 <prefix>/bin 添加到 PATH

Windows 异常行为 → 切换到 WSL2 终端。原生 Windows CLI 是实验性的。

认证问题

登录反复失败

确认 email 与 ChatGPT 套餐匹配
企业工作区用户：管理员需在设置中启用 Codex

执行问题

Codex 拒绝修改文件 → 可能处于严格审批模式，在提示时点击批准，或修改审批模式设置

任务开启失败 / PR 创建失败 → CodexCloud 早期版本有错误处理问题，重试或拆分为更小的任务

无法安装依赖 / 更新 lockfile → CodexCloud 沙箱无网络访问（设计决策）。需要依赖操作的任务请在本地 CLI 执行

质量问题

Codex 改动了不相关的文件 → 提示词不够明确，添加 Constraints 字段限定影响范围

结果不一致 → 将工作流规则添加到AGENTS.md，使行为标准化

上下文在长会话中退化 → 使用 /compact压缩会话历史，或使用 /fork 开启新线程

21. 社区技巧精华

以下来自 OpenAI 社区论坛和真实用户的实践经验：

测试覆盖率

「100% 核心代码测试覆盖率是必要的。当 AI 参与时，它会利用代码库中任何可用路径来满足提示词，哪怕那些路径从未被预期使用。全面的测试明确定义了允许什么、禁止什么。」—EricGT

TDD 的特殊价值

「先写测试来定义完成标准，让模型迭代直到满足测试。这是目前最强的特性之一，让我们对结果有较高置信度。」— vb

防止上下文污染

「在 AGENTS.md 中明确说明 Agent不应该读取文档，除非明确要求。这有助于 AI 不在早期提示阶段污染上下文。」— af0r

跨界面会话共享

「CLI 会话和 VS Code 扩展使用相同的文件。可以在终端开始对话，在编辑器中继续。我觉得这是真正用心的设计。」— amanhimself

编写用途 vs 阅读用途

「不要把 Codex 当捷径；把它当作一个智慧伙伴共同改进工作。尤其是写作领域，没有’vibe-writing’这种东西。」— amanhimself

适合 Codex 的任务画像（来自真实用户经验）

✅ 效果最好：

维护性更新（小文案调整、样式变更、代码格式化）
批量处理多个独立的小任务
生成测试
重命名、重构单个函数
生成文档和注释

⚠️ 效果一般：

大型跨文件重构
需要多轮迭代的复杂新功能
高依赖的 monorepo 变更

22. Codex 的局限与适用边界

当前已知限制

限制	说明
Cloud 无网络	Codex Cloud 沙箱无法访问 internet，无法安装新依赖
多轮分支更新	迭代更新同一 PR 分支的体验仍有摩擦
错误处理	部分操作失败时错误信息不够明确
单次完成率	复杂任务首次成功率约 40-60%，需要迭代

何时不应使用 Codex

需要深度理解整体架构的重大重构（仍需人工主导）
依赖特定网络资源（如需要下载新包）的任务
需要精确实时协同的结对编程场景
高度创意性、开放性的设计决策

何时使用 Codex 效果最佳

明确、有边界的任务
有完善测试套件的代码库
维护型工作（优于新功能开发）
并行处理多个互相独立的任务
有良好 AGENTS.md 和 Skill 的成熟工作流

23. 术语表

术语	说明
AGENTS.md	代码仓库中给 Codex Agent 的持久指令文件，自动加载
SKILL.md	打包可复用工作流的 Markdown 文件
Automation	定时运行 Skill 的调度任务
Worktree	Git 工作树，允许在隔离的分支环境中并行工作
Sandbox	Codex 执行命令的沙箱环境，限制文件系统访问
Approval Mode	决定 Codex 何时向用户请求命令执行授权的策略
MCP	Model Context Protocol，连接 Codex 与外部工具的开放协议
Plan Mode	让 Codex 先规划后执行的工作模式
Codex Cloud	Codex 在云端沙箱后台运行任务的服务
codex-mini-latest	轻量级 Codex 模型，经济型选择
GPT-5.5	OpenAI 最新旗舰通用模型（2026年4月发布）
Token	文本的基本计量单位，也是 API 计费基础

参考资源

OpenAI Codex 官方最佳实践
The Codex Handbook -freeCodeCamp
Complete Beginner’s Guide toCodex - Substack
Spec-Driven Development withCodex - Medium
Tips and Tricks - OpenAICommunity
First Few Days with Codex CLI -amanhimself.dev
OpenAI Codex Review 2025 -zackproser.com
Codex for Builders - OpenAIAcademy
How to Use OpenAI Codex -
ai.cc
Build Software Using OpenAI Codex- GitHub Gist

本教程综合自 10 篇高质量 Codex 使用教程，涵盖 2025-2026 年最新内容。由于Codex 产品快速迭代，建议定期查阅

developers.openai.com/codex

获取最新信息。

莫先生

要查看键盘快捷键，按下问号查看键盘快捷键