OpenAI Codex使用说明
基于 OpenAI 官方资料整理 | 2026年4月更新版
一、产品概述
Codex 是 OpenAI 推出的 AI 软件工程智能体(Coding Agent),定位为”AI 程序员队友”。它不是简单的代码补全工具,而是一个能像真正的工程师一样自主完成完整软件工程任务的智能系统。
核心信息:
•底层模型:GPT-5.3-Codex / GPT-5.4(基于 o3 优化的专用变体)
•每周超过 300 万开发者在使用
•从“代码补全工具”进化为能自主完成完整软件工程任务的 Agent
•核心能力链路:读项目→ 理解代码 → 修改文件 → 跑测试 → 提交 PR
二、使用方式(4种入口)
|
入口 |
说明 |
适合人群 |
|
Codex App(推荐) |
macOS / Windows 桌面应用,多 Agent 指挥中心 |
主力开发,需要完整功能体验的用户 |
|
CLI 命令行 |
终端中运行 codex 命令 |
习惯命令行的开发者 |
|
IDE 扩展 |
VS Code / JetBrains 插件集成 |
以 IDE 为核心工作区的开发者 |
|
ChatGPT 网页端 |
chatgpt.com/codex 直接调用 |
快速体验,不想安装的用户 |
三、安装步骤
方式一:桌面应用安装(推荐)
1.访问openai.com/codex产品主页
2.点击「下载 Windows 版」或 macOS 版
3.安装完成后使用 ChatGPT 账号登录即可开始使用
方式二:CLI 命令行安装
# 前提:Node.js >= 22, npm >= 10
npm install -g @openai/codex
# 验证安装
codex –version
# 启动交互模式
codex
方式三:macOS Homebrew
brew install –cask codex
登录认证
•方式一:ChatGPT 账号登录(推荐个人用户)— 首次运行自动弹出浏览器授权,简单快捷
•方式二:API Key 登录— 适合企业/自动化场景,可控可脚本化
export OPENAI_API_KEY=”sk-xxxxxxxxxxxx”
codex
四、两种核心使用模式
模式 A:命令模式(一次性调用)
适合快速任务、CI/CD 自动化。执行完即退出,无上下文记忆:
codex “帮我写一个 JSON 解析函数”
codex “修复 UserService.cs 中的空引用 bug”
模式 B:交互模式(推荐日常使用)
这才是 Codex 的真正威力——像一个持续在线的 AI 队友。进入后可以连续对话,有完整上下文记忆,支持连续迭代复杂任务:
codex
进入后的典型对话流程:
•“帮我分析这个项目的代码结构”
•“给用户模块加上 Redis 缓存”
•“写单元测试并跑一下”
关键优势:有完整上下文记忆,支持连续迭代复杂任务。命令模式是“调用 AI”,交互模式才是”雇佣 AI”。
五、核心功能详解(2026年4月重大更新)
OpenAI 于 2026 年 4 月 16 日发布 “Codex for (almost) everything”重大更新,一次塞进六大块能力:
1.Computer Use(电脑操控)
Codex 能直接操作你的电脑:点击、输入、截屏。后台运行不抢光标。你在一个窗口写代码,Codex 在另一个窗口帮你跑测试。需要 macOS Screen Recording + Accessibility 权限。目前首批仅支持 macOS,Windows 后续跟进。
2.内置浏览器
可打开 localhost 本地页面或公开网页。直接在页面上点击标注,告诉 Codex 哪里要改——不用截图、不用描述位置。未来将扩展到整个 Web(自动登录、走用户流程)。
3.图像生成(gpt-image-1.5)
生成产品概念图、前端 mockup、游戏素材。生成后自动放入项目目录 + 改 CSS 匹配样式。支持批量生成风格统一的素材包(如汉堡店全套暖色调素材)。
4.90+ 新插件
整合 Skills + App Integrations + MCP Servers。包括 Slack、Gmail、Google Calendar、Notion、JIRA (Atlassian Rovo)、CircleCI、GitLab Issues、Microsoft Suite 等。示例命令:”Check Slack, Gmail, Google Calendar, and Notion — tell me what needs my attention”
5.记忆系统(Memory)
记住你的偏好、修正历史、技术背景。下次启动时自动加载,不用重复解释。支持主动建议下一步工作。
6.自动化(Automations)
定时/事件触发的后台任务。保留之前对话的上下文继续执行,支持跨天、跨周调度。典型用途:PR babysitter(盯着未合入的 PR)、客户反馈监控(跨 Slack/Gmail/Notion)、CI/CD 告警处理。
六、最佳实践
1.提示词四要素结构
优秀的提示词应包含四个部分:
目标:你想要改变什么或构建什么?
上下文:@filename 聚焦相关文件
约束:架构规则、安全要求、约定
完成条件:测试通过、Bug 不复现等标准
目标:在用户管理模块增加缓存层
上下文:@UserService.cs @UserRepository.cs
约束:不能破坏现有接口签名,100% 单测通过
完成条件:所有现有测试通过 + 缓存命中率 >= 80%
2.用 @ 符号聚焦上下文
在提示词中使用 @filename 让 AI 只关注相关文件,减少 token 消耗。大型项目建议用 .codexignore 排除 node_modules、构建产物等目录。
3.使用 Plan 模式
任务复杂时,先按 Shift+Tab 或输入 /plan 让 Codex 先收集上下文、制定计划再动手编码。
4.编写 AGENTS.md
把有效的提示词规范写入项目根目录的 AGENTS.md,Codex 每次启动自动加载。示例内容:
## 项目结构
– src/ 源码
– tests/ 测试
## 运行命令
– 测试: npm test
– 构建: npm run build
## 工程规范
– 使用 TypeScript strict 模式
– 所有公共函数必须写 JSDoc
– PR 必须通过 CI 检查
5.多 Agent 并行(桌面应用独有)
通过工作树 (Worktree) 实现:多个 Agent 同时操作同一仓库的不同分支,互不干扰。一个窗口管理多个项目,随时切换。
七、模型选择
|
模型 |
特点 |
|
gpt-5.3-codex |
默认模型,平衡速度与能力,适合大多数日常任务 |
|
gpt-5.4 |
最强推理能力,适合复杂架构任务和大规模重构 |
|
gpt-5.2-codex medium |
中等配置,性价比高,适合轻量级任务 |
切换方式:codex –model gpt-5.4
八、定价与订阅
•需要 ChatGPT 付费订阅(Plus $20/月 或 Pro $200/月)
•Pro 用户可使用全部功能(Computer Use、Memory、Automations 等)
•团队开始使用可获最高 $500 额度优惠
•CLI 也支持按 API Key 计费(按 token 消耗付费)
九、快速上手清单
1.下载安装→ openai.com/codex 下载桌面版
2.登录认证→ ChatGPT 账号一键授权
3.克隆项目→ codex clone https://github.com/your/repo
4.开始对话→ 输入自然语言描述任务
5.编写 AGENTS.md→ 定义项目规范,提升长期稳定性
6.探索插件→ 安装需要的 MCP 服务和应用集成
十、官方资源
•产品主页:openai.com/codex
•更新博客:“Codex for (almost) everything”
•开发者文档:developers.openai.com/codex
夜雨聆风