乐于分享
好东西不私藏

OpenAI Codex CLI:迟到三年的"归来",Token 效率 4 倍于 Claude Code

OpenAI Codex CLI:迟到三年的"归来",Token 效率 4 倍于 Claude Code

每天精选一个有启发价值的开源 AI 项目,仔细讲清楚它是什么、怎么用、为什么值得关注。


openai/codex

OpenAI 重启 Codex 品牌推出的终端 AI 编程助手,发布不到 24 小时 Star 破万,周增 18k,直接与 Claude Code 展开正面竞争。

🕐 活跃于 1 天前  ·  发布于 2026 年 4 月  ·  ⭐ 18k  ·  📝 TypeScript  ·  📄 MIT

标签ai-coding · cli · openai · code-generation · agent · chatgpt-integration


📌 项目背景

Codex 这个品牌对 AI 圈来说是个”老朋友”。2021 年,OpenAI 基于 GPT-3 微调出了专门用于代码生成的 Codex 模型,一度是 GitHub Copilot 的底层引擎。但随着 OpenAI 战略调整,Codex 品牌逐渐淡出。

2026 年 4 月,OpenAI 正式重启 Codex——这次不是 API 模型,而是一个完整的本地 AI 编程助手产品,包含三个形态:

  1. Codex CLI(本文主角):终端命令行工具,类似 Claude Code
  2. Codex App:桌面应用,codex app 一键启动
  3. Codex Web:云端 Agent,访问 chatgpt.com/codex

发布不到 24 小时,GitHub Star 数突破 1 万;一周后达到 1.8 万,增速超过同期绝大多数 AI 编程工具。这背后折射出的是开发者对”OpenAI 官方编程工具”的强烈期待。

但更值得关注的,是它在产品策略上的两个关键决策:

第一,与 ChatGPT 订阅深度绑定。 登录 ChatGPT Plus/Pro/Business/Edu/Enterprise 账号后,Codex 可直接使用对应模型的 Agent 能力,无需单独按 token 计费。这让它在”订阅制 AI 编程工具”中拥有了目前最慷慨的配额

第二,全平台覆盖。 不仅提供 CLI 和桌面 App,还支持 VS Code、Cursor、Windsurf 插件,以及 codex app 独立桌面体验。OpenAI 显然想用 Codex 统一用户在各种场景下的 AI 编程需求。


🚀 核心功能

1. 多形态无缝切换:CLI + 桌面 + IDE + Web

Codex 是目前 AI 编程工具中形态最完整的:终端里运行 codex 进入 CLI 对话;运行 codex app 启动桌面应用(支持 GUI 操作、worktree 可视化管理);在 VS Code / Cursor / Windsurf 中安装插件获得内嵌体验;或者直接访问 chatgpt.com/codex 使用云端 Agent。四种形态共享同一个 ChatGPT 订阅,上下文可延续。

2. “开箱即用”的完整工作流

与 Claude Code 需要配置 Hooks、Subagents、Skills 才能发挥全部能力不同,Codex CLI 的默认工作流就已经包含:自动扫描整个代码库 → 搜索解决方案 → 编写代码 → 运行回归测试。用户无需学习高级功能即可获得可靠的编码结果。对 AI 编程新手来说,这个设计显著降低了上手门槛。

3. ChatGPT 订阅深度集成,配额极为慷慨

这是 Codex 最大的竞争优势。使用 ChatGPT Plus(20 美元/月)登录后,Codex CLI 每 5 小时窗口可发送 30~150 条消息(搭配 GPT-5.3-Codex 模型)。真实用户反馈:单窗口使用几乎不会触发限额。作为对比,同级 Claude Code(Claude Pro,20 美元/月)使用 Sonnet 模型时,每 5 小时仅 10~40 次对话,且很容易触达上限。换算成工作量,Codex 同等订阅的实际可用量是 Claude Code 的 10 倍以上

4. 极高的 Token 效率

第三方测试数据显示,在完成相同编码任务时,Codex CLI 的 Token 消耗量约为 Claude Code 的 1/4~1/2。按 API 计费口径计算,20 美元在 Codex CLI 中能做的工作量,在 Claude Code 中需要约 80 美元才能等价完成。这对高频使用 AI 编程的开发者来说是实质性成本优势。

5. 多模态输入支持

Codex CLI 支持截图输入(类似 Claude Code 的多模态能力),可以将 UI 设计稿、错误截图直接传给模型,让它基于图像内容生成或修复代码。这个功能在调试前端问题或实现设计稿时特别实用。

6. 自动化任务(Automations)

Codex 内置定时任务功能,可以通过自然语言配置周期性执行的编程任务(如”每天早上 9 点检查 issue 并用中文回复”)。任务在沙箱中运行,结果进入审核队列,用户确认后再合并。这个设计类似 cron + Codex 的组合,减少了手动触发重复任务的负担。


⚡ 技术亮点

亮点一:GPT-5.3-Codex 模型——推理与执行的平衡

Codex CLI 的默认模型是 GPT-5.3-Codex(ChatGPT Plus/Pro 用户可直接使用),这是 OpenAI 专门针对编程任务微调的模型。在 SWE-bench Verified 基准测试中,GPT-5.3-Codex 得分约 **80%**,与 Claude Opus 4.6 的 80.9% 基本持平(差距在统计误差范围内)。但在 SWE-bench Pro(更复杂、更接近真实开发场景的基准)中,GPT-5.3-Codex 以 56.8% 的成绩领先。

值得注意的是 OpenAI 社区反馈:GPT-5 系列相比 GPT-4.1,推理质量有明显提升,但生成速度显著变慢(约慢 4~7 倍),且经常出现 Failed to sample tokens 错误导致中断。对于需要快速迭代的开发场景,这个速度问题影响了体验。OpenAI 已推出 GPT-5.3-Codex-Spark(实时模型),输出速度达 1000+ tokens/秒,但整体工作流仍然偏重。

亮点二:与 ChatGPT 生态的无缝衔接

Codex 不是孤立的 CLI 工具,而是整个 ChatGPT 产品矩阵的一部分。你在 Codex CLI 中的对话历史可以在 chatgpt.com/codex 网页版中继续;在桌面 App 中开启的任务,可以在 CLI 中接管。这种”多端协同”是目前其他 AI 编程工具(Claude Code、Cursor、Cline)都未实现的。对已经在使用 ChatGPT 的开发者来说,这种连续性显著提升了使用体验。

亮点三:Agent Skills 系统——可复用的能力单元

Codex 支持 Agent Skills(指令、资源、脚本的打包单元),类似 Claude Code 的 Skills 机制,但更强调跨团队协作和社区分发。一个 Skill 可以包含:系统指令(不依赖具体项目结构)、资源文件(Gemini CLI 兼容)、可执行脚本、环境配置。Skills 通过 skills/ 目录分发,支持团队共享和社区发布。目前 OpenAI 官方正在建立 Skills 生态,这可能是未来 AI 编程工具的重要差异化方向。


👥 适用人群

AI 编程新手:Codex 的开箱即用体验是目前同类产品中最友好的,无需配置 Hooks、Subagents 等高级功能就能获得可靠结果。加上 ChatGPT 订阅的慷慨配额,个人项目开发几乎”无限量”。

已使用 ChatGPT 的开发者:如果你已经是 ChatGPT Plus/Pro 用户,Codex 相当于”免费附赠”的编程助手,无需额外付费即可获得完整的 AI 编程能力。

对成本敏感的个人开发者:Codex 的 Token 效率显著高于 Claude Code,同等预算下能完成更多工作。对于没有企业报销、自费使用 AI 工具的开发者,这是实质性的经济优势。

需要多端协同的开发者:如果你希望在终端、桌面、IDE、Web 之间无缝切换编程会话,Codex 是目前唯一支持这种完整多端体验的工具。


🛠️ 快速上手

# 1. 安装(任选一种方式)npm install -g @openai/codex# 或brew install --cask codex# 2. 启动(首次启动会引导登录)codex# 选择 "Sign in with ChatGPT",用 Plus/Pro 账号登录# 3. 桌面 App 模式(可选)codex app# 4. IDE 插件安装(可选)# 访问 https://developers.openai.com/codex/ide 按指引安装 VS Code / Cursor / Windsurf 插件# 5. 使用 API Key 模式(可选,需额外配置)# 参考 https://developers.openai.com/codex/auth#sign-in-with-an-api-key

登录后,直接在终端中输入自然语言指令即可,例如:

  • “帮我修复这个 bug:当用户名包含中文时会崩溃”
  • “基于 screenshots/design.png 实现对应的 UI 组件”
  • “给这个项目添加单元测试,覆盖核心函数”

📊 对比分析

维度
OpenAI Codex CLI
Claude Code
Cursor
SWE-bench Verified
~80% (GPT-5.3-Codex)
80.9%

 (Opus 4.6)
N/A(依赖接入的模型)
SWE-bench Pro 56.8%
未公布
N/A
20 美元档配额
30~150 条/5h
10~40 次对话/5h
$20/月订阅制
Token 效率 高(约为 Claude Code 的 1/4)
中等
取决于接入模型
生成速度
较慢(GPT-5 比 GPT-4.1 慢 4~7×)
快(小任务秒级响应)
多端协同 CLI + 桌面 + IDE + Web
仅 CLI + 有限 Web
仅 IDE
高级功能
Agent Skills + Automations
Subagents + Hooks + Skills + Ultraplan
Agent Mode
新手友好度
⭐⭐⭐⭐⭐
⭐⭐⭐
⭐⭐⭐⭐⭐
国内可用性
需配置 API 地址/ofox.ai 等网关
需配置 API 地址
需科学上网

选择建议

  • 如果你是 AI 编程新手,或主要做个人项目:优先 Codex,配额够大、开箱即用
  • 如果你做企业日常开发,追求效率和功能深度:优先 Claude Code,速度更快、功能更完整
  • 如果你希望一个订阅覆盖所有场景同时订阅 Codex 和 Claude Code(总成本仍低于单独使用 Claude Code 的 API 计费)
  • 如果你不想折腾配置,希望开箱即用:Cursor 仍然是最省心的选择

📚 参考资料

  • GitHub – openai/codex:https://github.com/openai/codex
  • OpenAI Codex 官方文档:https://developers.openai.com/codex

🧠关注公众号 fly的AI学习,每天获取更多优质 AI 开源项目推荐。