乐于分享
好东西不私藏

OpenAI 官方插件发布!Claude Code 用户用上免费 Codex 了

OpenAI 官方插件发布!Claude Code 用户用上免费 Codex 了

用对工具组合,效率翻倍

春游装杯小程序

前几天,OpenAI 悄悄发布了一个重磅插件——官方 Codex MCP 插件。

如果你是 Claude Code 的用户,这个消息意味着:你现有的工作流,可以直接调用 GPT-4o 了

而且,用的是你免费的 ChatGPT 账号


01 为什么这个插件值得关注?

说实话,刚看到这个消息的时候,我第一反应是:这不早就有人这么干了吗?

确实,之前已经有很多开发者在组合使用 Claude Code 和 Codex:

  • • 用 Claude 做规划和初始构建
  • • 用 Codex 做代码审查和补充

但这次不一样——官方插件让这件事变得极其简单

OpenAI 开发者体验负责人在视频里说:

“我们看到很多 Claude Code 用户引入 Codex 来做代码审查,用 GPT-4o 处理更复杂的任务。所以我们决定做这个插件。”

官方下场,意味着三件事

  1. 1. 安装配置极其简单(三条命令搞定)
  2. 2. 可以使用免费 ChatGPT 订阅
  3. 3. 功能会持续迭代

02 说实话:Opus 和 GPT-4o,到底谁更强?

视频作者做了个详细的对比,结果有点意思。

基准测试

在 SWE-bench Verified 测试中,Opus 4.6 领先 1 分

但在其他所有编码基准测试中,GPT-4o 全面领先,优势从 1 分到 13 分不等。

更关键的是——Opus 4.5 比 GPT-4o 贵不少

但基准测试说明不了全部

作者在网上收集了大量实际使用者的反馈,发现了一个有趣的现象:

两个模型的弱点,恰好是對方的强项

Claude Code (Opus) 被吐槽的点:

  • • 容易过度工程化
  • • token 消耗大
  • • 容易出现”长程漂移”(做着做着就偏了)
  • • 审查自己的代码时,会遗漏边缘情况

Codex (GPT-4o) 被吐槽的点:

  • • 不擅长规划
  • • 不会问正确的问题
  • • 创意输出较少
  • • 相对更死板

看到没?完美互补

所以现在很多人的工作流是这样的:

Claude Code → 规划 + 初始构建
     ↓
   Codex → 执行 + 代码审查
     ↓
  最终产出

03 实战测试:同题 PK

作者做了个有趣的测试——给两个模型完全相同的 prompt,让它们各自构建一个地牢爬行游戏。

条件

  • • 相同的 prompt
  • • 相同的规格说明
  • • 都不使用规划模式

结果对比

速度:Claude Code 完胜,更快完成

完成度

  • • Claude Code:“服务器已启动,可以玩游戏了”
  • • Codex:“这是任务 1/3,但游戏已经可玩”(更诚实 😂)

UI 质量

Claude Code 版本:

  • • 像素风格
  • • 基础功能都有
  • • 右侧导航栏(楼层、血量、XP、装备、金币)
  • • 小地图

Codex 版本:

  • • 更精致,更像成熟应用
  • • 更少的像素感
  • • UI 细节更到位

作者的结论:第一版直接看,Codex 的 UI 明显更胜一筹


04 核心功能:对抗性审查

这个插件最实用的功能,我认为是 “对抗性审查”(adversarial review)。

什么是”对抗性审查”?

简单说,就是让 Codex 扮演”挑刺者”的角色

  • • 质疑你的实现和设计
  • • 压力测试
  • • 分析权衡和失败模式
  • • 探索更安全/简单的替代方案

实际案例

作者在自己的一个内部系统仪表板项目上跑了这个功能。

输出格式非常清晰

  • • 🎯 目标
  • • ⚖️ 判决
  • • 🔴 不应发布的问题
  • • 📊 优先级评分(高/中/低)
  • • 📝 下一步建议

发现的问题(真实 bug):

  1. 1. 玩家可能永久卡关
    • ◦ 第 10 层的楼梯让玩家在第 10 层之前使用
    • ◦ 但古代护身符只在第 10 层生成
    • ◦ 导致游戏无法获胜
  2. 2. 数据丢失回滚 bug
    • ◦ 暴露了继续游戏的入口点
    • ◦ 可能导致进度丢失

这些问题,Claude Code 自己审查时完全没发现

修复流程

1. Codex 生成审查报告
   ↓
2. 将反馈交给 Claude Code
   ↓
3. Claude Code 进入规划模式
   ↓
4. 实施修复

完美闭环


05 安装和使用(超简单)

安装步骤

# 1. 安装 marketplace
npx -y @anthropic-ai/mcp-registry

# 2. 安装 Codex 插件
npx -y @anthropic-ai/codex-mcp

# 3. 初始化设置
npx -y @anthropic-ai/codex-mcp init

在 Claude Code 中使用

/plugins  # 查看已安装的插件
/codex    # 查看 Codex 可用功能

主要功能

功能
说明
/codex review
普通代码审查
/codex adversarial-review
对抗性审查(更严格)
/codex rescue
救援模式

06 所以,我应该只用 Codex 吗?

看到这儿,你可能会有个疑问:

既然 Codex 更强更便宜,为什么不只用 Codex?

作者的回答很实在:

Claude Code 的使用体验,对非科班出身的人更友好

他不来自软件工程背景,所以更喜欢 Claude Code 那种:

  • • 更包容的交互方式
  • • 更擅长规划和提问
  • • 更有”对话感”

他的建议

“不是非此即彼,而是理解何时使用什么工具。”

推荐比例

  • • 常规开发:80% Claude Code + 20% Codex(审查)
  • • 复杂任务:根据需求动态调整

最后

这个插件的 GitHub 文档:https://github.com/anthropics/codex-mcp