OpenAI 官方插件发布!Claude Code 用户用上免费 Codex 了-夜雨聆风

OpenAI 官方插件发布!Claude Code 用户用上免费 Codex 了

用对工具组合，效率翻倍

春游装杯小程序

前几天，OpenAI 悄悄发布了一个重磅插件——官方 Codex MCP 插件。

如果你是 Claude Code 的用户，这个消息意味着：你现有的工作流，可以直接调用 GPT-4o 了。

而且，用的是你免费的 ChatGPT 账号。

01 为什么这个插件值得关注？

说实话，刚看到这个消息的时候，我第一反应是：这不早就有人这么干了吗？

确实，之前已经有很多开发者在组合使用 Claude Code 和 Codex：

• 用 Claude 做规划和初始构建
• 用 Codex 做代码审查和补充

但这次不一样——官方插件让这件事变得极其简单。

OpenAI 开发者体验负责人在视频里说：

“我们看到很多 Claude Code 用户引入 Codex 来做代码审查，用 GPT-4o 处理更复杂的任务。所以我们决定做这个插件。”

官方下场，意味着三件事：

1. 安装配置极其简单（三条命令搞定）
2. 可以使用免费 ChatGPT 订阅
3. 功能会持续迭代

02 说实话：Opus 和 GPT-4o，到底谁更强？

视频作者做了个详细的对比，结果有点意思。

基准测试

在 SWE-bench Verified 测试中，Opus 4.6 领先 1 分。

但在其他所有编码基准测试中，GPT-4o 全面领先，优势从 1 分到 13 分不等。

更关键的是——Opus 4.5 比 GPT-4o 贵不少。

但基准测试说明不了全部

作者在网上收集了大量实际使用者的反馈，发现了一个有趣的现象：

两个模型的弱点，恰好是對方的强项。

Claude Code (Opus) 被吐槽的点：

• 容易过度工程化
• token 消耗大
• 容易出现”长程漂移”（做着做着就偏了）
• 审查自己的代码时，会遗漏边缘情况

Codex (GPT-4o) 被吐槽的点：

• 不擅长规划
• 不会问正确的问题
• 创意输出较少
• 相对更死板

看到没？完美互补。

所以现在很多人的工作流是这样的：

Claude Code → 规划 + 初始构建
     ↓
   Codex → 执行 + 代码审查
     ↓
  最终产出

03 实战测试：同题 PK

作者做了个有趣的测试——给两个模型完全相同的 prompt，让它们各自构建一个地牢爬行游戏。

条件：

• 相同的 prompt
• 相同的规格说明
• 都不使用规划模式

结果对比

速度：Claude Code 完胜，更快完成

完成度：

• Claude Code：“服务器已启动，可以玩游戏了”
• Codex：“这是任务 1/3，但游戏已经可玩”（更诚实 😂）

UI 质量：

Claude Code 版本：

• 像素风格
• 基础功能都有
• 右侧导航栏（楼层、血量、XP、装备、金币）
• 小地图

Codex 版本：

• 更精致，更像成熟应用
• 更少的像素感
• UI 细节更到位

作者的结论：第一版直接看，Codex 的 UI 明显更胜一筹。

04 核心功能：对抗性审查

这个插件最实用的功能，我认为是 “对抗性审查”（adversarial review）。

什么是”对抗性审查”？

简单说，就是让 Codex 扮演”挑刺者”的角色：

• 质疑你的实现和设计
• 压力测试
• 分析权衡和失败模式
• 探索更安全/简单的替代方案

实际案例

作者在自己的一个内部系统仪表板项目上跑了这个功能。

输出格式非常清晰：

• 🎯 目标
• ⚖️ 判决
• 🔴 不应发布的问题
• 📊 优先级评分（高/中/低）
• 📝 下一步建议

发现的问题（真实 bug）：

1. 玩家可能永久卡关

◦ 第 10 层的楼梯让玩家在第 10 层之前使用
◦ 但古代护身符只在第 10 层生成
◦ 导致游戏无法获胜

2. 数据丢失回滚 bug

◦ 暴露了继续游戏的入口点
◦ 可能导致进度丢失

这些问题，Claude Code 自己审查时完全没发现。

修复流程

1. Codex 生成审查报告
   ↓
2. 将反馈交给 Claude Code
   ↓
3. Claude Code 进入规划模式
   ↓
4. 实施修复

完美闭环。

05 安装和使用（超简单）

安装步骤

# 1. 安装 marketplace
npx -y @anthropic-ai/mcp-registry

# 2. 安装 Codex 插件
npx -y @anthropic-ai/codex-mcp

# 3. 初始化设置
npx -y @anthropic-ai/codex-mcp init

在 Claude Code 中使用

/plugins  # 查看已安装的插件
/codex    # 查看 Codex 可用功能

主要功能

功能	说明
`/codex review`	普通代码审查
`/codex adversarial-review`	对抗性审查（更严格）
`/codex rescue`	救援模式

06 所以，我应该只用 Codex 吗？

看到这儿，你可能会有个疑问：

既然 Codex 更强更便宜，为什么不只用 Codex？

作者的回答很实在：

Claude Code 的使用体验，对非科班出身的人更友好。

他不来自软件工程背景，所以更喜欢 Claude Code 那种：

• 更包容的交互方式
• 更擅长规划和提问
• 更有”对话感”

他的建议：

“不是非此即彼，而是理解何时使用什么工具。”

推荐比例：

• 常规开发：80% Claude Code + 20% Codex（审查）
• 复杂任务：根据需求动态调整

最后

这个插件的 GitHub 文档：https://github.com/anthropics/codex-mcp