OpenAI 官方插件发布!Claude Code 用户用上免费 Codex 了
用对工具组合,效率翻倍
前几天,OpenAI 悄悄发布了一个重磅插件——官方 Codex MCP 插件。
如果你是 Claude Code 的用户,这个消息意味着:你现有的工作流,可以直接调用 GPT-4o 了。
而且,用的是你免费的 ChatGPT 账号。
01 为什么这个插件值得关注?
说实话,刚看到这个消息的时候,我第一反应是:这不早就有人这么干了吗?
确实,之前已经有很多开发者在组合使用 Claude Code 和 Codex:
-
• 用 Claude 做规划和初始构建 -
• 用 Codex 做代码审查和补充
但这次不一样——官方插件让这件事变得极其简单。
OpenAI 开发者体验负责人在视频里说:
“我们看到很多 Claude Code 用户引入 Codex 来做代码审查,用 GPT-4o 处理更复杂的任务。所以我们决定做这个插件。”
官方下场,意味着三件事:
-
1. 安装配置极其简单(三条命令搞定) -
2. 可以使用免费 ChatGPT 订阅 -
3. 功能会持续迭代
02 说实话:Opus 和 GPT-4o,到底谁更强?
视频作者做了个详细的对比,结果有点意思。
基准测试
在 SWE-bench Verified 测试中,Opus 4.6 领先 1 分。
但在其他所有编码基准测试中,GPT-4o 全面领先,优势从 1 分到 13 分不等。
更关键的是——Opus 4.5 比 GPT-4o 贵不少。
但基准测试说明不了全部
作者在网上收集了大量实际使用者的反馈,发现了一个有趣的现象:
两个模型的弱点,恰好是對方的强项。
Claude Code (Opus) 被吐槽的点:
-
• 容易过度工程化 -
• token 消耗大 -
• 容易出现”长程漂移”(做着做着就偏了) -
• 审查自己的代码时,会遗漏边缘情况
Codex (GPT-4o) 被吐槽的点:
-
• 不擅长规划 -
• 不会问正确的问题 -
• 创意输出较少 -
• 相对更死板
看到没?完美互补。
所以现在很多人的工作流是这样的:
Claude Code → 规划 + 初始构建
↓
Codex → 执行 + 代码审查
↓
最终产出
03 实战测试:同题 PK
作者做了个有趣的测试——给两个模型完全相同的 prompt,让它们各自构建一个地牢爬行游戏。
条件:
-
• 相同的 prompt -
• 相同的规格说明 -
• 都不使用规划模式
结果对比
速度:Claude Code 完胜,更快完成
完成度:
-
• Claude Code:“服务器已启动,可以玩游戏了” -
• Codex:“这是任务 1/3,但游戏已经可玩”(更诚实 😂)
UI 质量:
Claude Code 版本:
-
• 像素风格 -
• 基础功能都有 -
• 右侧导航栏(楼层、血量、XP、装备、金币) -
• 小地图
Codex 版本:
-
• 更精致,更像成熟应用 -
• 更少的像素感 -
• UI 细节更到位
作者的结论:第一版直接看,Codex 的 UI 明显更胜一筹。
04 核心功能:对抗性审查
这个插件最实用的功能,我认为是 “对抗性审查”(adversarial review)。
什么是”对抗性审查”?
简单说,就是让 Codex 扮演”挑刺者”的角色:
-
• 质疑你的实现和设计 -
• 压力测试 -
• 分析权衡和失败模式 -
• 探索更安全/简单的替代方案
实际案例
作者在自己的一个内部系统仪表板项目上跑了这个功能。
输出格式非常清晰:
-
• 🎯 目标 -
• ⚖️ 判决 -
• 🔴 不应发布的问题 -
• 📊 优先级评分(高/中/低) -
• 📝 下一步建议
发现的问题(真实 bug):
-
1. 玩家可能永久卡关 -
◦ 第 10 层的楼梯让玩家在第 10 层之前使用 -
◦ 但古代护身符只在第 10 层生成 -
◦ 导致游戏无法获胜 -
2. 数据丢失回滚 bug -
◦ 暴露了继续游戏的入口点 -
◦ 可能导致进度丢失
这些问题,Claude Code 自己审查时完全没发现。
修复流程
1. Codex 生成审查报告
↓
2. 将反馈交给 Claude Code
↓
3. Claude Code 进入规划模式
↓
4. 实施修复
完美闭环。
05 安装和使用(超简单)
安装步骤
# 1. 安装 marketplace
npx -y @anthropic-ai/mcp-registry
# 2. 安装 Codex 插件
npx -y @anthropic-ai/codex-mcp
# 3. 初始化设置
npx -y @anthropic-ai/codex-mcp init
在 Claude Code 中使用
/plugins # 查看已安装的插件
/codex # 查看 Codex 可用功能
主要功能
|
|
|
|---|---|
/codex review |
|
/codex adversarial-review |
|
/codex rescue |
|
06 所以,我应该只用 Codex 吗?
看到这儿,你可能会有个疑问:
既然 Codex 更强更便宜,为什么不只用 Codex?
作者的回答很实在:
Claude Code 的使用体验,对非科班出身的人更友好。
他不来自软件工程背景,所以更喜欢 Claude Code 那种:
-
• 更包容的交互方式 -
• 更擅长规划和提问 -
• 更有”对话感”
他的建议:
“不是非此即彼,而是理解何时使用什么工具。”
推荐比例:
-
• 常规开发:80% Claude Code + 20% Codex(审查) -
• 复杂任务:根据需求动态调整
最后
这个插件的 GitHub 文档:https://github.com/anthropics/codex-mcp
夜雨聆风