Codex 是 AI 时代最值钱的工具之一——但你看到的只是冰山一角

2026 年 6 月 26 日，OpenAI 团队发了一篇博客。

里面有个数据让我反复看了三遍：OpenAI 每位律师或招聘人员，平均有超过 85% 的产出 Token 是在 Codex 上生成的。 不是程序员，是律师和招聘人员。

如果你对这个数字没有反应，那我换个说法：在 OpenAI 内部，一个不写代码的 HR，每天绝大部分工作产出，不是通过 ChatGPT 聊天完成的，而是通过一个叫 Codex 的编程工具完成的。

这听起来像一个悖论。但正是这个悖论，解释了为什么 Codex 是 AI 时代最值钱的工具之一。

先搞清楚我们在聊哪个 Codex

如果你对 Codex 的印象还停留在"2021 年 GitHub Copilot 背后的代码补全模型"，那你需要更新一下认知了。那个模型已经在 2023 年 3 月被 OpenAI 关停。

现在的 Codex 是 2025 年 4 月重启的全新产品线——一个开源的、Rust 实现的终端编程智能体（Coding Agent）。它的 GitHub 仓库在 15 个月内积累了 81,700+ Stars 和近 8,000 次提交。

如果你用过 Claude Code，那你就能理解 Codex 的形态：一个在你终端里运行的 AI 代理，能读文件、写代码、跑命令、修 Bug。但两者有一个关键区别——Codex 是 Apache 2.0 开源的，96.3% 的代码是 Rust。这意味着两件事：第一，你可以看完它的每一行代码，知道它到底在做什么；第二，它的启动延迟低到几乎可以忽略。

在 2026 年的 AI 工具圈，这两件事加在一起，比你想象的要值钱得多。但这是后话。

它到底值钱在哪？

大多数人对 Codex 的讨论停留在"好不好用""跑分高不高""和 Cursor 比谁强"上。这些讨论没错，但都只是在说冰山浮在水面上的那 10%。

Codex 真正值钱的地方在水下。

第一层：它改变的不是"怎么写"，而是"谁在写"

OpenAI 那篇博客披露了一条时间线：

2025 年 8 月，Codex 在 OpenAI 内部员工 Token 总用量中占比不到 10%。
2026 年 6 月，这个数字变成了 85% 以上。每周内部 Token 中 Codex 占比高达 99.8%。

同一时期，Codex 的非开发者用户增长了 137 倍（个人）和 189 倍（组织）。

这不是"程序员效率提升"的故事。这是一个"编程能力民主化"的故事。

过去你让一个法务写个自动化脚本处理合同批处理，你需要找一个工程师。现在法务自己在 Codex 里说一句话，它就帮你做完。这个变化的意义，比任何一个 benchmark 跑分都重要。

一个工具的价值，等于它解决的问题的重要性 × 它能覆盖的人群规模。Codex 的价值公式里，后者正在以指数级膨胀。

第二层：开源的信任红利

如果你关注最近的 AI 工具圈，你应该注意到一条时间线：

2026 年 4 月：cURL 创始人 Daniel Stenberg 发起"Summer of Bliss"罢工，抗议 AI 工具无节制爬取和污染开源生态。
2026 年 5 月：GitHub 上 10,000+ 个 AI 生成的木马仓库被曝光。
2026 年 6 月：Anthropic 开始要求 Claude 用户上传政府签发的身份证件。同一天，Hacker News 上有篇文章登顶——"切换到开源模型几乎没有缺点"。

信任正在崩塌。而信任一旦崩塌，"可审计性"就从 nice-to-have 变成了 must-have。

Codex 是现在主流 AI 编程工具里唯一一个完全开源（Apache 2.0）的。Claude Code 的仓库虽然也公开，但用的是 Anthropic 自定义许可证，而且你拿不到模型。Cursor 和 Copilot 就更不用说了——闭源商业软件。

一个你每天要跑 8 小时的终端工具，如果它做了什么你不知道的事（后面我们会说到，它确实做了），你至少能去看它的代码。这就是开源的价值——不是"免费"，而是"可验证"。

第三层：定价模型让"持续使用"成为可能

2026 年 4 月 2 日，OpenAI 把 Codex 的计费从按消息数改成了 Token 积分制。实际效果是什么？

在 Plus 套餐（$20/月）下，中等使用量的成本远低于等量 API 计费——通过 API 以 GPT-5.3-Codex 费率跑 200 个云任务/月，大约要 $50-$90，是订阅价的 2.5-4.5 倍。

这是一个有意的倾斜：OpenAI 希望你把 Codex 当作日常工具持续使用，而不是按需调用的 API。当工具足够便宜到你可以"开着不用想"，它就从一个生产工具变成了一个基础设施。

而且 Codex 有 Free 层。不是那种 7 天试用的 Free，是真的可以一直用的 Free——虽然功能受限，但它让任何人都可以在不花一分钱的情况下判断"这东西对我的工作流有没有价值"。

在你充值之前，有两件事你需要知道

它正在烧你的硬盘

2026 年 6 月 22 日，GitHub Issue #28224 登上了 Hacker News 首页。

Codex 的本地 SQLite 日志系统，默认以全局 TRACE 级别运行。这意味着每一条 WebSocket 连接的原始字节流、每一个 inotify 文件事件（包括"locale.alias 被读取了"这种完全无用的信息），全都被写入你的 SSD。

数据触目惊心：21 天写入 37TB。年化写入量约 640TB。一块消费级 1TB SSD 的典型耐久度是 600TBW——不到一年就能耗尽。

更让人愤怒的不是 Bug 本身，而是处理方式。这个问题的历史可以追溯到至少 2025 年，跨越了 11 个关联 Issue。OpenAI 没有官方回复，没有紧急修复。社区贡献者试图提交 PR 修复——GitHub 返回：does not have the correct permissions to execute CreatePullRequest。

连社区帮你修都不让。一年多。

这不是一个"修了就好"的 Bug。这是一个信号——当一个你每天信任运行 8 小时的工具，在你知道的情况下悄悄毁掉你的硬件，而厂商选择无视的时候，问题已经不局限于技术层面了。

它的"强"和"稳"不是一回事

独立评测和对比数据揭示了一些值得注意的模式：

Codex 在自主完成长任务的场景下表现很强（SWE-bench 专用模型 74.5%，通用模型 85.5%），但在交互式、频繁对话的 IDE 场景下，Cursor 的体验更流畅。
Codex 的权限审批系统仍有缺陷——VS Code 扩展中的"每次允许"设置被广泛报告为不可用。
API 用户获取新模型有延迟，且会丢失云功能（GitHub PR 审查、Slack 集成、后台代理执行）。

这些不是致命问题，但它们说明了一件事：Codex 的强项是"委派任务"（delegation），不是"结对编程"（pair programming）。如果你把它当成交互式的代码补全工具用，你会失望。如果你把它当成一个能自主完成任务的工程师用，你会发现它的真正价值。

怎么用才对？

基于以上分析，Codex 的正确打开方式不是"写代码时开着它"，而是：

1、委派，不要对话。

给它一个完整的目标描述，让它自己去读代码、规划步骤、执行、修 Bug。你在旁边做别的事，它完成了会通知你。

2、日常任务用轻量模型。

Plus 套餐里，用 GPT-5.4-mini 处理格式化、文档生成、简单重构——每窗口 60-350 条消息，Token 成本比 GPT-5.3-Codex 低约 2.5 倍。

3、结合 Cursor 或 VS Code 做 IDE 层。

Codex 管后台委派和 PR 审查，Cursor 管实时编码交互。这不是二选一，这是互补。重度开发者四款工具（Claude Code + Codex + Cursor + Copilot）并用的模式已经成为常态。

4、检查你的 SSD。

现在就做。Windows 用 CrystalDiskInfo，macOS 用 smartctl -a disk0，看 Total Bytes Written。如果异常高，Codex 大概率是罪魁祸首。社区提供了临时修复方案：定期执行 sqlite3 ~/.codex/logs_2.sqlite "PRAGMA wal_checkpoint(TRUNCATE);" 并设为定时任务。

所以，它到底值不值"最值钱"这个名头？

市场数据不说谎：

Anthropic 内部合并到主代码库的代码中，超过 80% 由 Claude 独立编写并提交（2026 年 5 月数据）。
字节跳动过去一年 AI 代码贡献率增长了 6 倍，AI 代码合入率增长超过 2 倍。
Codex 自己在发布一年内从一款程序员专用工具，变成了 OpenAI 全公司的"主要 AI 工具"。

这些数据指向同一个方向：编程智能体不是"辅助工具"，而是"工作主力"。 而在这个赛道里，Codex 是唯一一个同时满足"开源可审计""定价合理""自主完成复杂任务""生态覆盖全终端"四条件的工具。

它不是最好的——取决于你的工作流，Claude Code 的计划模式可能更适合你，Cursor 的 IDE 整合可能更丝滑，Copilot 的零门槛可能更省心。但它是最"值钱"的——因为它的价值不局限于某一种使用场景或某一类用户。

一个工具的价值，最终取决于它能改变多少人的工作方式。Codex 正在让"用代码解决问题"这件事，从程序员的特权变成所有人的基本技能。这才是它最值钱的地方。

当然，前提是 OpenAI 先把那个日志 Bug 修了。在它修好之前，记得检查你的 SSD。

数据来源：OpenAI 官方博客（2026-06-26）、GitHub openai/codex 仓库、Anthropic 官方报告（2026-05）、字节跳动公开分享、eesel.ai 定价分析、七牛云横评分析（2026-05）