里面有个数据让我反复看了三遍:OpenAI 每位律师或招聘人员,平均有超过 85% 的产出 Token 是在 Codex 上生成的。 不是程序员,是律师和招聘人员。
如果你对这个数字没有反应,那我换个说法:在 OpenAI 内部,一个不写代码的 HR,每天绝大部分工作产出,不是通过 ChatGPT 聊天完成的,而是通过一个叫 Codex 的编程工具完成的。
这听起来像一个悖论。但正是这个悖论,解释了为什么 Codex 是 AI 时代最值钱的工具之一。
先搞清楚我们在聊哪个 Codex
如果你对 Codex 的印象还停留在"2021 年 GitHub Copilot 背后的代码补全模型",那你需要更新一下认知了。那个模型已经在 2023 年 3 月被 OpenAI 关停。
现在的 Codex 是 2025 年 4 月重启的全新产品线——一个开源的、Rust 实现的终端编程智能体(Coding Agent)。它的 GitHub 仓库在 15 个月内积累了 81,700+ Stars 和近 8,000 次提交。
如果你用过 Claude Code,那你就能理解 Codex 的形态:一个在你终端里运行的 AI 代理,能读文件、写代码、跑命令、修 Bug。但两者有一个关键区别——Codex 是 Apache 2.0 开源的,96.3% 的代码是 Rust。这意味着两件事:第一,你可以看完它的每一行代码,知道它到底在做什么;第二,它的启动延迟低到几乎可以忽略。
在 2026 年的 AI 工具圈,这两件事加在一起,比你想象的要值钱得多。但这是后话。

它到底值钱在哪?
大多数人对 Codex 的讨论停留在"好不好用""跑分高不高""和 Cursor 比谁强"上。这些讨论没错,但都只是在说冰山浮在水面上的那 10%。

Codex 真正值钱的地方在水下。
第一层:它改变的不是"怎么写",而是"谁在写"
OpenAI 那篇博客披露了一条时间线:
2025 年 8 月,Codex 在 OpenAI 内部员工 Token 总用量中占比不到 10%。 2026 年 6 月,这个数字变成了 85% 以上。每周内部 Token 中 Codex 占比高达 99.8%。
同一时期,Codex 的非开发者用户增长了 137 倍(个人)和 189 倍(组织)。
这不是"程序员效率提升"的故事。这是一个"编程能力民主化"的故事。
过去你让一个法务写个自动化脚本处理合同批处理,你需要找一个工程师。现在法务自己在 Codex 里说一句话,它就帮你做完。这个变化的意义,比任何一个 benchmark 跑分都重要。
一个工具的价值,等于它解决的问题的重要性 × 它能覆盖的人群规模。Codex 的价值公式里,后者正在以指数级膨胀。
第二层:开源的信任红利
如果你关注最近的 AI 工具圈,你应该注意到一条时间线:
2026 年 4 月:cURL 创始人 Daniel Stenberg 发起"Summer of Bliss"罢工,抗议 AI 工具无节制爬取和污染开源生态。 2026 年 5 月:GitHub 上 10,000+ 个 AI 生成的木马仓库被曝光。 2026 年 6 月:Anthropic 开始要求 Claude 用户上传政府签发的身份证件。同一天,Hacker News 上有篇文章登顶——"切换到开源模型几乎没有缺点"。 
Codex 是现在主流 AI 编程工具里唯一一个完全开源(Apache 2.0)的。Claude Code 的仓库虽然也公开,但用的是 Anthropic 自定义许可证,而且你拿不到模型。Cursor 和 Copilot 就更不用说了——闭源商业软件。
一个你每天要跑 8 小时的终端工具,如果它做了什么你不知道的事(后面我们会说到,它确实做了),你至少能去看它的代码。这就是开源的价值——不是"免费",而是"可验证"。
第三层:定价模型让"持续使用"成为可能
2026 年 4 月 2 日,OpenAI 把 Codex 的计费从按消息数改成了 Token 积分制。实际效果是什么?
在 Plus 套餐($20/月)下,中等使用量的成本远低于等量 API 计费——通过 API 以 GPT-5.3-Codex 费率跑 200 个云任务/月,大约要 $50-$90,是订阅价的 2.5-4.5 倍。
这是一个有意的倾斜:OpenAI 希望你把 Codex 当作日常工具持续使用,而不是按需调用的 API。当工具足够便宜到你可以"开着不用想",它就从一个生产工具变成了一个基础设施。
而且 Codex 有 Free 层。不是那种 7 天试用的 Free,是真的可以一直用的 Free——虽然功能受限,但它让任何人都可以在不花一分钱的情况下判断"这东西对我的工作流有没有价值"。
在你充值之前,有两件事你需要知道
它正在烧你的硬盘
2026 年 6 月 22 日,GitHub Issue #28224 登上了 Hacker News 首页。
Codex 的本地 SQLite 日志系统,默认以全局 TRACE 级别运行。这意味着每一条 WebSocket 连接的原始字节流、每一个 inotify 文件事件(包括"locale.alias 被读取了"这种完全无用的信息),全都被写入你的 SSD。
数据触目惊心:21 天写入 37TB。年化写入量约 640TB。一块消费级 1TB SSD 的典型耐久度是 600TBW——不到一年就能耗尽。
更让人愤怒的不是 Bug 本身,而是处理方式。这个问题的历史可以追溯到至少 2025 年,跨越了 11 个关联 Issue。OpenAI 没有官方回复,没有紧急修复。社区贡献者试图提交 PR 修复——GitHub 返回:does not have the correct permissions to execute CreatePullRequest。
连社区帮你修都不让。一年多。
这不是一个"修了就好"的 Bug。这是一个信号——当一个你每天信任运行 8 小时的工具,在你知道的情况下悄悄毁掉你的硬件,而厂商选择无视的时候,问题已经不局限于技术层面了。
它的"强"和"稳"不是一回事
独立评测和对比数据揭示了一些值得注意的模式:
Codex 在自主完成长任务的场景下表现很强(SWE-bench 专用模型 74.5%,通用模型 85.5%),但在交互式、频繁对话的 IDE 场景下,Cursor 的体验更流畅。 Codex 的权限审批系统仍有缺陷——VS Code 扩展中的"每次允许"设置被广泛报告为不可用。 API 用户获取新模型有延迟,且会丢失云功能(GitHub PR 审查、Slack 集成、后台代理执行)。
这些不是致命问题,但它们说明了一件事:Codex 的强项是"委派任务"(delegation),不是"结对编程"(pair programming)。如果你把它当成交互式的代码补全工具用,你会失望。如果你把它当成一个能自主完成任务的工程师用,你会发现它的真正价值。
怎么用才对?
基于以上分析,Codex 的正确打开方式不是"写代码时开着它",而是:
smartctl -a disk0,看 Total Bytes Written。如果异常高,Codex 大概率是罪魁祸首。社区提供了临时修复方案:定期执行 sqlite3 ~/.codex/logs_2.sqlite "PRAGMA wal_checkpoint(TRUNCATE);" 并设为定时任务。所以,它到底值不值"最值钱"这个名头?
市场数据不说谎:
Anthropic 内部合并到主代码库的代码中,超过 80% 由 Claude 独立编写并提交(2026 年 5 月数据)。 字节跳动过去一年 AI 代码贡献率增长了 6 倍,AI 代码合入率增长超过 2 倍。 Codex 自己在发布一年内从一款程序员专用工具,变成了 OpenAI 全公司的"主要 AI 工具"。
这些数据指向同一个方向:编程智能体不是"辅助工具",而是"工作主力"。 而在这个赛道里,Codex 是唯一一个同时满足"开源可审计""定价合理""自主完成复杂任务""生态覆盖全终端"四条件的工具。
它不是最好的——取决于你的工作流,Claude Code 的计划模式可能更适合你,Cursor 的 IDE 整合可能更丝滑,Copilot 的零门槛可能更省心。但它是最"值钱"的——因为它的价值不局限于某一种使用场景或某一类用户。
一个工具的价值,最终取决于它能改变多少人的工作方式。Codex 正在让"用代码解决问题"这件事,从程序员的特权变成所有人的基本技能。这才是它最值钱的地方。
当然,前提是 OpenAI 先把那个日志 Bug 修了。在它修好之前,记得检查你的 SSD。
数据来源:OpenAI 官方博客(2026-06-26)、GitHub openai/codex 仓库、Anthropic 官方报告(2026-05)、字节跳动公开分享、eesel.ai 定价分析、七牛云横评分析(2026-05)
夜雨聆风