以前你打开 Codex,是把它当成一个工具。
你进终端,敲一段需求,让它看代码、改文件、跑命令、解释报错。它很像一个坐在你旁边的程序员,但前提是:你得主动把它叫出来。
这次不一样。
OpenAI 给 Codex 放出了 Python SDK。
这意味着 Codex 不再只是一个你手动打开的应用,它开始变成一段可以被别的程序调用的能力。你的 Python 脚本、内部后台、开发平台、自动化流水线,都可以把 Codex 接进去。
这件事真正有意思的地方,不是多了一个安装命令,而是 Codex 开始从界面里的助手,变成代码里的执行组件。

这次到底发布了什么
安装命令很简单:
pip install openai-codex
PyPI 上这个包叫 openai-codex,当前核验到的版本是 0.1.0b2,作者标注为 OpenAI,许可证是 Apache-2.0,要求 Python 版本不低于 3.10。
注意,它现在还是 Beta。
所以这不是那种可以立刻下结论说已经稳定、可以大规模生产部署的东西。更准确地说,它适合开发者先拿来尝鲜,验证工作流,做内部原型。
但即便只是 Beta,也已经能看出 OpenAI 想把 Codex 往哪里推。
以前 Codex 更像一个单独的编程助手。现在它开始提供一组可以被程序编排的接口。
真正重要的是,它把 Codex 拆成了可调用的工作流
官方文档里,这个 SDK 支持的事情包括:
- 启动 Codex thread
- 运行一次 turn
- 流式接收进度和事件
- 恢复已有会话
- 传入图片
- 控制工作区访问权限
这几个词看起来有点技术,但翻成人话很简单。
Thread 可以理解成一段持续的项目上下文。它记着前面发生过什么,知道这次任务属于哪一个连续工作流。
Turn 则是一次具体执行。你给 Codex 下一个任务,它在这个上下文里跑一轮,最后返回结果。

这就和普通的一问一答不一样了。
普通聊天是你问一句,它答一句。SDK 暴露出来的是:你可以在自己的程序里创建一个 Codex 工作现场,让它连续接任务,保留上下文,跑完以后把结果、过程、用量都交回来。
这才是它的工程价值。
不是把 Codex 包成一个聊天框,而是让开发者可以用 Python 去编排 Codex。
复用登录态,可能是最舒服的一点
对开发者来说,一个工具能不能进入日常工作流,很多时候不取决于它宣传得有多强,而取决于它第一步会不会把你卡死。
这次 Codex Python SDK 有一个很关键的设计:可以复用已有的 Codex 认证。
如果你本机已经有可用的 Codex 登录状态,SDK 可以自动复用。也可以显式走 ChatGPT 浏览器登录、device-code 登录,或者 API key 登录。
这件事的意义很直接。
它不是让你每写一个 Python 项目,都重新设计一套复杂认证流程。它更像是把你已经在用的 Codex,往自己的应用和工作流里延伸了一步。
以前你是人去打开 Codex。
现在可以是你的程序去拉起 Codex。
沙箱权限,决定它能不能进入真实工程
一个 Agent 真要进开发环境,第一件事不是问它聪不聪明,而是问它能碰哪里、不能碰哪里。
Codex Python SDK 里提供了沙箱访问控制。
它有几种典型权限:
read_only:只读文件,不允许写入workspace_write:可以读文件,也可以在工作区和配置的可写目录里写文件full_access:不加文件系统访问限制
这部分很重要。
因为 Codex 一旦被嵌进自动化流程,它就不只是回答你一个问题。它可能真的去读项目、改代码、生成文件、检查结果。
如果只是做代码审查,你可能只给它只读权限。
如果要让它生成补丁,可以给工作区写入权限。
如果开到 full access,能力会更大,风险也会更大。
所以这不是一个可以随手全放开的开关。真正靠谱的用法,应该是按任务给权限,能只读就只读,必须写入再写入。
越是自动化,越要把边界写清楚。
图片输入别误读成生图能力
这次很多人容易把一个点看歪:SDK 支持 pass images。
准确说,它支持把远程图片 URL 或本地图片路径作为输入传给 Codex,让 Codex 结合图片和文本完成理解、分析或辅助任务。
这不等于它是生图 SDK。
也不能直接写成内置了图片生成 Agent。
这个边界要分清。

对开发工作流来说,图片输入本身已经很有用。比如你可以把一张报错截图、界面截图、设计稿截图传进去,让 Codex 结合代码上下文去分析问题。
但它和文生图、图片编辑、生成海报,是两回事。
一个能力是看图理解,一个能力是生成图片。不要把二者混在一起。
它会先改变哪些工作流
我觉得这次 SDK 最先影响的,不是普通用户,而是那些已经在写自动化工具、内部平台、开发流水线的人。
比如内部开发平台。
以前平台只能把日志、代码、报错信息展示给人看。现在它可以在某个按钮后面拉起 Codex,让 Codex 先读上下文,给出修复建议,甚至生成一个补丁草稿。
比如代码审查流程。
可以先用只读沙箱让 Codex 看 diff、看测试失败原因、总结风险点。等人确认方向后,再切到工作区写入,让它尝试改一版。
比如自动化脚本。
以前 Python 脚本只能按固定规则跑。以后某些步骤可以交给 Codex 做判断:哪里失败了,为什么失败,下一步该尝试什么。
比如多轮任务型 Agent。
Thread 保存上下文,Turn 推进任务,stream 把过程展示出来,人可以在中间观察、接管、打断。
这套东西组合起来,Codex 就不只是一个回答问题的助手,而是可以被放进流程里的执行单元。
真正的变化:Codex 从应用变成能力
所以这次不要只盯着 pip install openai-codex 这一行。
安装命令只是入口。
真正值得看的,是 OpenAI 正在把 Codex 从一个需要人打开的应用,改造成可以被别的系统调用的能力。
应用要你点开。
能力会被嵌进流程。
这两者差别很大。
当 Codex 可以被 Python 调用、可以维护上下文、可以流式返回进度、可以控制读写权限、可以复用已有认证,它就开始有了进入真实软件工程系统的样子。
当然,现在它还是 Beta,API 可能变化,权限和认证也都要按官方文档来,不能当成无限制、无风险、开箱即用的生产组件。
但方向已经很清楚了。
未来的 AI 编程工具,不会只停留在一个聊天窗口里。
它会越来越多地钻进 IDE、终端、脚本、后台任务、内部平台和自动化流水线。
你看到的可能还是一个按钮。
按钮背后,跑的可能就是一个会读上下文、能执行任务、还知道自己能碰哪里的 Codex。
如果你想看下一篇实操,我可以继续拆:怎么用 Codex Python SDK 做一个最小版的代码诊断助手。评论区或私信回复 Codex,我把步骤整理出来。
夜雨聆风