OpenAI 工程师亲述:我是如何把 Codex 用到极致的

OpenAI 工程师的实战经验分享

作者：Jason(OpenAI 工程团队)

核心观点：Codex 给我们带来的最大改变，不是它能替我们写几行代码，而是它让我们的工作在关掉电脑后依然能够「持续流动」。不再是一次次断裂的提问，而是一个持续进化的、有记忆的、能执行的操作系统。

在 Codex 问世之前，我就已经在深度使用各种编程智能体了。但那时，我主要把它们局限在「写代码」这件事上：改 Bug、重构代码库、提交 PR。

从去年 11 月开始，我尝试突破这个边界，将它们引入到更广阔的知识型工作中。我用它们制作幻灯片、充当语音速记员，并不断探索编程智能体还能生成哪些产出物：一个 HTML 页面、一份 PDF、一张电子表格，甚至是一套完整的演示文稿。

最近 Codex App 的升级让我感觉到，这种「全能模式」终于变得原生且顺滑了。Codex 依然擅长写代码，但更有趣的转变在于：它为我的工作提供了一个「栖息地」。

我行为模式的改变，源于学会了给工作构建一个「闭环操作系统」：持久的对话记录、共享内存、能够操控电脑的工具、引导和恢复任务的手段，以及一个可以直接审阅产出物的界面。

1. 持久化对话（Durable Threads）

第一个改变我习惯的是「对话压缩（Compaction）」。

我现在会为每一个重要的工作流保留一个「置顶对话」。这不再是简短的聊天，而是运行了几个月、经过不断压缩的「超级对话」。它们积累了大量的历史背景、个人偏好和过往决策，让我不必每次回来都重新交待背景。

提速小技巧：你可以通过 Command + 1 到 Command + 9 快速跳转到你的置顶对话。

虽然长对话会因为上下文加载产生更高的成本，但对于核心工作流来说，这种上下文的连续性远比省那点钱更值钱。

语音输入能让更多真实的想法进入 Codex。其核心优势不在于速度，而在于「未经修剪」。

当我在规划一项工作时，我可能会随口说：「我记得 Slack 里有个叫 Ben 的家伙提过这事，具体忘了，你去帮我找找。」这种模糊的指令写起来很烦，但说出来却极其自然。

这种「混乱的初稿」往往包含更多上下文。无论是通话记录还是随手录音，将这些未经润色的想法喂给模型，往往能得到更深刻的方案。

当语音结合「引导」功能时，威力倍增。

你可以在工具调用后直接插入下一条指令。比如我在审阅网页时，可以一边看一边继续下达意图，而不必等每一步都执行完。

这种「任务队列」式的工作方式，让你可以在布置完任务后直接走开，让 AI 自己去跑。

对话长了，就需要对话之外的「持久化存储」。最关键的一步是「写在磁盘上」。

对话里的记忆是会被锁死的，除非你把精华提取出来。我通常会使用一个 Obsidian 库（Git 管理）作为 AI 的「大脑」：

AGENTS.md：这是给模型的最高指令，要求它在学习到新知识、做出决策或完成任务后，自动更新库里的相关文档。

通过 Git 的 Diff（代码差异）功能，我可以清晰地看到 AI 认为哪些信息值得被记住。这种文件化记忆让知识不再随对话结束而消失，即使对话被压缩或昂贵到无法继续，核心资产依然在你的硬盘里。

现在的 Codex 拥有了「手」：

$browser：操作内置浏览器

@chrome：操作你已经登录的浏览器标签页

@computer：直接操控桌面应用

我最常用的场景是 Appshots（双击 Command 键）。当我看到一个奇怪的 Bug 弹窗、复杂的日程表或设计图时，不再需要打字描述，直接「拍」给 Codex 看：「就是这个，你处理一下。」

通过 Slack、Gmail 和日历的连接器（Connectors），AI 的触角延伸到了代码之外。工作往往在变成代码之前，就已经在 Slack 频道或日历里开始了。

Heartbeats（心跳）是让 Codex 从「被动等待」变为「主动工作」的关键。

你可以设定自动化任务，比如我的「幕僚长（Chief of Staff）」对话：「每 30 分钟检查一次 Slack 和 Gmail，找出需要我关注的消息，调研背景并帮我写好回复草稿（不要发送）。」

当我回到电脑前，回复已经躺在草稿箱里了。我只需审阅发送。

实战案例：我甚至在包裹被盗时，让 @computer 去跟亚马逊客服「拉锯」：每 5 分钟检查客服是否上线，一旦上线就申请退款。等我洗完澡出来，退款已经办妥了。

目标设定决定了 AI 的执行上限。不要只给模糊的指令，要给它一个「验证标准（Oracle）」。

比如我要把一个 Python 库迁移到 Rust，我会设定目标：「迁移代码，且必须通过原有的单元测试。」只有有了这种明确的验证反馈，AI 才能真正自我迭代，直到达成结果。

侧边栏是 Codex 最让我兴奋的地方。它不仅仅是预览窗口，它是工作的现场。

你可以直接在侧边栏里编辑 Markdown、操作 CSV 表格、甚至运行一个动态的 index.html。

我现在的习惯是：让 AI 生成一个单页 HTML 应用，在侧边栏打开，然后通过心跳不断更新这个 Artifact。这样，当我回到对话时，看到的不再是文字，而是一个鲜活的、最新的工作成果。

Codex 给我们带来的最大改变，不是它能替我们写几行代码，而是它让我们的工作在关掉电脑后依然能够「持续流动」。

不再是一次次断裂的提问，而是一个持续进化的、有记忆的、能执行的操作系统。