OpenAI 工程师亲述:我是如何把 Codex 用到极致的OpenAI 工程师的实战经验分享作者:Jason(OpenAI 工程团队)核心观点:Codex 给我们带来的最大改变,不是它能替我们写几行代码,而是它让我们的工作在关掉电脑后依然能够「持续流动」。不再是一次次断裂的提问,而是一个持续进化的、有记忆的、能执行的操作系统。在 Codex 问世之前,我就已经在深度使用各种编程智能体了。但那时,我主要把它们局限在「写代码」这件事上:改 Bug、重构代码库、提交 PR。从去年 11 月开始,我尝试突破这个边界,将它们引入到更广阔的知识型工作中。我用它们制作幻灯片、充当语音速记员,并不断探索编程智能体还能生成哪些产出物:一个 HTML 页面、一份 PDF、一张电子表格,甚至是一套完整的演示文稿。最近 Codex App 的升级让我感觉到,这种「全能模式」终于变得原生且顺滑了。Codex 依然擅长写代码,但更有趣的转变在于:它为我的工作提供了一个「栖息地」。我行为模式的改变,源于学会了给工作构建一个「闭环操作系统」:持久的对话记录、共享内存、能够操控电脑的工具、引导和恢复任务的手段,以及一个可以直接审阅产出物的界面。1. 持久化对话(Durable Threads)第一个改变我习惯的是「对话压缩(Compaction)」。我现在会为每一个重要的工作流保留一个「置顶对话」。这不再是简短的聊天,而是运行了几个月、经过不断压缩的「超级对话」。它们积累了大量的历史背景、个人偏好和过往决策,让我不必每次回来都重新交待背景。提速小技巧:你可以通过 Command + 1 到 Command + 9 快速跳转到你的置顶对话。虽然长对话会因为上下文加载产生更高的成本,但对于核心工作流来说,这种上下文的连续性远比省那点钱更值钱。2. 语音输入:捕捉未加工的灵感语音输入能让更多真实的想法进入 Codex。其核心优势不在于速度,而在于「未经修剪」。当我在规划一项工作时,我可能会随口说:「我记得 Slack 里有个叫 Ben 的家伙提过这事,具体忘了,你去帮我找找。」 这种模糊的指令写起来很烦,但说出来却极其自然。这种「混乱的初稿」往往包含更多上下文。无论是通话记录还是随手录音,将这些未经润色的想法喂给模型,往往能得到更深刻的方案。3. 引导与协同(Steering)当语音结合「引导」功能时,威力倍增。你可以在工具调用后直接插入下一条指令。比如我在审阅网页时,可以一边看一边继续下达意图,而不必等每一步都执行完。这种「任务队列」式的工作方式,让你可以在布置完任务后直接走开,让 AI 自己去跑。4. 共享内存:打造个人的知识库对话长了,就需要对话之外的「持久化存储」。最关键的一步是「写在磁盘上」。对话里的记忆是会被锁死的,除非你把精华提取出来。我通常会使用一个 Obsidian 库(Git 管理)作为 AI 的「大脑」:AGENTS.md:这是给模型的最高指令,要求它在学习到新知识、做出决策或完成任务后,自动更新库里的相关文档。通过 Git 的 Diff(代码差异)功能,我可以清晰地看到 AI 认为哪些信息值得被记住。这种文件化记忆让知识不再随对话结束而消失,即使对话被压缩或昂贵到无法继续,核心资产依然在你的硬盘里。5. 电脑与浏览器操作现在的 Codex 拥有了「手」:$browser:操作内置浏览器@chrome:操作你已经登录的浏览器标签页@computer:直接操控桌面应用我最常用的场景是 Appshots(双击 Command 键)。当我看到一个奇怪的 Bug 弹窗、复杂的日程表或设计图时,不再需要打字描述,直接「拍」给 Codex 看:「就是这个,你处理一下。」通过 Slack、Gmail 和日历的连接器(Connectors),AI 的触角延伸到了代码之外。工作往往在变成代码之前,就已经在 Slack 频道或日历里开始了。6. 远程控制与心跳自动化(Heartbeats)Heartbeats(心跳)是让 Codex 从「被动等待」变为「主动工作」的关键。你可以设定自动化任务,比如我的「幕僚长(Chief of Staff)」对话:「每 30 分钟检查一次 Slack 和 Gmail,找出需要我关注的消息,调研背景并帮我写好回复草稿(不要发送)。」当我回到电脑前,回复已经躺在草稿箱里了。我只需审阅发送。实战案例:我甚至在包裹被盗时,让 @computer 去跟亚马逊客服「拉锯」:每 5 分钟检查客服是否上线,一旦上线就申请退款。等我洗完澡出来,退款已经办妥了。7. 设定野心勃勃的目标(Goals)目标设定决定了 AI 的执行上限。不要只给模糊的指令,要给它一个「验证标准(Oracle)」。比如我要把一个 Python 库迁移到 Rust,我会设定目标:「迁移代码,且必须通过原有的单元测试。」 只有有了这种明确的验证反馈,AI 才能真正自我迭代,直到达成结果。8. 侧边栏:工作的真正发生地侧边栏是 Codex 最让我兴奋的地方。它不仅仅是预览窗口,它是工作的现场。你可以直接在侧边栏里编辑 Markdown、操作 CSV 表格、甚至运行一个动态的 index.html。我现在的习惯是:让 AI 生成一个单页 HTML 应用,在侧边栏打开,然后通过心跳不断更新这个 Artifact。这样,当我回到对话时,看到的不再是文字,而是一个鲜活的、最新的工作成果。写在最后Codex 给我们带来的最大改变,不是它能替我们写几行代码,而是它让我们的工作在关掉电脑后依然能够「持续流动」。不再是一次次断裂的提问,而是一个持续进化的、有记忆的、能执行的操作系统。