
OpenAI 官方对 Codex 的定位已经不是普通聊天机器人,而是面向真实工程和工作流的 AI assistant。它可以在 App、CLI、IDE、云端环境中工作,帮助用户完成代码、文档、原型、自动化和项目级任务。
一、Codex 和普通聊天 AI 最大的区别:它不只是回答,而是交付

普通聊天 AI 更像顾问。你问它“怎么做一个网页”,它会告诉你步骤;你问它“这段代码哪里错了”,它会解释原因。
Codex 更像一个可以动手干活的数字员工。它能进入项目目录,理解文件结构,修改代码,运行测试,最后给出变更总结。官方介绍 Codex 时,也强调用户可以通过引用、终端日志和测试结果验证它的工作,而不是只看一段文字回答。
这就是视频真正想表达的核心:未来不是“谁更会提问”,而是“谁更会管理 AI Agent”。
二、第一步:安装并登录 Codex,把它放进你的工作环境

Codex 可以通过 Codex App、Codex CLI、IDE extension 等方式使用。对于新手,最直观的是 Codex App;对于开发者,最常用的是 CLI。
如果使用 CLI,官方文档和 GitHub 仓库中都给出了典型安装方式:
npm install -g @openai/codex
安装后进入你的项目目录:
cd your-projectcodex
启动后,Codex 会显示当前模型、当前目录、可用命令和输入区域。你可以直接让它解释代码库、修改 bug、生成测试或创建文件。
三、Project:给 AI 员工准备一张“办公桌”

Project 可以理解为 Codex 的工作空间。你不能让 AI 在一个混乱的大文件夹里乱找东西,而应该给它一个明确的工作目录。
例如:
my-codex-project/├── drafts/├── assets/├── output/├── notes/└── AGENTS.md
如果你做公众号内容,可以把草稿放在 drafts/,图片放在 assets/,最终输出放在 output/。
如果你做 App,可以把源码、设计图、测试文件、说明文档都放在同一个项目里。
Codex 的关键不是“凭空聪明”,而是它能在真实项目上下文里工作。项目结构越清晰,Agent 越不容易跑偏。
四、AGENTS.md:写给 AI 员工的入职手册

AGENTS.md 是视频里非常重要的点。它相当于写给 Codex 的“项目说明书”或“员工入职手册”。
OpenAI 官方文档说明,Codex 会读取 AGENTS.md,用它来获得项目级指令、代码规范、测试方式和工作流程。
你可以这样写:
# AGENTS.md## 你的身份你是我的内容和开发助理,负责公众号文章、代码整理、网页原型和资料归档。## 默认语言默认使用简体中文。涉及英文术语时保留英文,并给出中文解释。## 工作流程1. 复杂任务先给计划,不要直接执行。2. 修改文件前说明会修改哪些文件。3. 完成后总结新增、修改、待确认内容。4. 涉及事实、价格、产品功能时必须查证来源。## 文件结构- drafts/:文章草稿- assets/:图片素材- output/:最终输出- notes/:资料笔记## 禁止事项- 不得编造来源。- 不得把 AI 生成图说成真实截图。- 不得删除文件,除非用户明确要求。
这一步非常关键。不要每次都重新写一大堆 prompt,而是把长期规则沉淀进 AGENTS.md。
五、Skills:把重复任务封装成标准流程

Skills 的本质是:把你经常做的任务变成可复用 SOP。
OpenAI 官方文档中把 Skills 定义为可复用工作流,用来帮助 Codex 按照固定方式执行任务。它可以包含说明、步骤、脚本、工具调用和验收标准。
比如你经常要做公众号文章,可以写一个“公众号文章 Skill”:
# 公众号文章 Skill## 目标根据视频、文章、论文或资料,生成适合微信公众号发布的长文。## 输出要求- 标题要有吸引力,但不能标题党。- 每个大标题下必须有核心观点。- 技术内容必须准确。- 每个标题下面必须配一张真实图片。- 图片不能是 AI 生成图。- 不能只给图片链接,要直接插入文章位置。## 验收标准- 文章结构完整。- 步骤可以复现。- 事实有来源。- 图片和标题内容强相关。
这样以后你只需要调用这个 Skill,而不是每次都重新解释一遍文章风格、配图规则和准确性要求。
六、Automations:让 Codex 定时干活,而不是你每次催它

Automations 是把 Codex 从“你叫它才干活”变成“到时间自动执行任务”。
视频里讲到的逻辑是:你可以让 Codex 定时检查项目、总结变更、整理文档、复盘工作流,甚至发现哪些流程值得沉淀成 Skill。
OpenAI 相关页面展示过 Codex 自动化任务界面,例如定时修复 bug、审查 PR、更新 AGENTS.md、总结团队 PR、写 release notes 等。
一个实用的自动化任务可以这样写:
每天上午 10 点检查 drafts/ 文件夹。总结昨天新增和修改的文章。指出哪些内容还缺图片、缺来源、缺结论。只生成报告,不要直接修改原文。
注意,自动化一定要加边界。尤其是删除文件、发送邮件、提交代码、调用付费 API 这些动作,必须要求 Codex 先询问确认。
七、Plugins:让 Codex 接入真实工具链

Plugins 的作用是让 Codex 不只停留在本地文件和聊天框里,而是可以连接外部工具。
视频里提到的 Gmail、Google Drive、Canva、Figma、GitHub、Slack,本质上都是让 Agent 进入真实工作流。
例如:
让 Codex 读取 Gmail,整理最近一周的商务邮件;让 Codex 读取 Google Drive,汇总项目资料;让 Codex 根据 Figma 设计稿生成前端代码;让 Codex 结合 GitHub issue 自动生成 PR;让 Codex 把固定流程变成可复用 Skill。
这也是 Codex 和普通聊天 AI 的关键区别:普通 AI 更像聊天窗口,Codex 更像工作台。
八、CLI:开发者最直接的 Codex 使用方式

CLI 是 Codex 非常重要的使用方式。它让 Codex 直接进入终端,读取当前代码仓库,并根据你的命令执行任务。
典型操作是:
cd your-repocodex
然后输入:
explain this codebase to me
或者:
find and fix the bug in the login flow
Codex 会先探索项目文件,再给出分析、修改建议,必要时写代码、运行测试。截图中可以看到,Codex CLI 会显示当前工作目录、模型、approval mode 和任务状态。
这比单纯复制代码到聊天窗口更强,因为它看到的是完整项目,而不是孤立片段。
九、Approval Mode:不要把所有权限一开始都交给 AI

Codex 可以读文件、改文件、运行命令,所以权限管理非常重要。
CLI 中可以通过 approval mode 控制 Codex 能做什么。一般建议新手从保守模式开始:
只允许读取文件;修改文件前必须确认;运行命令前必须确认;涉及删除、提交、推送、付费 API 时必须再次确认。
截图中可以看到 Codex CLI 会显示 approval mode、sandbox 状态、当前目录和账户信息。
不要一上来就给 full auto。Agent 再强,也必须先在可控边界内工作。
十、MCP:让 Codex 调用更多外部能力

MCP 是 Model Context Protocol。它的作用是让模型接入更多工具、上下文和外部系统。
OpenAI 官方文档中给出的方向是:Codex 可以作为 MCP server,也可以通过 MCP 接入其他工具,从而构建多 Agent 或多工具工作流。
简单理解:
CLI 让 Codex 进入终端;Plugins 让 Codex 接入外部应用;MCP 让 Codex 和更多工具系统打通。
例如你可以让它接入浏览器、Figma、数据库、文档系统、任务系统。这样 Codex 就不是“一个聊天机器人”,而是“一个可以调用工具的工作代理”。
十一、从设计图到 App:必须形成“生成—运行—测试—修改”闭环

视频中提到的 App 生成流程,本质不是让 AI 画一张漂亮图,而是让它真正做出可运行结果。
正确流程应该是:
设计参考图↓让 Codex 分析页面结构↓生成开发计划↓创建项目文件↓写代码↓运行本地预览↓测试交互↓根据错误继续修改
这一步最重要的验收标准是:不能只看截图,必须能运行。
如果你让 Codex 做网页或 App,一定要明确写:
不要只生成代码。请给出运行命令、预览方式、测试步骤和已知问题。如果运行失败,继续定位原因并修复。
Agent 工作最终看的不是“回答得像不像”,而是“结果能不能跑”。
十二、新手最稳妥的 Codex 使用顺序

新手不要一上来就追求多 Agent、自动化、插件全开。最稳的路线是:
先安装 Codex;再建一个 Project;然后写 AGENTS.md;接着完成一个小任务;把重复任务沉淀成 Skill;最后再接入 Plugins、Automations 和 MCP。
比如你可以从一个最简单的任务开始:
请读取 notes/ 文件夹里的资料,整理成一篇微信公众号文章,每个大标题下插入一张真实图片,输出到 output/article.md。
等这个流程稳定后,再把它写成 Skill。这样你就从“临时提问”升级成了“流程化指挥”。
结尾:以后不是会不会用 AI,而是会不会指挥 Agent

Codex 真正改变的不是某一个按钮,而是工作方式。
过去我们使用 AI,是把问题丢给它,让它回答。现在使用 Codex,是把任务、文件、规则、工具和验收标准交给它,让它完成。
普通 AI 使用者得到答案。Agent 使用者得到交付。
你现在最应该做的三件事是:
1. 装好 Codex;2. 建一个 Project;3. 写一份 AGENTS.md;4. 把最重复的任务做成 Skill。
这就是从“会问 AI”到“会管理 AI 员工”的分水岭。
夜雨聆风