
最近很多朋友问,Codex 到底怎么用。
正好,过去 Codex 持续高强度更新,装进了 GPT-5.5,内置了浏览器功能,内置了 Gpt-image-2。
它现在不仅稳定,还很能打。
刚好,把这条路一次讲透。装 Codex App,让 AI 同事进你电脑。
话不多说,我们开始。
一、为什么现在该装 Codex App
先校准一下认知。
Codex 不是写代码软件,是你电脑里的实习同事。
聊聊 Claude Code,到底卡在哪。
Claude Code 不是不好用,恰恰相反,它是真的能打。但它有两个绕不开的坎:免费额度抠得紧,封号节奏挺勤。
我身边至少四个朋友,最近一个月里被封了号。有人是开了多端登录,有人就只是用得稍微猛了一点,第二天号就没了。申诉这条路,基本是石沉大海。
OpenAI 的 Codex App,正好补上了这两个坑。

第一,它是 OpenAI 自家出品。和 Claude Code 之于 Anthropic 是同样的关系,但 OpenAI 这边的政策、节奏、风控逻辑,对国内用户相对友好。
第二,稳定性是肉眼可见的稳。我装上的这半个月,没遇到一次莫名掉线,也没听任何朋友说被封。
第三,App 这条路对新手最友好。不用碰命令行,不用配 PATH,不用记一堆参数。装完之后双击图标就能开工。
第四,生态在以肉眼可见的速度长。OpenAI 官方 marketplace 里的 plugin 一周一加:Gmail、Slack、Atlassian、GitLab、CircleCI 这些主流工具基本都进来了;Skills Catalog 也在持续扩;第三方社区已经开始造自己的 plugin marketplace。越往后用,可调用的能力越多,这是一个工具能跟你"长期一起干活"的关键。
二、安装 Codex App
打开浏览器,访问:
https://chatgpt.com/codex
页面右上角有 Download 按钮,点进去,按你电脑的系统下载对应安装包。

下载完之后,和你装其它软件一模一样。双击安装包,跟着引导一步步走,结束。
整个过程不超过 3 分钟,没有任何特殊配置要改。
第一次启动,桌面会出现 Codex 图标。
双击它,进入登录界面。
三、首次启动 + 登录
启动 App,它会问你怎么登录。

第一种:Sign in with ChatGPT(推荐)。
有 ChatGPT Plus / Pro 订阅的,选这个。它会跳浏览器走一次 OAuth 授权,回来就登好了。整个过程不超过 30 秒。
登好之后,App 会自动用你订阅套餐里的 GPT-5.5 额度,不用单独付费。
第二种:Enter API Key。
没订阅的同学,先去 platform.openai.com 生成一个 API Key,粘贴进 App,按 token 计费用。本文主线按订阅党路径讲,没订阅的同学按 API Key 路径走,体验是一样的。
登好之后,你就进入 Codex App 的主界面了。
四、30 秒上手:派第一个真实任务
很多人对 Codex 的第一反应是"这是给程序员的"。
不是。
只要你能用一句话讲清需求,它就能给你做出能跑的成品。
写代码只是它的"形",干活才是它的"魂"。
下面这些都是身边朋友这两周真实在用的:
▸ 自己做小工具:番茄钟、年终倒计时、贷款月供计算器
▸ 小卡片生成器:朋友圈金句卡、公众号封面三连图
▸ 整理类:粘一段会议讨论 → 一键生成结构化纪要
▸ 数据类:粘一段销售数据 → 自动出图表
▸ 写作类:一段口水稿 → 整理成层次清晰的初稿
▸ 程序员:当然也可以,让它写个贪吃蛇
我们就用最经典也最实用的"做一个番茄钟",把流程跑一遍。
为什么选这个?它不需要任何外部素材,你只要会说一句话。做出来之后还能每天真的用。
第一步:选工作文件夹。
App 主界面上方有个 "Open Folder" 按钮,点它,新建一个空文件夹(比如桌面上的 pomodoro),选中打开。
App 会把这个文件夹当成你的工作区。

第二步:派活。
主界面底部有一个对话输入框。
点进去,用大白话把你想要的样子讲清楚:
回车。

第三步:看它干活。
它会先想一下,规划文件结构,然后开始一行行往外吐代码。你能在右侧看到它写代码的过程,思考过程实时呈现。

第四步:打开,开始用。
写完之后,文件树里的 index.html 可以有按钮打开,浏览器就在 Codex 内部开了。一个属于你自己的番茄钟,倒计时、进度环、按钮、提示音,全都在。风格也不错。
我那次给的就是上面那段话,整套生成不到 60 秒。点击"开始",25:00 的大数字开始往下走,圆环慢慢收掉。
到下午快下班,我已经用它专注完了三个番茄钟。

到这里,你的第一个 Codex 任务就跑完了。
整个过程:开 App、选文件夹、说一段话、看它写代码、双击打开。
不到 5 分钟。
最关键的是:你不需要懂 HTML,也不需要看懂任何代码。你只要会描述你想要的样子。
五、Skill 和 Plugin:给 Codex 装"专业技能"和"外部触手"
跑完一个小任务只是开胃菜。
Codex 真正的"长期价值",藏在两个进阶机制里:
Skill 给 Codex 装"专业技能",Plugin 给 Codex 接"外部触手"。
打个比方:
1. Skill = 给员工塞一份岗位 SOP。原本是通才,塞他一份"写周报 / 做竞品调研 / 审代码"的 SOP,他立刻变这个领域的专才。
2. Plugin = 给员工开外部账号。原本他只能在自己电脑里干活,给他开通邮箱、云盘、聊天工具的连接,整个工作流瞬间联通。
没错,它和 Claude Code 的 Skill 和 Plugin 机制是一致的。
不过更香的是,这两件事,Codex App 装上就已经给你预置了一大批。

5.1 装上就有的:System Skills + OpenAI Curated Marketplace
Codex App 不是一个空壳。装好之后,里面已经预置了一批 OpenAI 官方维护的 Skill,你不用动一根手指,直接用就行。

最香的一个:`$imagegen`,内置的图像生成 Skill。
它背后跑的是 OpenAI 4 月刚发布的 gpt-image-2。订阅党不用单独配 API Key,直接说一句话就能让 Codex 出图:
$imagegen 做一张微信朋友圈截图:发布者"小李",配文"AI 同事第三天上班,已经做完我一周的活",下面九宫格放 9 张代码截图,28 个赞、12 条评论。
$imagegen 做一张微信群聊截图:群名"我和我的 AI 同事",最新一条消息是 AI 头像在说"老板,周报我刚发到你飞书了",配"已读"标记和发送时间。

这一下打通的不只是"画图",是"精确还原 UI 和文字"。朋友圈、群聊、小红书、ChatGPT 对话框,给一个画面、给一段文案,它直接把一张以假乱真的截图丢给你。这就是 gpt-image-2 真正强的地方:文字写得准、UI 还原得像、细节扣得稳。
除了 $imagegen,还有处理 GitHub PR 评论的 $gh-address-comments、自动拆解任务计划的 $create-plan 等一批工具向 Skill。
🌊
Plugin 这边更友好。App 里直接内置了 OpenAI Curated Marketplace。打开 Plugins 标签页,一键浏览、一键安装。

国内用户翻 marketplace 时,Gmail / Slack / Atlassian 这些国际工具大概率用不上。但有两个 OpenAI 官方 Plugin,国内国际都通用,强烈推荐先装上。
Computer Use:让 Codex 操作你的 Mac
@Computer Use。装上之后,Codex 能看见你的屏幕,点鼠标、敲键盘、切窗口、读菜单。
它最强的地方,是接管 GUI 操作。任何"非得点鼠标才能完成"的活,都能让它代劳:
1. 跨 App 串联:从浏览器抓段内容、截图、归到本地、丢进笔记,一句话连起来
2. 批量重复点击:网页里要手动点 50 次的事、桌面上 100 个文件一个个改名
3. 没 API 的应用:那些"只有 GUI 没插件"的桌面软件,让它替你点
@Computer Use 我要查"番茄工作法",在 5 个网站打开搜索第一篇文章,每页截屏一张,最后拼成一张 references.png 放桌面。
装 Computer Use 需要给它屏幕录制 + 辅助功能权限,这是 macOS 的标准授权流程。目前仅支持 Mac。
Browser Use:让 Codex 操作 App 内置浏览器
@Browser。装上之后,Codex 能在 App 自带的浏览器里打开网页、点链接、抓信息、留视觉评论。
适合的场景:
1. 抓一段公开网页内容(新闻、博客、报告、商品页)
2. 打开你刚做完的网页或小工具,让它自己测一遍有没有问题
3. 对照设计稿做视觉验收
@Browser 打开我刚才做的番茄钟 index.html,按"开始"跑一下,看倒计时、进度环、按钮有没有问题。
注意:内置浏览器不支持登录态、cookies、浏览器扩展。需要登录的网页(飞书后台、公司内网等),还是要用普通浏览器。
5.2 自己写 Skill:把你的工作 SOP 教给 Codex
预置的那批解决的是"通用场景"。但每个人都有自己反复在做的活,比如写日报、整理素材、回固定模板的邮件、做某种格式的卡片,这些通用 Skill 是覆盖不到的。
自己写一份 Skill,就是把这件事的 SOP 一次写清楚,下次只要 `$skill-name` 一句话搞定。
写 Skill 有两条路,强烈建议非技术同学走第一条。
第一条(推荐):让 Codex 帮你写。
Codex 官方非常贴心,内置了一个叫 `$skill-creator` 的"元 Skill",它的唯一作用,就是"帮你做新的 Skill"。
打开 Codex 对话框,敲:
它会反问你几个问题:这个 Skill 是干嘛的?什么时候用?要包含哪些步骤?输出长什么样?
你用大白话回答完,它直接帮你生成完整的 Skill 目录 + SKILL.md,YAML 标头全部填好,文件路径自动放对位置,不用你动一个字符。
这条路对职场非技术同学几乎零门槛。你只需要会描述自己的工作流程,剩下的 Codex 自己造。
第二条:自己手写。
想完全控制每一行内容的,手写也很简单。
Skill 必须是个目录,不是单 Markdown 文件,这点千万别搞错。
存放路径有几个层级,按需选:
<项目根>/.agents/skills/ | ||
$CWD/.agents/skills/ | ||
~/.agents/skills/ |
最简单的目录结构:
SKILL.md 必须是带 YAML frontmatter 的 Markdown,name 和 description 是必填字段:
写完之后,下次你在 Codex 里直接敲 $weekly-report,它就自动调用这份 SOP,不用每次重新讲规则。
🌊
Skill 和 Plugin 的组合,才是 Codex 比 ChatGPT 网页版真正强的地方。
ChatGPT 网页版每次都从零开始,你说什么它就做什么。
但 Codex 把装上就有的 system skills、marketplace 一键装的 plugins、加上你自己写的 SKILL.md 三层叠在一起。它记得你的工作方式,能伸手到你的工作环境。
六、踩坑速查:两个最常见报错
最后给你一份"出事查表",两个最容易卡住的点,对应解法直接抄。
报错 1:登录失败 / Sign in failed。
按这个顺序排查:
第一,查网络(OpenAI 登录这一步对网络环境敏感)。
第二,App 设置里点 Sign Out,重新登一次。
第三,换登录方式(订阅党试试 API Key 路径,反过来也一样)。
走一遍登出再登入流程,七成的登录问题能修好。
报错 2:App 启动后空白 / 卡在加载页。
绝大多数是版本太旧。
App 设置里点 Check for Updates,升到最新版(推荐 26.415 及以上)。还不行就重装一遍,这是最快的解法。
收尾
写到这儿,回过头看看这六个小节、一个 60 秒做出来的番茄钟、一份装上就能用的 $imagegen。其实它们全在讲同一件事。
Codex 不是写代码的软件,是你电脑里那个永远在线的实习同事。
它不会替你思考你要做什么,但你说出来的每一件具体的事,它都会认真去干。
今天你就可以,把 Codex App 装上,让它做一个真能用的小东西:一个番茄钟、一张金句卡片、一份周报模板,都行。
至于 Claude Code,它依然有最强的 Agent。和 Codex 不冲突。
按自己的习惯,择优即可。
以上,既然看到这里了,如果觉得不错,随手点个赞、在看、转发三连吧,如果想第一时间收到推送,也可以给我个星标⭐~谢谢你看我的文章
你的关注是我持续更新的动力~
我是谁
我是 AI大刘,北大毕业,大模型研究方向,腾讯犀牛鸟,先后在腾讯、百度的大模型研发部门,现在给多家国企做AI顾问(也期待大家和我咨询交流
夜雨聆风