Codex App新手快速入门教程-夜雨聆风

Codex App新手快速入门教程

大家好，我是鲁工。

前段时间，OpenAI正式把Codex App搬上了Windows。在Windows上用了大半年Claude Code，终于能体验到Codex的App版本了。

之前macOS版2月初发布的时候，我就想上手试试，但手头主力机是Ubuntu和Windows（Ubuntu用于深度学习开发环境，Windows用于日常前后端开发），只能干看着（就快去买Mac Pro了）。根据OpenAI官方数据，macOS版上线第一周下载量就破了100万，Windows等待名单排了50多万人，这热度确实很猛。

我们号之前写Claude Code比较多，关于Codex写的不多：Codex重磅更新：在CLI中语音Vibe Coding。正好趁Windows版刚发布，这篇把Codex App的安装、配置、核心功能过一遍。

Codex产品生态

很多人可能会混淆，OpenAI现在有好几个叫Codex的东西，这里先理一下。

Codex其实是OpenAI的AI编程产品线的统称，目前有四种使用方式：Codex App（就是咱们今天聊的这个桌面应用），Codex CLI（命令行工具，对标Claude Code），Codex IDE Extension（VS Code插件），还有Codex Web（chatgpt.com/codex上的云端版本）。

Codex App：

Codex CLI：

Codex VSCode插件：

Codex Web：

四种方式共享同一个账号、同一套配置和会话历史。简单来说就是同一个Agent，四个入口。你在CLI里的对话，打开App也能接着聊。

Codex App的定位，官方原话叫”Agent的指挥中心”。它和CLI最大的区别在于，CLI一次只能跑一个Agent，App可以同时开多个Agent线程并行跑任务，还能看diff、做代码审查、管理Skills和Automations。如果说CLI是单兵作战，App就是AI编程指挥部。

Codex主力模型目前是GPT-5.4和GPT-5.3-Codex，从能力上看，这两个模型都算是前沿的顶级Coding模型。

Windows安装与登录

安装也比较直接。

最简单的是去Microsoft Store搜索Codex，直接下载。系统要求是Windows 10 version 19041.0或更高，基本上2020年以后更新过的Win10和Win11都没问题。

安装完打开App，用你的ChatGPT账号登录即可，或者按照OpenAI API Key，也可以直接用Key登录。

这里有个建议：装Codex App之前，最好先确认你的机器上有Git、Node.js和Python。Git是代码审查和回滚要用的，Node.js和Python是Agent执行任务时会依赖的。如果你做.NET开发，把.NET SDK也装上。虽然这些不是硬性要求，但装了之后Agent能做的事会多很多。

第一次使用：创建项目和发起任务

打开App后，第一步是选一个项目文件夹。点左上角的”Add new project”或者按Ctrl+O，选择你本地的代码目录就行。

选好项目后，注意界面上有个Local和Cloud的切换。选Local就是Agent在你本机上跑，用你本地的开发环境和工具链。选Cloud就是在OpenAI的云端沙箱里跑。对于Windows用户，个人建议先用Local模式，这样Agent可以直接调用你机器上的PowerShell、Git、Node.js这些工具。

然后就可以在输入框里给Agent发任务了。比如”帮我把这个项目里的所有console.log清理掉”，或者”给这个函数写一组单元测试”。Agent会开始工作，你可以实时看到它在执行什么命令、编辑哪些文件。

核心功能一：多Agent并行与Worktrees

这是Codex App和CLI最大的差异，也是我觉得App最值钱的功能。

你可以在同一个项目下开多个Thread（线程），每个Thread跑一个独立的Agent任务。比如一个Thread让Agent写前端组件，另一个Thread让它写后端API，再开一个Thread让它写测试用例。三个Agent同时干活，互不干扰。

这背后靠的是Worktrees（工作树）机制。如果你的项目是Git仓库，Codex会自动给每个Thread创建一个独立的工作树。简单来说就是把你的代码复制了一份出来，每个Agent在自己的副本上改，改完了你再决定要不要合并。

默认的工作树是Codex自动管理的，轻量级，用完就丢。如果你需要一个长期存在的隔离环境，可以在侧边栏项目的三点菜单里创建”永久工作树”，多个Thread可以共享同一个永久工作树。

每个Thread完成后，App内置了一个Diff审查面板。你可以看Agent改了哪些文件、改了哪些行，支持行内评论，也可以直接stage或者revert某些代码块，最后在App里直接commit。整个流程不需要切换到别的工具。

核心功能二：Skills技能系统

Skills成为Agent行业标准后，Codex App必然也会重点支持。

简单来说，Skill就是一组打包好的指令、资源和脚本，告诉Agent怎么完成某类特定任务。有了Skill，Agent不光能写代码，还能做设计稿还原、项目管理、云端部署这些事。

Codex App内置了一个技能库，OpenAI自己在内部用的一些Skill也开源了。几个比较实用的：Figma设计稿实现（抓取Figma的设计上下文，直接转成UI代码），Linear项目管理（在Linear里做Issue分类、版本跟踪），图片生成（用GPT Image生成网页素材、游戏资产），还有Cloudflare、Vercel、Netlify的一键部署。

开源技能仓库地址：

https://github.com/openai/skills

你也可以自己写Skill。在App的Skills管理界面里创建就行，创建好之后CLI和IDE Extension也能用，还可以check in到仓库让整个团队共享。

核心功能三：Automations自动化

Automations可以让Codex在后台按计划自动跑任务，不需要你手动触发。

在App的Automations标签页里，你可以设定一个任务的提示词、指定要用的Skill、选择执行频率（比如每天一次、每小时一次）。Agent会按计划自动执行，执行完结果进入审查队列，你有空了再去看。

OpenAI内部用Automations做的事包括：每天自动分类GitHub Issue、汇总CI失败原因、生成每日发布简报、定期扫描潜在Bug。这些事情单次做不复杂，但每天重复做就很耗时间，交给Automations确实省心。

目前Automations只支持本地触发，也就是说你的电脑得一直开着才行。根据官方文档，云端触发的支持已经在计划中了。

Windows专属：沙箱机制与双模式

Windows版最值得聊的技术细节，是OpenAI专门为Windows做的原生沙箱。

这套沙箱完全基于Windows原生的安全机制搭建，不依赖WSL或者虚拟机。具体来说用了Restricted Token（受限令牌）限制Agent权限，Filesystem ACLs（文件系统访问控制）限制Agent能写哪些文件，Dedicated Sandbox User（专用沙箱用户）让Agent以一个低权限用户身份运行，再加上Windows防火墙规则限制网络访问。

在App的Settings里，Sandbox settings可以选Agent的权限等级。比如Read only模式下Agent只能读文件不能改，适合你先让Agent看看代码给建议的场景。Approval policy则控制Agent什么时候需要问你要授权，On request模式下Agent遇到需要提权的操作（比如网络访问）会弹窗确认。

另外Settings里有个挺贴心的功能：Import external agent config。如果你之前用Claude Code，它能自动检测并导入你的Claude Skills和CLAUDE.md配置到Codex对应的目录里，省去了手动迁移的麻烦。

根据官方文档，Codex App在Windows上也支持WSL模式。如果你的机器上装了WSL，Settings里会多出Agent environment的切换选项，可以把Agent从Windows原生（PowerShell）切到WSL（Linux环境）。切换后需要重启App。没装WSL的话这个选项不会出现，直接用Windows原生模式就行。

这里有个坑：Windows原生模式和WSL模式的配置目录是分开的，Windows下在 %USERPROFILE%.codex，WSL下在 ~/.codex。如果你两边都用，需要手动同步配置，或者设一个环境变量 CODEX_HOME 统一指向同一个目录。另外目前WSL模式有个已知Bug，切到WSL后点”Open config.toml”可能还是打开Windows路径下的配置文件，这个问题还需要等官方修复。

定价与竞品简要对比

Codex App包含在ChatGPT的付费订阅里，不用额外付费。ChatGPT Plus每月20美元，Pro每月200美元，Business每月30美元/人。

目前有个限时活动，Free和Go用户也能用Codex。Plus和Pro用户还分别有5美元和50美元的免费API额度可以领。达到用量上限后可以购买额外的Credits继续用。

聊完定价说说竞品。目前桌面端/CLI端的国外AI编程工具主要就三家：Codex、Claude Code、Gemini CLI。

Claude Code目前旗舰模型是Opus 4.6，这也是我目前的主力模型，一次通过率在三家里是最高的。它的Agent Teams功能也支持多Agent并行。但Claude Code的价格偏高，需要单独的Anthropic订阅。

Gemini CLI跑Gemini 3 Pro，最大的优势是有免费层（每天1000次请求），而且有1M token的上下文窗口。但实际Gemini CLI的主要问题还是不好用，所以我之前说Google最好能趁早把CLI和Antigravity这两个产品做成硬收费项目。

Codex的优势在于和ChatGPT生态的深度绑定，Skills和Automations目前是独有的，GitHub Actions也有原生集成。如果你已经是ChatGPT付费用户，Codex基本是零成本上手。

我初步用下来，Codex App给我印象最深的是多Agent并行的流畅度。以前用Claude Code跑并行开发，一般都是用git worktree方案，现在用Codex App可以直接开三四个Thread各跑各的，对于有多个模块需要同时推进的项目来说，效率提升巨大。Skills系统也很有想象空间。目前内置的Skill已经覆盖了前端开发、项目管理、部署、文档处理这几个高频场景，社区也在陆续贡献新的Skill。

如果你是ChatGPT Plus或者Pro用户，个人建议去Microsoft Store下下来试试。如果你是免费用户，趁现在限时开放也可以先体验一下。

Codex App下载地址（Microsoft Store）：

https://apps.microsoft.com/detail/9plm9xgg6vks

Codex官方文档：

https://developers.openai.com/codex/app/

感谢您阅读我的文章。我是鲁工，九年AI算法老兵，AI全栈开发者，深耕AI编程赛道。感兴趣的朋友也可以加我微信（louwill26_）交个朋友。

>/ 作者：鲁工