乐于分享
好东西不私藏

Codex App新手快速入门教程

Codex App新手快速入门教程

大家好,我是鲁工。

前段时间,OpenAI正式把Codex App搬上了Windows。在Windows上用了大半年Claude Code,终于能体验到Codex的App版本了。

之前macOS版2月初发布的时候,我就想上手试试,但手头主力机是Ubuntu和Windows(Ubuntu用于深度学习开发环境,Windows用于日常前后端开发),只能干看着(就快去买Mac Pro了)。根据OpenAI官方数据,macOS版上线第一周下载量就破了100万,Windows等待名单排了50多万人,这热度确实很猛。

我们号之前写Claude Code比较多,关于Codex写的不多:Codex重磅更新:在CLI中语音Vibe Coding。正好趁Windows版刚发布,这篇把Codex App的安装、配置、核心功能过一遍。

Codex产品生态

很多人可能会混淆,OpenAI现在有好几个叫Codex的东西,这里先理一下。

Codex其实是OpenAI的AI编程产品线的统称,目前有四种使用方式:Codex App(就是咱们今天聊的这个桌面应用),Codex CLI(命令行工具,对标Claude Code),Codex IDE Extension(VS Code插件),还有Codex Web(chatgpt.com/codex上的云端版本)。

Codex App:

Codex CLI:

Codex VSCode插件:

Codex Web:

四种方式共享同一个账号、同一套配置和会话历史。简单来说就是同一个Agent,四个入口。你在CLI里的对话,打开App也能接着聊。

Codex App的定位,官方原话叫”Agent的指挥中心”。它和CLI最大的区别在于,CLI一次只能跑一个Agent,App可以同时开多个Agent线程并行跑任务,还能看diff、做代码审查、管理Skills和Automations。如果说CLI是单兵作战,App就是AI编程指挥部。

Codex主力模型目前是GPT-5.4和GPT-5.3-Codex,从能力上看,这两个模型都算是前沿的顶级Coding模型。

Windows安装与登录

安装也比较直接。

最简单的是去Microsoft Store搜索Codex,直接下载。系统要求是Windows 10 version 19041.0或更高,基本上2020年以后更新过的Win10和Win11都没问题。

安装完打开App,用你的ChatGPT账号登录即可,或者按照OpenAI API Key,也可以直接用Key登录。

这里有个建议:装Codex App之前,最好先确认你的机器上有Git、Node.js和Python。Git是代码审查和回滚要用的,Node.js和Python是Agent执行任务时会依赖的。如果你做.NET开发,把.NET SDK也装上。虽然这些不是硬性要求,但装了之后Agent能做的事会多很多。

第一次使用:创建项目和发起任务

打开App后,第一步是选一个项目文件夹。点左上角的”Add new project”或者按Ctrl+O,选择你本地的代码目录就行。

选好项目后,注意界面上有个Local和Cloud的切换。选Local就是Agent在你本机上跑,用你本地的开发环境和工具链。选Cloud就是在OpenAI的云端沙箱里跑。对于Windows用户,个人建议先用Local模式,这样Agent可以直接调用你机器上的PowerShell、Git、Node.js这些工具。

然后就可以在输入框里给Agent发任务了。比如”帮我把这个项目里的所有console.log清理掉”,或者”给这个函数写一组单元测试”。Agent会开始工作,你可以实时看到它在执行什么命令、编辑哪些文件。

核心功能一:多Agent并行与Worktrees

这是Codex App和CLI最大的差异,也是我觉得App最值钱的功能。

你可以在同一个项目下开多个Thread(线程),每个Thread跑一个独立的Agent任务。比如一个Thread让Agent写前端组件,另一个Thread让它写后端API,再开一个Thread让它写测试用例。三个Agent同时干活,互不干扰。

这背后靠的是Worktrees(工作树)机制。如果你的项目是Git仓库,Codex会自动给每个Thread创建一个独立的工作树。简单来说就是把你的代码复制了一份出来,每个Agent在自己的副本上改,改完了你再决定要不要合并。

默认的工作树是Codex自动管理的,轻量级,用完就丢。如果你需要一个长期存在的隔离环境,可以在侧边栏项目的三点菜单里创建”永久工作树”,多个Thread可以共享同一个永久工作树。

每个Thread完成后,App内置了一个Diff审查面板。你可以看Agent改了哪些文件、改了哪些行,支持行内评论,也可以直接stage或者revert某些代码块,最后在App里直接commit。整个流程不需要切换到别的工具。

核心功能二:Skills技能系统

Skills成为Agent行业标准后,Codex App必然也会重点支持。

简单来说,Skill就是一组打包好的指令、资源和脚本,告诉Agent怎么完成某类特定任务。有了Skill,Agent不光能写代码,还能做设计稿还原、项目管理、云端部署这些事。

Codex App内置了一个技能库,OpenAI自己在内部用的一些Skill也开源了。几个比较实用的:Figma设计稿实现(抓取Figma的设计上下文,直接转成UI代码),Linear项目管理(在Linear里做Issue分类、版本跟踪),图片生成(用GPT Image生成网页素材、游戏资产),还有Cloudflare、Vercel、Netlify的一键部署。

开源技能仓库地址:

https://github.com/openai/skills

你也可以自己写Skill。在App的Skills管理界面里创建就行,创建好之后CLI和IDE Extension也能用,还可以check in到仓库让整个团队共享。

核心功能三:Automations自动化

Automations可以让Codex在后台按计划自动跑任务,不需要你手动触发。

在App的Automations标签页里,你可以设定一个任务的提示词、指定要用的Skill、选择执行频率(比如每天一次、每小时一次)。Agent会按计划自动执行,执行完结果进入审查队列,你有空了再去看。

OpenAI内部用Automations做的事包括:每天自动分类GitHub Issue、汇总CI失败原因、生成每日发布简报、定期扫描潜在Bug。这些事情单次做不复杂,但每天重复做就很耗时间,交给Automations确实省心。

目前Automations只支持本地触发,也就是说你的电脑得一直开着才行。根据官方文档,云端触发的支持已经在计划中了。

Windows专属:沙箱机制与双模式

Windows版最值得聊的技术细节,是OpenAI专门为Windows做的原生沙箱。

这套沙箱完全基于Windows原生的安全机制搭建,不依赖WSL或者虚拟机。具体来说用了Restricted Token(受限令牌)限制Agent权限,Filesystem ACLs(文件系统访问控制)限制Agent能写哪些文件,Dedicated Sandbox User(专用沙箱用户)让Agent以一个低权限用户身份运行,再加上Windows防火墙规则限制网络访问。

在App的Settings里,Sandbox settings可以选Agent的权限等级。比如Read only模式下Agent只能读文件不能改,适合你先让Agent看看代码给建议的场景。Approval policy则控制Agent什么时候需要问你要授权,On request模式下Agent遇到需要提权的操作(比如网络访问)会弹窗确认。

另外Settings里有个挺贴心的功能:Import external agent config。如果你之前用Claude Code,它能自动检测并导入你的Claude Skills和CLAUDE.md配置到Codex对应的目录里,省去了手动迁移的麻烦。

根据官方文档,Codex App在Windows上也支持WSL模式。如果你的机器上装了WSL,Settings里会多出Agent environment的切换选项,可以把Agent从Windows原生(PowerShell)切到WSL(Linux环境)。切换后需要重启App。没装WSL的话这个选项不会出现,直接用Windows原生模式就行。

这里有个坑:Windows原生模式和WSL模式的配置目录是分开的,Windows下在 %USERPROFILE%.codex,WSL下在 ~/.codex。如果你两边都用,需要手动同步配置,或者设一个环境变量 CODEX_HOME 统一指向同一个目录。另外目前WSL模式有个已知Bug,切到WSL后点”Open config.toml”可能还是打开Windows路径下的配置文件,这个问题还需要等官方修复。

定价与竞品简要对比

Codex App包含在ChatGPT的付费订阅里,不用额外付费。ChatGPT Plus每月20美元,Pro每月200美元,Business每月30美元/人。

目前有个限时活动,Free和Go用户也能用Codex。Plus和Pro用户还分别有5美元和50美元的免费API额度可以领。达到用量上限后可以购买额外的Credits继续用。

聊完定价说说竞品。目前桌面端/CLI端的国外AI编程工具主要就三家:Codex、Claude Code、Gemini CLI。

Claude Code目前旗舰模型是Opus 4.6,这也是我目前的主力模型,一次通过率在三家里是最高的。它的Agent Teams功能也支持多Agent并行。但Claude Code的价格偏高,需要单独的Anthropic订阅。

Gemini CLI跑Gemini 3 Pro,最大的优势是有免费层(每天1000次请求),而且有1M token的上下文窗口。但实际Gemini CLI的主要问题还是不好用,所以我之前说Google最好能趁早把CLI和Antigravity这两个产品做成硬收费项目。

Codex的优势在于和ChatGPT生态的深度绑定,Skills和Automations目前是独有的,GitHub Actions也有原生集成。如果你已经是ChatGPT付费用户,Codex基本是零成本上手。

我初步用下来,Codex App给我印象最深的是多Agent并行的流畅度。以前用Claude Code跑并行开发,一般都是用git worktree方案,现在用Codex App可以直接开三四个Thread各跑各的,对于有多个模块需要同时推进的项目来说,效率提升巨大。Skills系统也很有想象空间。目前内置的Skill已经覆盖了前端开发、项目管理、部署、文档处理这几个高频场景,社区也在陆续贡献新的Skill。

如果你是ChatGPT Plus或者Pro用户,个人建议去Microsoft Store下下来试试。如果你是免费用户,趁现在限时开放也可以先体验一下。

Codex App下载地址(Microsoft Store):

https://apps.microsoft.com/detail/9plm9xgg6vks

Codex官方文档:

https://developers.openai.com/codex/app/

感谢您阅读我的文章。我是鲁工,九年AI算法老兵,AI全栈开发者,深耕AI编程赛道。感兴趣的朋友也可以加我微信(louwill26_)交个朋友。

>/ 作者:鲁工
本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » Codex App新手快速入门教程

猜你喜欢

  • 暂无文章