大家好,我是苍一,一个干了13年的后端开发,正在探索AI编程,从产品到开发的全生命周期最佳实践,如果您感兴趣,欢迎关注👇,看我如何自我革命。
Codex App 的定位
Codex App 不是聊天机器人。它是一个运行在你电脑上的 AI 工作台,能做的事情远超问答。
具体来说,它可以读取本地文件、搜索网页、操作内置浏览器、生成图片和文档、连接 Gmail 和 GitHub 等外部工具,还能设置定时任务让它自己跑。和 ChatGPT 那种"你问一句它答一句"的模式不同,Codex 更像一个能动手干活的助手。你不只是告诉它"怎么做",很多时候它能直接帮你"做完"。
但也正因为能力多,界面上的入口也多,第一次打开容易找不到北。下面按实际使用顺序把每个区域讲清楚。
三种形态的区别
在深入界面之前,先把三个容易混淆的概念理清。
ChatGPT 普通对话就是网页端或 App 里的助手,适合问问题、写文案、生成图片。Codex App 本地版装在你电脑上,ChatGPT 能做的它都能做,额外还能直接读取和修改本地文件。云端 Codex 跑在 OpenAI 的服务器上,电脑关了也能继续执行任务,适合长时间运行的工作。
判断标准很简单:一般问答用普通对话,涉及本地文件用 Codex App 的项目功能,需要持续跑任务就用云端 Codex。
下载和登录
Mac 用户从 OpenAI 官网下载:https://openai.com/codex/
安装流程和普通 Mac 应用一样,下载安装包,把 Codex 拖进应用程序文件夹,然后用 OpenAI 账号登录。免费账号有一定额度,付费账号额度更多。
界面整体布局
打开之后记住三个区域就够了:左侧是导航栏,用来找入口和切换功能;中间是对话区,你在这里和 Codex 交流;右侧是结果区,用来展示生成的文件、网页预览、代码变更等。
这三个区域的划分是 Codex 和普通聊天工具的核心差异。它不只有"对话",还有"产出现场"。
左侧导航栏详解
1️⃣ 新对话与搜索
新对话开启一个干净的聊天上下文,避免和之前的对话混在一起。搜索功能用来找回历史对话、项目任务或者忘记名字的上下文。
2️⃣ 插件页
插件是给 Codex 增加能力的模块。目前内置的包括 Browser Use(操作浏览器)、Computer Use(操作 Mac 应用)、Spreadsheets(表格处理)、Presentations(演示文稿)、GitHub(代码协作)、Gmail、Google Drive、Slack 等。
几个相关名词可以这样理解:插件是能力扩展包,连接器是用来绑定外部账号的通道,技能(Skill)是一套预设的工作流程,MCP 是让外部工具接入 Codex 的标准协议。不需要死记这些定义,知道它们都是给 Codex "加能力"的就行。
什么时候需要装插件?想让 Codex 读邮件、操作浏览器、做 PPT、和 GitHub 协作的时候。刚开始建议只用官方内置的,熟练了再按需添加。
3️⃣ 自动化
自动化功能让 Codex 在指定时间或按固定频率执行预设任务。比如每天早上整理项目状态、每周检查仓库问题、定期生成日报。设定好之后不用人工盯着。
4️⃣ 项目
项目是 Codex 绑定某个文件夹或代码仓库来工作的模式。在项目里 Codex 能读文件、改文件、跑命令,适合处理需要操作本地资源的任务。
右侧结果区
右侧可能出现的内容包括:生成的文件、搜索来源、网页预览、图片预览、PDF 和文档预览、内置浏览器窗口、代码差异对比、Git 变更记录。
中间告诉你 Codex 做了什么,右边让你看到它产出了什么。
设置页逐项说明
5️⃣ 常规设置
常规页面管基础使用习惯。其中四个地方值得关注。
工作模式:非程序员建议选"日常工作"模式,Codex 的表达会少用工程术语。权限设置:权限越大 Codex 能做的事越多,但风险也越高。不熟悉的时候别一上来全开,用久了再逐步放开。发送方式:可以设置长文本需要 Command+Enter 才发送,避免误触。语音输入:打开后能在系统任意位置调用 Codex 的语音输入。
6️⃣ 外观设置
管界面主题、字体、字号、颜色、代码展示样式。不影响功能,只影响视觉舒适度。有一个有趣的功能:可以选择一只桌宠,在对话框输入 /宠物 唤出。
7️⃣ 配置、个性化、MCP 服务器
配置页保持默认即可。个性化页面值得花时间填写,它决定 Codex 怎么理解你。可以写清楚:偏好中文回答、不要用术语、教程要写成功标志、改代码前先解释影响、涉及隐私文件要提醒。
不要把 API Key、密码、身份证号、公司机密写进去,也不要写互相矛盾的规则。
MCP 服务器页面一般情况下不需要改动,内置插件已经覆盖大部分需求。
8️⃣ Git 设置
Git 是代码的版本记录系统。它能追踪哪些文件被修改了、哪些是新增的、哪些被删除了,也能回退到之前的版本。非程序员保持默认设置就行。
9️⃣ 环境和工作树
保持默认。
🔟 浏览器使用
Codex 能操作内置浏览器来打开网页、搜索资料、登录网站、查看本地页面、测试前端。不需要跳转到外部浏览器,在 App 内部就能完成。
1️⃣1️⃣ 电脑操控
这是 Codex App 最强的功能之一。它能在 Mac 上打开应用、点击按钮、查看界面、处理可视化任务。实际测试中,让它从零写一份法律检索报告,搜索、导航、点击、整理全部自动完成,人工只需要做登录操作。
但这个功能需要格外谨慎,因为它可能接触到微信、邮箱、浏览器、文件管理器、公司工具和私人资料。第一次使用时只让它操作无风险的 App,绝对不要让它碰社交媒体账号。
1️⃣2️⃣ 已归档对话
被收起来的历史对话,不是删除。类似于没有时间限制的回收站,随时可以找回。适合归档已完成的项目和暂时不用的对话。
实际操作建议
13️⃣ 从普通对话开始
刚上手不要直接进项目。先开一个普通对话,问一个简单问题试试手感。比如让它解释 Codex App 和 ChatGPT 的区别。复杂任务建议打开"计划模式",先梳理思路再动手。
14️⃣ 权限确认不要无脑点
Codex 请求权限时,会说明要做什么。文件访问要看清路径,终端命令不懂就让 Codex 解释,浏览器操作要避免付款和删除类动作,第三方账号要看清授权范围,电脑操控要划定边界。
看不懂就问 Codex 自己:"这个权限具体让你做什么?有什么风险?"它自己能解释。
15️⃣ 常见问题处理
任务一直在跑:看左侧对话状态,转圈说明没结束,蓝色圆点说明已完成。
看不懂改动:让它逐文件解释 Git diff,用非程序员能懂的话说。
结果不满意:不要重开,直接在当前基础上继续修改。
插件选择困难:先不装,用内置能力。明确知道需要连接某个工具时再去找。
自动化跑偏:把任务描述写具体,包括执行时间、操作对象、输出格式、禁止事项、异常处理方式。
推荐的上手路线
第一步,打开 App 熟悉左侧导航。第二步,新建普通对话问一个低风险问题。第三步,浏览设置页只看不改。第四步,建一个演示项目(不要用私人项目),让 Codex 读取后生成一个简单 Markdown。第五步,看右侧结果区,让它解释做了什么。第六步,尝试插件页和自动化。第七步,最后再碰 Git、MCP、电脑操控这些高级功能。
关于账号
免费账号额度有限,正经用的话付费账号体验好很多。Plus 适合入门,Pro 适合重度使用。
总结
Codex App 的功能覆盖聊天、文件、项目、网页、浏览器、自动化、Git、第三方账号和本地电脑操控。第一次打开觉得复杂很正常,但它的界面逻辑是清晰的:左边找入口,中间对话,右边看结果。
从低风险任务开始,逐步解锁高级功能,给它装插件、加技能,最终能培养成一个顺手的超级助手。版本更新后按钮位置可能略有变化,但核心逻辑不变。
如果嫌文章太长、怕后面走丢,可以关注下面的ima知识号,让这篇文章成为你的知识顾问,随时随地等候你的提问。
知识号中内容会以笔记形式分享,可以根据大家反馈和实测情况,实时更新,保证最新方案的稳定、可用。
【ima 知识库】

夜雨聆风