你可以把Codex理解成一个AI工作操作台:它负责接收任务、调用技能、读写文件、检查结果,再把复杂流程变成可重复执行的步骤。这件事是工具使用方式的变化,不是单纯换一个模型入口。
这篇把几个最实用的功能介绍全,并直接给出使用方式。适合已经有OpenClaw、Hermes、Claude Code 使用经验的人,也适合还没有搭好AI工作流的新手。
1.图形化界面:先让普通用户能跑起来
很多AI编程工具最大的问题,不是模型不够强,而是启动成本太高。新手经常卡在配置环境、处理依赖、命令行参数、网络网关、目录权限这些问题上。工具还没用起来,耐心已经消耗掉一半。
Codex App的第一层价值,就是把入口降下来。打开App,就能在图形化界面里看到会话、文件、项目、浏览器和任务结果。用户不需要先熟悉一整套命令行,也能让Codex读取项目、修改文件、生成文档、打开HTML预览。
直接可用的方式是:把一个项目目录拖进来或打开对应工作区,先让Codex阅读AGENTS.md、README或项目说明,再下达明确任务。比如“读取这个项目,找出公众号写作技能和HTML渲染脚本,然后把这篇草稿生成可发布的Markdown和HTML”。
这个功能对小白很关键。图形化界面解决的是第一步能不能开始,后面的技能、自动化、多Agent调度才有机会发挥作用。

2.技能:想要什么能力,就先装什么能力
Codex的技能和插件市场,是它从“聊天工具”变成“工作平台”的核心。过去要用一个技能,往往要去外部网站找说明、复制文件、放到指定目录,再手动调试。现在很多能力可以直接在App里搜索和安装。
使用时可以按任务类型安装,而不是看到什么都装。内容创作者优先安装公众号写作排版、封面生成、小红书内容、短视频脚本;办公用户优先安装PPT、Excel、Word;科研用户优先安装nature-skills;需要情绪陪伴和桌面展示的用户,可以安装Hatch Pet。
技能使用有一个原则:不要把技能当素材库,要把技能当稳定流程。一个技能最好只负责一类任务,并且固定输入、固定输出、固定验证方式。
公众号写作技能:输入主题或草稿,输出Markdown和HTML。
模板提取技能:输入公众号链接或截图,输出排版风格画像和模板。
发布技能:输入已完成的文章和封面,输出公众号草稿箱结果。
PPT技能:输入文章、资料或提纲,输出PPTX,并渲染检查页面。
这样做的好处是,每个技能边界清楚,出问题可以快速定位。新手不要一上来追求全自动,先让技能稳定产出文件,再逐步接入自动化。所以,技能市场的正确用法不是“装满”,而是“装准、跑通、沉淀”。

3.工作模式和代码模式:把任务放进正确入口
Codex现在不只适合写代码。它的工作模式和代码模式,适合处理两类完全不同的任务。
代码模式适合仓库级任务:读代码、查bug、改组件、跑测试、做重构、看git状态。比如前端页面样式错乱、接口类型报错、项目测试失败,这些都应该交给代码模式。
工作模式适合文件级任务:PPT、Excel、Word、PDF、图片素材和报告生成。比如把一篇文章做成演示PPT、把一组数据整理成Excel报表、把会议记录改成正式纪要,这些更适合工作模式。
做PPT时,指令要直接给目标、受众、页数、风格、素材和验收方式。示例:
“根据这篇文章做12页中文分享PPT,受众是AI产品同学。每页只保留一个核心观点,优先用图表和生成图片,不要堆长段文字。完成后生成PPTX,并渲染检查封面、目录和至少3页正文。”
这里有一个实用技巧:做PPT时,可以明确要求Codex调用生图能力。不要只让它排文字,否则页面容易变成普通大纲。让它为封面、章节页或核心概念生成视觉图,PPT会更像正式作品,而不是聊天记录搬运。
做Excel时,要说明输出是清洗数据、透视表、图表、公式,还是可直接发给团队的报表。做Word时,要说明保留标题层级、批注、修订建议还是正式版文档。模式不是装饰,而是任务边界。任务放对入口,结果会稳定很多。

4.Hatch Pet:桌宠提供情绪价值
Hatch Pet是Codex技能市场里很有辨识度的能力。它可以把宠物图片、角色图或参考图做成Codex兼容的桌宠资源。使用方式很简单:在技能市场搜索Hatch Pet并安装,在对话里用对应技能入口或@Hatch Pet触发,然后提供图片或角色描述。
如果有自己的宠物照片,可以让Codex基于照片生成桌宠。更讲究一点,可以要求它输出完整的透明背景spritesheet、预览图和配置文件,这样桌宠不只是“像”,还可以正常动起来。
这个功能看起来偏情绪价值,但实际很适合长期工作。写代码、整理资料、改文章、跑自动化的时候,一个会动的小桌宠会让工作台更有陪伴感。对高频使用AI工具的人来说,这种轻量情绪反馈并不多余。
使用时注意两点:第一,尽量给清晰正面图或明确角色特征;第二,如果要做成长期桌宠,要求生成可验证的预览,而不是只给一张图。这样后续替换、打包、发布都更顺。

5.自动化技能:把重复工作交给后台
Codex的自动化适合处理重复性任务。比如每天固定检查信息源、每周固定生成报告、定期扫描项目状态、按时间提醒更新资料。
可以新建自动化技能,也可以在项目里直接添加自动化。关键是任务要写具体,不要只写“每天看看”。更好的写法是:
“每天上午9点检查指定订阅源,整理5条值得关注的AI新闻,输出标题、来源、摘要、为什么值得看,并保存到D:/notebook/每日信息站/YYYY-MM-DD.md。”
公众号场景可以这样用:每天抓取热点,生成选题候选;如果用户已经给出选题,再调用公众号写作技能输出Markdown和HTML;如果需要发布,只进入草稿箱,不自动群发。
项目场景可以这样用:每天检查仓库未提交文件、失败测试、待办列表,生成一份项目日报。发现风险时只汇总,不自动做破坏性修改。
换句话说,自动化不是为了让AI擅自接管项目,而是让它持续看住那些容易被忘掉的重复事项。
自动化的原则是:低风险、可回滚、可检查。正式发布、线上部署、删除文件、批量重写、付费API调用,都要保留人工确认。自动化最适合替用户看住重复事项,不适合替用户做最终决定。

6.多Agent调度:让Codex做总指挥
如果已经养好了OpenClaw或Hermes,不需要把它们和Codex看成替代关系。更稳的结构是:OpenClaw负责技能、记忆和长期工作流;Codex负责外层调度、文件操作、任务拆解和结果验证。
问题在于,多Agent一旦没有边界,很容易变成互相抢活。所以需要让Codex先读项目说明,再决定谁负责探索、谁负责执行、谁负责验证。
这时Codex可以像一个总指挥。用户只需要说清楚目标,它负责读取项目说明、理解已有Agent、调用技能、分配任务、检查输出。
一个实用指令可以这样写:
“读取当前项目的AGENTS.md,按里面的公众号工作流,把这篇草稿改成平台口吻的教程文章,生成Markdown和HTML。要求介绍完整、禁止第一人称、70%实战、20%原理、10%结论,完成后检查文件存在并打开HTML。”
这种指令比“润色一下”稳定得多。它同时给了任务对象、风格要求、输出格式、比例、禁区和验收方式。
多Agent调度的重点不是同时开很多Agent,而是每个Agent有清楚职责。探索型Agent负责找文件和规则,执行型Agent负责改内容,验证型Agent负责检查结果。最后由Codex汇总,不让多个Agent抢同一个文件。

7.前端批注:直接指出哪里要改
前端修改最难描述的,往往不是功能,而是视觉判断。比如字号偏大、按钮太重、卡片间距太松、层级关系不清晰。这些问题用文字解释很累,截图画圈又容易说不清。
Codex的前端批注适合处理这类任务。用户可以直接在页面上圈出区域,写短句即可:这里字号降低一级;这个按钮弱化;这块不要像卡片;移动端这里会挤压;标题和正文间距拉开。
为了让修改更准,批注后再补一句验收标准。例如:“改完后用桌面和移动端各看一次,确保文字不重叠,按钮不换行,核心内容在首屏能看到。”
这个流程比纯文字描述高效很多。画面位置、文字批注和验收标准同时存在,Codex更容易把它转成CSS、组件结构或布局修改。前端迭代里大量“看起来不对”的问题,就能变成可执行修改。

8.nature-skills:科研人可以直接接入专业流程
Codex不仅适合开发者。对科研用户来说,nature-skills是很值得安装的一组能力。它可以覆盖科研绘图、论文润色、学术汇报PPT、Nature风格表达、数据可用性说明等场景。
科研绘图时,最好不要只说“画得好看一点”。应该给出结论、数据路径、图类型、期刊要求和输出格式。例如:
“用Python基于这个CSV生成一张Nature风格多面板图。A面板展示总体趋势,B面板展示分组差异,C面板展示相关性。输出SVG、PDF和600dpiTIFF,并检查字体、线宽、图例和颜色是否适合投稿。”
论文润色时,也不要只说“润色成Nature风格”。更好的指令是要求它保留科学含义,压缩冗余句,增强结果逻辑,避免夸大结论。学术汇报PPT则要说明听众、时长、核心图、讲述顺序和讲者备注。
这类技能的实用性在于,它不是简单把中文翻成英文,而是把科研表达、图表规范、投稿材料和汇报逻辑都纳入一个流程。科研工作不是不能用AI,而是要用专业技能约束AI。

9.超大项目管理:靠压缩,也靠项目记忆
像OpenClaw这样的项目,很容易遇到一个问题:一个窗口聊久了,上下文会越来越长,模型开始忘前面说过什么。Codex内置上下文压缩,可以缓解这个问题,但不要把所有希望都放在压缩上。
更稳定的方法,是多个会话共用一份项目记忆。项目根目录放AGENTS.md,里面写清楚项目目标、常用路径、技能入口、命令、风格要求、禁止事项和验证方式。再配合项目日志,记录每次会话做了什么、没做什么、下一步是什么。
每次会话结束时,给Codex一个固定收尾指令:
“更新项目日志,记录本次已完成事项、修改文件、验证结果、未解决问题和下一步建议。不要改无关文件。”
下一个会话开始时,再让Codex先读AGENTS.md和项目日志。这样即使上下文换了,项目也不会断。长期项目真正稳定,靠的是文件里的项目记忆,而不是某一个聊天窗口永远不关闭。

下一篇继续拆解Codex的高阶技巧。欢迎加入社群,交流更多Openclaw,Codex技巧。

【加入小龙虾实战交流群,获取更多龙虾信息】
关于 AI 共生学堂(OpenSchool)
AI 共生学堂(OpenSchool)汇聚一群相信 AI 将重塑世界的创造者——拒绝平庸的产品人、追求落地的开发者、以及敢想敢做的创业者。我们不做旁观者,而是共同动手解决真实问题,在 AI 时代孕育伟大的产品。我们的社区交流让同频者深度碰撞,AI 教育将前沿 AI 知识转化为实战能力,孵化为好想法提供辅导与投资,助你从 0 到 1。
夜雨聆风