乐于分享
好东西不私藏

CodexAPP:你的AI终于从“实习生”变成了“项目经理”

CodexAPP:你的AI终于从“实习生”变成了“项目经理”


如果你用过任何AI编程工具,大概率经历过这样的场景:

你写下一段需求,它咔咔咔生成几百行代码。你复制、粘贴、跑一下——报错。你复制错误信息回去,它说“抱歉,我修正一下”。又咔咔咔几百行。你复制、粘贴——还是不对。

三个来回之后,你已经不想说话了。

这不是你的问题,也不是模型不够聪明。

问题在于:我们一直在用“对话”的方式,去干“项目”的活。

而今天上线的macOS版Codex,把这件事彻底翻了过来。

image
image

一、从“串行苦力”到“并行指挥”

过去我们用AI,是一条单行道。

你提需求 → 它生成 → 你验证 → 你反馈 → 它修改 → 你等待……

每一步都在等人。 你去倒杯水,它闲着。你回条消息,它等着。你开个会回来,它还在等你发下一条指令。

这不是协作,这是你牵着它走

Codex的第一个核心变化:多个智能体可以同时干活,互不干扰。

你今天上午可以同时做三件事:

  • 智能体A:在后台清洗上季度的销售数据
  • 智能体B:根据会议录音整理周报大纲
  • 智能体C:试着用Three.js搭一个小游戏原型

它们各自有自己的线程、自己的工作区、自己的上下文。你可以在三个任务之间随意切换,不会丢失进度,也不会串台。

原来需要串行等待几小时的工作,现在并行十几分钟收工。

你不是在“用”一个AI,你是在指挥一支团队


二、从“一次对话”到“三天项目”

这引出了第二个,也可能是更本质的变化:Codex不再是一次性对话工具,而是能持续工作数小时、数天、数周的项目执行者。

这听起来很简单,但背后差别巨大。

一次对话,意味着每次刷新页面都是新开始。你不敢让它跑太久,因为你不知道中间会不会断,不知道它遇到报错会不会自己处理,不知道它干到一半卡住了该找谁。

你不敢把真正的活儿交给它。

而Codex现在做到了——智能体可以在大型项目中持续工作,遇到问题自己判断,需要决策时找你确认,其余时间自己推进。

官方有一个很极端的例子:

有人给了Codex一条提示:“帮我做一款3D体素风卡丁车竞速游戏,8张地图、8个角色、8种道具、带漂移蓄力。”

使用 imagen 和 develop-web-game 技能创建:使用 Three.js 将 Voxel Velocity 实现为一款 3D 体素风卡丁车竞速游戏,且仅包含一个模式:单场比赛(始终为 3 圈、1 名玩家对战 7 名 CPU,8 条赛道全部立即解锁,无进度系统)。构建最简赛前流程,仅包含:赛道(8 条)、角色(8 个)、难度(轻松/标准/困难)、可选镜像模式、可选允许角色重复,以及开始比赛 (Start Race)。同时提供一个选项菜单和比赛中的暂停菜单(继续/重新开始/退出)。创建一个街机驾驶模型,具备灵敏的操控、对擦碰墙面的宽容判定、以有意义的漂移作为主要技能,并提供一个漂移蓄力系统,可生成精确的加速等级(一级 0.7 秒、二级 1.1 秒、三级 1.5 秒)。基础速度需保持“快速但易读”,并在宽阔道路上维持稳定的车群超车节奏。精确实现 8 种道具,单格道具栏,带轻微的名次加权分配,效果温和(最大失控 ≤1.2 秒、最大转向禁用 ≤0.6 秒),营造轻松混乱但无硬性眩晕。同时加入越野减速,并在加速状态下将越野减速幅度降低 50%。定义 8 名角色的既定属性与 AI 行为倾向,实现 CPU 难度预设、赛道作者定义的竞速/变化样条、漂移区与危险规避逻辑,使 AI 能利用多车道宽度进行干净的超车。并提供 HUD/音频基础功能:名次、圈数/最终圈提示、迷你地图、道具槽、计时/分段、清晰可读的音效 (SFX),以及每条赛道一段循环音乐。

接下来的故事是这样的:

  • Codex调用了图像生成技能,自己画了角色和道具贴图
  • 它调用了网页游戏开发技能,从零搭出Three.js的3D场景
  • 自己玩自己写的游戏,发现漂移手感太硬,主动调整了碰撞判定参数
  • 它觉得地图太少,又加了两条隐藏捷径
  • 它测试了道具平衡性,发现某个道具太强,自己削了一刀

整个过程,它消耗了700万个Token,相当于连续工作了好几个小时

开发者没有守在旁边。他只是偶尔回来看看,玩一把,说一句“这次漂移蓄力感觉对了”,然后继续做自己的事。

这才是我们真正想要的AI牛马——不是等你喂指令的实习生,是接了任务就能自己跑的项目经理。


三、从“写代码”到“用代码做事”

但以上所有这些,都建立在同一个基础上:Codex正在从一个编写代码的智能体,进化为能够在你的电脑上利用代码完成任务的智能体。

这句话是这次更新的灵魂。

它意味着:Codex的价值不再是“生成代码”,而是“执行动作”。

怎么做到的?技能(Skill)。

你可以把技能理解为一个给AI准备的、可复用的操作说明书

过去你想让AI做一件复杂的事,需要在对话里事无巨细地教它:

先打开这个网站,找到那个按钮,等页面加载完,把数据复制出来,贴到Excel里,格式化,生成图表……

它可能听懂,也可能听不懂。即使听懂了,下次换个人来说,又要重新教一遍。

技能把这一切封装起来了。

一个技能包 = 说明文档 + 资源文件 + 执行脚本。

你可以在Codex里明确要求“使用某某技能”,也可以让它根据任务自动匹配合适的技能。

这是几件已经有人在用的真事:


场景一:从设计稿到代码

设计师在Figma里画好了活动页面。以前要等前端开发排期,一两天起步。

现在:Codex调用实现设计技能,直接读取Figma的设计上下文、资源、截图,输出生产可用的UI代码,视觉1:1还原

设计稿→上线的中间环节,消失了。


场景二:从Excel到报告

运营同事每周五都要做一件很烦的事:把本周的数据Excel整理成PPT,加上图表,发给老板。

现在:Codex调用电子表格技能,读取Excel,自动生成带专业图表和排版的PDF报告。设定一次,之后每周五下午自动发送到邮箱

她周五下午不用加班了。


场景三:从想法到线上

一个独立开发者想做一个小产品验证想法。按流程:写代码→买服务器→配域名→部署。

现在:Codex调用部署到云端技能,支持Cloudflare、Netlify、Render、Vercel。一句指令,应用直接上线

从“我想做一个”到“你打开看看”,只要一杯咖啡的时间。


这些还不是全部。

OpenAI内部已经开发了数百个技能,从“用Linear管理工单”到“监控模型训练任务”,从“生成产品文档”到“分析增长实验数据”。

https://github.com/openai/skills

image

而且全部开源。你可以直接拿来用,也可以自己写,还可以整个团队共享一套配置。

这才是Codex真正的护城河:

它不是给你一个更聪明的对话机器人,而是给你一个能听懂指令、能调用工具、能独立跑完整个业务流程的数字员工。


写在最后

很多人问:AI到底什么时候才能真正帮我干活,而不是让我帮它收拾烂摊子?

这个问题背后,其实藏着两个更真实的困惑:

第一,我什么时候才能不用守在旁边等它?

第二,我什么时候才能把整件事交给它,而不是每步都要教?

Codex这次给出的答案,是我目前见过最接近“成了”的一次。

它还不能替你做所有决策。 它还会犯错,还会需要你确认。但它已经不需要你每一步都牵着走了。

你可以把活儿扔给它,然后去干自己的活儿。

这不是效率提升30%还是50%的问题。 这是你终于开始拥有第二双手的问题。


Codex桌面应用现已上线macOS。

你的电脑里,很快就会住进一支AI团队。

而你,是那个只需要定目标、看结果的人。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » CodexAPP:你的AI终于从“实习生”变成了“项目经理”

评论 抢沙发

3 + 6 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮