OpenAI又又发布了新玩意,Record & Replay,现在可以录视频教AI提炼skill了
Record & Replay表面是「教AI重复干活」,背后是OpenAI把图形界面变成AI基础设施——操作系统正在退化成应用的停车场。
不是录屏,是学徒
你坐在电脑前干活,旁边有个家伙盯着你看。你点哪它看哪,填什么它记什么。等你做完,它说一句:下次这活我来。
这就是 Codex 昨天刚发布的 Record & Replay。操作一遍给AI看,它把整套流程打包成 skill,下次新开个对话直接调。
听起来就是个高级录屏工具,对吧?我一开始也这么想。直到我把OpenAI过去半年关于Codex的技术路径翻了一遍。
这不是效率工具。这是OpenAI在给AI装「手」和「眼」——然后让AI用人类的图形界面,反过来驾驭人类的软件。

看懂三张牌
要理解Record & Replay为什么不是玩具,得先看懂 Codex 操作电脑的三条路径。OpenAI工程师Jason之前完整梳理过。
第一张牌:Computer Use。覆盖最广,能看见并操作macOS和Windows的图形界面,窗口、菜单、键盘、剪贴板——它能动任何你授权过的应用。代价是慢,因为它得看界面→判断点哪→等响应→确认状态,一步一回头。
第二张牌:Chrome扩展。接管你已经登录好的Chrome,适合Gmail、Salesforce、内部仪表盘这类靠账号cookie的任务。它能跨标签页理解完整工作流。
第三张牌:应用内浏览器。活在Codex对话内部,跟你共享渲染页面,适合开发调试。最大特点是隔离——不碰你的cookie和登录会话。

Skill不是脚本
很多人以为Record & Replay生成的skill是一段死脚本——你录了什么它就机械重复什么。但Codex的设计思路完全不同。
Skill是一份「可复用上下文」——不是写死的指令序列,而是AI每次都能拿来参考、结合当前环境灵活执行的说明书。同一个skill,这次传A文件、下次传B文件,它都套着用。
更关键的是:执行时它能同时调动 Computer Use、浏览器操作和已安装插件。不是死板回放,是理解目的后灵活执行。
APPSO的演示里,Codex学上传YouTube视频——不只记点击顺序,还搞懂了Private和Unlisted的区别、.mp4和.srt文件的配对逻辑、元数据字段怎么填。它甚至现场处理了一次报错。

API之死
传统软件自动化的命门是什么?API。有API就能对接、能自动化。没API?对不起,人工手动。
Record & Replay 绕过了这层。Codex 不需要API——它直接看界面、点按钮、填表单、记流程。任何你能用鼠标键盘操作的软件,它都能学、都能干。
这听起来像便利功能,但本质上是一个范式转换:软件从「必须有API才能被自动化」变成了「有图形界面就能被AI驾驭」。API从刚需变成了可选项。
想想这意味着什么。报销系统、停车预定、内部报表平台——那些从来没有API的软件,现在打开了一扇全新的大门。

操作系统退化为停车场
图形界面,这个原本为了让人类摆脱命令行而发明的伟大创造,现在正在成为 AI 接管电脑的现成基础设施。
GUI 被发明出来,是为了让人不用敲命令就能操作电脑。现在,OpenAI 倒过来用——让 AI 学会看人用的界面、点人点的按钮、走人走的流程。人和 AI 共用同一套图形界面。
那操作系统是什么?它不再是你和软件之间的中间人。它变成了一个「应用的停车场」——应用停在这里,人和AI都可以来开。操作系统不定义交互方式了,它只是收纳。
这就是为什么 OpenAI 在铺「Computer Use + Record & Replay + Skill 生态」这三层。它不是在做一个更好的自动化工具——它是在重新定义谁在操控软件。

技能市场雏形
再看深一层。Record & Replay 产出的 skill,本质是人类操作软件的经验变成了可交易的数字资产。
一个人录好「报销流程」,全公司都能用。一个团队录好「发视频工作流」,新人上手零成本。OpenAI同时开放了OSS provider——你可以把Codex指向本地模型、Mistral、Azure,传个参数就能跑。
这不是一个人的AI助手。这是一个技能市场的雏形——成千上万个skill互相调用、组合、复用,AI之间共享经验。
最后你看到的不是「你和一个AI对话」,而是一个AI工作流引擎,调度着无数技能包,在操作系统这个停车场里开着各种应用。

拐点已来
回看整个路径:ChatGPT学会说话 → GPT-4学会推理 → Computer Use学会看界面 → Record & Replay学会模仿人类操作 → Skill生态开始积累可复用经验。
每一步都在消解一层壁垒。今天消解的是「软件必须有API」。明天消解的可能是「软件必须有人操作」。
我们正站在一个奇怪的拐点上:操作系统的最后一项使命——让人能操作软件——正在变成一个可选项。而新的命题变成了:你的经验能不能被AI学会、复用、传播。
教AI用电脑不只是省时间。你在教它成为下一个操作系统。
你的技能值多少钱
操作电脑这件事,从来都是人的专属技能。你会某个软件、懂某套流程、知道某个系统里的坑——这叫经验,值钱。
现在,Record & Replay 给这条经验链条安了一个出口。你的操作流程可以被录下来、被AI学会、被别人复用。经验从「你脑子里」变成了「可执行的skill文件」。
所以真正的问题不是「AI会取代我的工作吗」。而是:你的经验值不值得被录下来?以及,录下来之后,值多少钱?

⭐️ 星标巴顿AGI雷达站,秒追AI前沿 ⭐️
点赞 👍 · 在看 👀 · 转发 ↗️,一键三连锁定速推
你会把你的工作流程录下来教给AI吗?评论区聊聊 👇

参考来源
夜雨聆风