乐于分享
好东西不私藏

当AI学会了看屏幕,我们还需要学软件吗?

当AI学会了看屏幕,我们还需要学软件吗?

今天我们学习怎么使用工具。未来或许更重要的是,教会 AI 使用工具。

6 月 19 日,OpenAI Codex 发布了一个叫 Record & Replay 的功能。简单说:你在电脑上操作一遍,AI 在旁边看着学,然后把整套流程打包成一个 skill。下次要干同样的活,告诉它这次哪里不一样,剩下的它自己来。

报销、发视频、拉报表、建 issue——那些你月月重复、步骤固定、藏着一堆只有你自己知道的隐性规则的活,它都能接过去。

听起来只是又一个自动化小工具?往下看。


  先问一个问题:你上一次认真学一个软件是什么时候?

不是那种「打开就用」的。是那种需要看教程、记快捷键、摸索坑在哪里的。

可能是 Excel 的数据透视表。可能是 Premiere 的时间轴剪辑。可能是公司内部的报销系统——那个让你每年至少骂三次的破烂玩意。

  现在再问第二个问题:如果让你教一个 AI 学徒做这些事,你愿意吗?

你演示一遍,它学会了。以后每次报销、每次发视频、每次拉报表,丢给它就行。

Record & Replay 做的就是这个。但它真正值得讨论的,不是功能本身。

📌 新闻背景:6 月 19 日,OpenAI Codex 发布 Record & Replay 功能。你在电脑上操作一遍,AI 在旁边学,然后把整套流程打包成可复用的 skill。

API 的时代,正在松动

过去,AI 想帮你做事,只有一条路:走 API。

软件给你什么接口,AI 就能做什么。不给接口?对不起,此路不通。

这其实是个巨大的权力结构。

软件厂商控制着「什么可以被自动化」。 他们不开 API 的地方,就是人类必须手动操作的地方。你每天手动填的那些表、点的那些按钮——不是技术做不到自动化,是厂商没给你留门。  

Record & Replay 不跟你玩这套。

它不找你要 API。它看着你操作,学着你的样子,自己上手。

鼠标点哪儿,它就记哪儿。你填什么字段,下次它帮你填。你在某个岔路口做了选择,它记住你的偏好,以后自己选。

自动化不再需要经过软件厂商的「批准」。

说句不客气的话:这可能是 AI 历史上最被低估的一次权力转移。

以前是软件定义你能干什么。以后是 AI 定义软件能干什么。


一个让人不舒服的问题:还需要学软件吗?

这个问题很刺耳。但值得认真想。

Record & Replay 瞄准的场景是:报销、订停车位、建 issue、发视频、拉报表。

这些活有几个共同点:

1. 步骤固定,但繁琐

2. 藏着一堆只有你自己知道的隐性规则

3. 用文字说不清楚,但做一遍你就懂了

 说白了,就是那些「学会了也没成就感,但不会就是卡住」的技能。

在过去,你必须学会。因为没人替你干。

但现在,你只需要演示一遍。AI 学会之后,这东西就不再是你的技能了——是它的。

推演下去,一个可能的未来是:

• 初级 Excel 技能,AI 会了

• 报销流程,AI 会了

• 发布视频到 YouTube,AI 会了

• CRM 数据录入,AI 会了

• 内部系统的各种填表操作,AI 全会了

 那么问题来了:当一个职场新人的 AI 能替他做大部分「入门级操作」,他该学什么?

学教 AI。


「漂亮」正在贬值

AI 看软件的方式和我们完全不同。

人类觉得好用的软件,要界面漂亮、交互流畅、引导清晰、动效优雅。

AI 觉得好用的软件?能完成任务、能稳定调用、流程可靠。 其他一切,都是噪音。

圆角 4px 还是 8px?AI 不在乎。

配色方案是否高级?AI 没感觉。

导航是汉堡菜单还是底部标签栏?AI 只要能点到就行。

这意味着什么?

过去二十年,无数设计师和产品经理把心血倾注在「让软件更好用」上。这些努力创造了巨大的用户价值,毋庸置疑。

但如果软件的主要用户正在从「人」变成「AI」——

这些努力的相当一部分,可能正在加速贬值。

圆角和配色,AI 无感。动效和动画,AI 看不见。导航和布局,AI 只要点到就行。

AI 需要的不是好看的界面,是清晰的语义结构

不是流畅的动画,是确定的状态标识

不是人性化的交互,是可预测的操作路径

产品设计的范式,可能需要重写。


你教会AI的技能,属于谁?

  刚才说的是「软件界面」。现在说一个更尖锐的话题——你的经验本身。

你花时间教会了 Codex 怎么做报销。这个 skill 存在你的电脑上,你可以用,没毛病。

但如果公司要求所有员工共享他们的 skill 呢?

如果老板说「把你录的那套流程导出给新人用」呢?

如果 AI 学会了一个部门所有人的操作习惯,然后优化掉几个岗位呢?

这不是危言耸听。

Record & Replay 的设计哲学非常清晰:

把人类的工作经验,转化为 AI 的可复用技能。

你的经验 → 它的 skill。

你的隐性知识 → 它的执行逻辑。

你花了三年摸索出来的最佳实践 → 它看一遍就会了。

然后呢?

我并不是在鼓吹技术威胁论。但任何一个能让「工作经验可复制化」的技术,都必然改变劳动力市场的权力结构。

以前,你的经验是你最深的护城河。

以后,你能不能把经验教会给 AI,才是新的护城河。

这两者之间,隔着一条巨大的鸿沟。


别急着恐慌,也别急着狂欢

说点冷静的。

Record & Replay 目前只能跑在 macOS 上。欧盟、英国、瑞士全覆盖不到。还得先开 Computer Use。

这些限制说明它还处于「先驱者版本」——方向对了,但落地范围有限。

但这个方向本身,值得所有人关注。

因为它的底层逻辑极其清晰:

1. 图形界面是为人类设计的

2. AI 学会了解读图形界面

3. 因此 AI 能够操作任何有图形界面的软件

4. 因此人类不再需要亲自操作软件

这个逻辑链条一旦成立,就没有回头路。

操作系统会变。软件设计会变。人机交互会变。职场技能的定义会变。

四个变化,每一个单独拿出来,都够写一本书。


最后

别把 Record & Replay 当成又一个「自动化小工具」。

它是个信号。

  信号说:未来能区分人的,不是你多会操作软件,而是你多会训练 AI。

那些还在花大量时间学「软件操作技巧」的人,可能需要重新审视自己的时间分配。

那些已经开始思考「怎么让 AI 成为我的杠杆」的人,正在提前进入下一个时代。

你今天重复做的那些操作,哪些值得教会一个永不疲倦的学徒?

想清楚这个问题,比学会任何一个新软件都重要。


本文观点基于 OpenAI Codex Record & Replay 功能发布,欢迎理性讨论。

📅 下一篇预告

:这篇聊的是「对你个人意味着什么」。下一篇我们把镜头拉远——当 AI 不需要 API 就能操作任何软件,软件行业的权力结构会发生什么变化? 隔天见。