乐于分享
好东西不私藏

视频下载/GIF制作/App开发全搞定,GPT-5.3-Codex颠覆了我的认知

视频下载/GIF制作/App开发全搞定,GPT-5.3-Codex颠覆了我的认知

Codex桌面应用界面


引言:当AI开始”自己写自己”

今天凌晨,AI圈又炸了。

OpenAI发布了GPT-5.3-Codex,官方给出了一个极具争议的定义——”史上第一个能够自我构建的模型”。更让人震惊的是,CEO奥特曼在社交媒体上激动宣布:Codex的活跃用户已经超过100万。

但更耐人寻味的是:这款模型居然没有开放API。

给出的理由是——它太强了,存在很大风险。

一个AI模型强到连创造者都不敢轻易放出API接口,这是什么概念?

带着强烈的好奇心,我亲自上手实测了GPT-5.3-Codex。结果发现,这可能是继Claude Code之后,AI编程工具领域的又一匹黑马。

它不仅能帮你下载视频、提取字幕、制作GIF,还能独立开发一个完整的App。更关键的是,它把原本”黑乎乎”的命令行操作,包装成了一个可视化友好的桌面应用。

这可能预示着AI Agent工具的未来形态——从极客专属,走向人人可用。


第一部分:Codex来了,它到底是什么?

1.1 OpenAI的反击

如果说2025年是”AI Agent元年”,那么2026年就是”Agent战争年”。

这段时间,本地AI Agent工具大火特火。从Anthropic的Claude Code,到各种开源方案,开发者们突然发现:原来AI不只是聊天机器人,它真的能帮我干活。

但问题是,这些工具大多基于命令行,对普通用户极不友好。

OpenAI看到了这个机会。今天凌晨发布的GPT-5.3-Codex,配合此前推出的Codex桌面版应用,完美整合了Skill、Cowork、Claude Code等热门工具的所有功能。

简单来说:以前你需要在终端里敲命令、装依赖、配环境,现在这一切都被一个友好的桌面应用取代了。

1.2 为什么叫”高危模型”?

GPT-5.3-Codex模型能力

官方博客中,OpenAI毫不掩饰对GPT-5.3-Codex的自信。他们写道:

“GPT-5.3-Codex是我们第一个能够自我构建的模型。通过使用5.3-Codex,我们能够以如此快的速度发布5.3-Codex。”

这种”自己写自己”的能力,让OpenAI既兴奋又担忧。

兴奋的是,模型的迭代速度将指数级提升。担忧的是,当一个AI能够自主编写、修改、扩展自己的代码时,风险控制变得极其困难。

于是,就出现了这个魔幻的场景——一个拥有100万+活跃用户的模型,API却迟迟不敢开放。

1.3 用户数暴涨的背后

尽管API未开放,Codex的桌面应用已经收获了大量开发者。

奥特曼透露,Codex的活跃用户已经超过100万。这个数字背后,是大量从Claude Code转投而来的开发者。

在国内,一些独立开发者也表示,Codex Plus会员比Claude的Pro计划更划算,而且不会像Claude那样”无情封号”。

用户用脚投票的背后,是实打实的体验差异。


第二部分:我用Codex做了这些事

2.1 视频下载与处理

为了测试Codex的真实能力,我丢了一系列”日常任务”给它。

第一个任务:下载一个X平台的视频。这个视频时长4个多小时,内容是一位技术博主的深度访谈。

在Codex中,我只需要输入自然语言指令:”帮我下载这个视频。”系统会自动检测可用的Skills,然后调用yt-dlp工具开始下载。整个过程在对话框里实时显示进度,我甚至可以看到下载速度的变化。

视频处理功能展示

视频下载完成后,我继续下达指令:”提取视频的逐字稿,做成双语版本。”Codex调用语音识别和翻译Skills,几分钟后,一份完整的中英双语文稿就出现在我面前。

最后,我让它把整个流程打包成一个可复用的Skill。这样下次再遇到类似需求,只需要一键调用,两分钟内就能完成下载+字幕+翻译的全套流程。

2.2 GIF制作与视频剪辑

如果视频里有精彩的片段想要分享,Codex同样能搞定。

我让它把视频的5秒到25秒裁剪出来,保存为新视频。得益于GPT-5.3-Codex的快速Token处理能力,这个过程耗时极短——主要时间花在本地的编解码上,而非模型推理。

更进阶的用法:把视频前5秒转成GIF,文件大小控制在10MB以内,帧数和分辨率自定义。

我甚至尝试了一个更极端的任务:把整个视频转成图片序列,每秒30帧,每一帧就是一张图。

Codex全部顺利完成。

2.3 图片批量处理

实测中还有一个小功能让我印象深刻:图片批量重命名和拼接。

我准备了一个文件夹,里面有几十张杂乱的图片。给Codex下达指令:”根据图片内容对这些文件重命名,文件名不超过20个字符,不允许使用符号。”

Codex逐一分析每张图片的含义,然后调用文件操作工具批量重命名。命名规则合理且可读性强。

完成后,我继续要求:”把这些图片垂直拼接成一张长图。”Codex调用图像处理工具,自动完成拼接。

整个过程行云流水,完全不需要我动手。

2.4 Word/PPT/Excel自动化

和Claude Skills一样,Codex内置了丰富的Skills市场。应用内直接提供了pptx、xls、word、canvas、notion等常用办公软件的Skills。

这意味着,你可以通过自然语言让AI帮你:

  • 制作一份数据报告的PPT
  • 分析Excel表格并生成可视化图表
  • 撰写一篇格式规范的Word文档

无需手动操作,AI直接输出成品。

2.5 App开发:丰富的skills市场

丰富的 skills 市场

和 Claude Skills 一样,Codex 也能安装 Skills 市场上丰富的技能,并且在应用内,就已经提供了包括 pptx、xls、word、canvas、notion 在内的多款技能

我下达指令:”写一个’每日一词’的App,显示每日英语单词,包含发音、例句和记忆技巧。”

这里有一个关键区别:在ChatGPT里用Canvas,它只能给你一个带不走的网页。但在Codex里,它能在本地从零开始搭建完整项目,然后使用Vercel或Cloudflare等Skills直接部署到线上。

我选择了”Extra High”推理模式。在这种模式下,GPT-5.3-Codex在每一步操作前都会询问我的选择权。这让它像一个经验丰富的搭档,而不是一个盲目执行的工具。

最终,App完成了所有我要求的功能。更惊喜的是,当我提出想要macOS、iOS和安卓版本时,Codex也一并生成。

2.6 Bug修复与代码分析

如果你有现成的项目,Codex同样能帮上忙。

我导入了一个之前写的Python项目,里面有几个隐藏较深的Bug。Codex分析整个代码库后,准确指出了问题所在,并提供了修复建议和修改后的代码。

这种”读懂现有代码并修正”的能力,是区分普通编程助手和真正Agent的关键指标。


第三部分:硬核对比——Codex vs Claude Opus 4.6

3.1 基准测试成绩

AI编程助手对比图

在AI编程领域,有几个公认的基准测试值得关注。

Terminal-Bench 2.0 是测试模型在终端环境下处理复杂任务能力的权威指标。在这个测试中:

  • GPT-5.3-Codex得分:77.3%
  • Claude Opus 4.6得分:65.4%

差距超过10个百分点,Codex领先明显。

但有趣的是,在SWE-Bench(评估模型解决真实世界软件问题的能力)上,Opus 4.6的表现甚至不如上一代Opus 4.5。这说明基准测试并不能完全反映实际使用体验。

3.2 上下文窗口

Claude Opus 4.6有一个压倒性的优势:它破天荒地把上下文窗口拉到了100万token

这是什么概念?

普通模型的上下文窗口可能只能处理一个文件的代码,Opus 4.6可以同时分析、理解、修改整个中小型项目的所有代码。

对于需要处理大型代码库的开发者来说,这是巨大的效率提升。

3.3 实际体验差异

我同时体验了两款工具,发现它们有明显的定位差异。

Codex的优势:

  • 可视化友好界面,对新手更友好
  • 视频、图像、文档等多媒体处理能力强
  • 内置Skills市场,扩展能力丰富
  • 本地文件操作直观流畅

Claude Opus 4.6的优势:

  • 超长上下文,适合大型项目
  • Agent能力更成熟,多个AI协同工作
  • 代码质量稳定,结构清晰
  • 已开放API,易于集成工作流

3.4 用户迁移趋势

网上对Codex的评价在这几天出现了明显逆转。

许多开发者从Claude Code转向Codex,原因各异:

  • Codex Plus会员更划算
  • 界面更友好,学习成本低
  • 视频等多媒体处理能力更强

但也有用户坚持使用Claude Opus 4.6,因为:

  • 超长上下文在大型项目中无可替代
  • Agent Teams功能让多个AI协同
  • 代码质量更稳定,可维护性强

没有绝对的赢家,只有最适合你需求的选择。


第四部分:Opus 4.6的那些神级案例

4.1 一天关闭13个Issue

在Claude官方演示和早期用户反馈中,提到了一个令人印象深刻的案例。

有用户让Opus 4.6在一天内自主处理项目中的Issue(待解决的问题)。结果是:Opus 4.6关闭了13个Issue,并将另外12个Issue准确分派给了正确的人类团队成员。

这意味着AI不再只是”写代码的工具”,而开始承担”项目管理”的职责。

4.2 代码库重构

网上有网友分享了一个更夸张的案例。

Opus 4.6在一次调用中,完全重构了整个代码库。原来的代码被称为”屎山”——混乱、冗余、难以维护。Opus 4.6将其全部模块化,结构清晰,逻辑顺畅。

发帖者表示:”没有其他模型能做到这一点。”

4.3 Agent Teams:50人规模的AI团队

Opus 4.6另一个独特功能是Agent Teams。

在Claude Code中,可以组建一个AI团队,包含多个Agent。这些AI可以分工协作:

  • 有的负责写代码
  • 有的负责Review
  • 有的负责测试

有用户测试后表示,启用Agent Teams后,Opus 4.6的速度提升2.5倍,效果也更好。

这预示着AI编程的未来:不是一个人在战斗,而是一支AI军队。

4.4 游戏开发

Opus 4.6在创意项目上也展现了惊人的能力。

有网友用它做了一个宝可梦的克隆版游戏。整个过程耗时1小时30分钟,使用了11万个Token,迭代了3次。

最终成品令发帖者惊叹:”这是我用AI做过的最酷的东西。”

还有网友让两个Opus模型玩同一款经营游戏,比较谁能积累更多的财富和资源。4.6版本在初期制定战略的时间更长,但最终做到了”遥遥领先”。


第五部分:AI Agent工具的未来形态

5.1 从命令行到可视化

回顾AI Agent工具的发展历程,有一个清晰的趋势:

第一阶段:纯命令行界面(CLI),极客专属,学习门槛高。

第二阶段:终端工具+可视化辅助,如Claude Code,但仍以文本交互为主。

第三阶段:桌面应用+图形界面,如Codex,让普通用户也能轻松上手。

OpenAI的Codex代表了第三阶段的成熟形态。它把复杂的技术门槛藏到了友好的界面背后,让用户只需要用自然语言描述需求,就能获得结果。

这不是倒退,而是进步。工具的进化方向,应该是让更多人能够使用,而不是设置更高的壁垒。

5.2 多模态能力的融合

Codex展现的另一个趋势是多模态能力的融合。

它不仅能处理文本和代码,还能:

  • 下载和处理视频
  • 分析和转换图片
  • 生成PPT、Excel、Word文档

未来的AI Agent,不会只是”编程助手”,而是”全能数字助手”。

5.3 API开放的谨慎态度

OpenAI对Codex API的谨慎态度,折射出AI安全的新挑战。

当一个模型能够自主编写、修改、扩展自己的代码时,”对齐”(Alignment)问题变得更加复杂。模型可能会做出开发者意料之外的行为,而这些行为的风险在API层面会被放大。

这可能是AI行业的共识:能力越强大,开放越谨慎。

5.4 竞争带来的用户红利

无论最终谁胜谁负,竞争的最大受益者始终是用户。

前几个月可能是Gemini赚走风头,一月份轮到Claude,现在又轮到OpenAI。在这个轮回中,AI的能力一直在变强,价格一直在降低,用户体验一直在提升。

作为用户,我们只需要坐等更好的工具出现,然后选择最适合自己的那一款。


第六部分:实测总结与建议

6.1 GPT-5.3-Codex适合谁?

推荐使用:

  • 想体验AI编程但不想折腾命令行的入门用户
  • 需要处理多媒体内容(视频、图片、文档)的创作者
  • 希望一站式完成”需求→成品”的效率追求者
  • 需要快速原型验证的创业者

可以观望:

  • 从事大型项目开发,需要超长上下文的工程师
  • 需要深度定制和API集成的企业用户
  • 对代码质量和可维护性有极高要求的专业开发者

6.2 Claude Opus 4.6适合谁?

推荐使用:

  • 处理大型代码库的资深开发者
  • 需要AI团队协作的项目管理者
  • 对代码质量有严格要求的强迫症患者
  • 需要深度分析、代码审查、架构设计的复杂任务

6.3 访问方式

GPT-5.3-Codex:

  • 下载Codex桌面应用(Plus会员制)
  • API暂未开放

Claude Opus 4.6:

  • Claude聊天应用(Pro会员)
  • Claude Code(CLI工具)
  • 已开放API

Codex能在几分钟内生成一个完整的App,但它生成的就是最好的方案吗?Opus 4.6能一天处理十几个Issue,但它分派的优先级一定正确吗?

AI正在变得越来越强,但我们不能因此放弃思考和判断。

最好的状态是:让AI处理繁琐的执行工作,让人类专注于创造性的决策。

无论你选择Codex还是Opus 4.6,都别忘了——AI是工具,你是主人。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 视频下载/GIF制作/App开发全搞定,GPT-5.3-Codex颠覆了我的认知

评论 抢沙发

4 + 8 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮