OpenAI 疑似上线 Ultra-Fast:AI 的收费逻辑要升级了?

最近有开发者发现OpenAI 的 Codex 疑似出现了一个 Ultra-Fast 模式，号称可以让 agentic code generation 最高可能快 5 倍。这件事表面上看只是"代码生成更快"，但你把它放进 OpenAI 过去一段时间的产品变化来看，会发现一个更大的信号： AI 服务正在从"卖智能"，进入"卖速度、卖优先级、卖算力预算"的阶段。

这让我想到最近上海迪士尼的排队争议。普通游客排几个小时，优速通用户几分钟进场。大家买到的不是不同项目，而是不同等待时间。

迪士尼卖的不是门票，是时间优先权

很多人第一次去迪士尼都会困惑，明明已经花了几百块门票钱，为什么还要额外充值？因为门票只是「进入系统」的资格，真正的分层从排队开始。同样进园，有人为一个热门项目排 120 分钟，有人 5 分钟就能玩上，区别不是资格够不够，而是有没有额外付费。迪士尼真正赚钱的，从来不是卖游乐设施的使用权，而是卖时间优先权。这个逻辑放在任何行业都成立，人们愿意为「不用等」付费的意愿，往往远超过为产品本身付费的意愿。

Codex Ultra-Fast ： AI 也开始有优速通了

OpenAI 也正在进入同一套逻辑。这次 Codex Ultra-Fast 的信号尤其明显：用户要的不是模型「更会聊天」，而是 Agent 能不能更快完成代码任务。过去 AI 编程最大的痛点之一，就是等待。你让 Agent 改一个功能、修一个 bug 、跑一轮验证，它可能要思考、检索、生成、执行、再修正。模型能力很重要，但等待时间同样重要。

如果 Ultra-Fast 真的能把 agentic code generation 提速到最高 5 倍，它卖的就不是简单的「更快响应」，而是更高优先级的任务执行通道。再往深一层看， OpenAI 现有的 reasoning effort 档位解决的是「想多深」的问题， Codex Ultra-Fast 解决的是「干多快」的问题。一个是 token 预算分层，一个是执行速度分层。两者合在一起，说明 AI 服务正在从卖智能，进入卖优先级的阶段。

对用户来说，这是体验分层；对 OpenAI 来说，这是算力预算分层。低档位少消耗 token 、低延迟、低成本；高档位多消耗 token 、高延迟、高质量，也更适合高价值任务。这不只是模型升级，更像是把「思考时间」和「执行时间」都变成了可交易资源。就像迪士尼把排队时间商品化一样， OpenAI 把机器的思考 token 和执行速度商品化了。这件事的影响远不止 OpenAI 本身，它给整个 AI 行业打了个样，告诉所有人：算力这个东西，是可以按维度切片卖的。

AI 服务正在拆成三个分层维度

现在看 OpenAI 的产品体系，其实已经形成了三个清晰的商业化分层维度：

分层维度	对应产品	用户感知	商业本质
速度分层	Codex Ultra-Fast	AI 干活更快	执行速度商品化
推理分层	reasoning effort 档位	AI 想得更深/更浅	token 预算商品化
服务分层	企业 SLA/高优先级资源	更稳定、更少排队	算力调度商品化

Codex Ultra-Fast 代表的是速度分层， reasoning effort 代表的是推理预算分层。两者合在一起，说明 AI 服务正在进入优先级定价时代。在相近的任务结果面前，有人愿意为了少等半小时多付几倍的价钱，这个商业逻辑和迪士尼优速通、机场快速安检、航空公司优先登机，本质上没有区别。

为什么切档位比统一服务更赚钱

因为统一服务有天花板，但分层服务没有。同样一份算力，如果所有人都用最高档，成本会爆炸到根本扛不住；如果所有人都用最低档，利润又太薄，赚不到愿意多花钱的那部分用户的钱。最好的方式就是把同一条流水线，切成不同价格区间。

需要注意的是，下面这张表不是 OpenAI 官方倍率表，而是为了理解商业逻辑建立的相对模型。 OpenAI 没有公布每个 reasoning 档位对应的固定 token 倍率，实际 reasoning tokens 会随模型、任务复杂度、上下文长度和输出要求动态变化。如果把 medium 理解成一个标准预算档（ 1x 基准），那么不同推理档位大致可以被理解成一条逐级放大的 token 预算曲线：

推理档位	体验定位	商业理解上的 token 预算倍率	商业含义
none	秒回	接近 0x	不额外购买思考，只买答案返回
minimal	微思考	约 0.1x - 0.3x	用极少 token 做轻量判断
low	快思考	约 0.3x - 0.7x	控制成本，同时保留一定稳定性
medium	标准思考	1x 基准	质量和成本折中
high	深度思考	约 2x - 4x	用更多 token 换复杂任务成功率
xhigh	专家模式	约 4x - 8x+	面向高价值任务，延迟和成本明显上升

能用就行的任务走低成本低延迟档，追求平衡的任务走标准档，要结果的任务走高推理档，时间比钱贵、任务价值更高的客户，最终会走向企业级 SLA 。本质上就是同一套算力池，服务不同支付意愿、不同任务价值的需求，把每一份算力的商业价值发挥到最大。

真正高明的产品都在做时间分层

迪士尼懂，航空公司懂，很多高端服务业也懂，现在 AI 公司也开始懂了。他们都明白一个最朴素的人性事实：很多时候，人不是单纯怕贵，而是更怕等。人不怕花钱，怕的是自己和别人一样要花时间等。所以最赚钱的生意，从来不是卖商品，而是卖「比别人更快」。

你以为你买的是优速通、头等舱、 VIP 通道、 Ultra-Fast 模式，其实你买的是「不用和别人一样」，是那种「我的时间更值钱」的心理满足感。这种心理价值的定价弹性，比任何实体商品都要大得多。

AI 行业正在从卖智能进入卖优先级

这是一个比 Ultra-Fast 本身更大的产业信号。未来 AI 公司竞争的重点，可能不只是模型能力，而是谁能把算力切得更细、卖得更准。低延迟是一门生意，深度推理也是一门生意，高优先级 SLA 更是一门独立的大生意。真正值钱的，不只是模型本身，而是模型背后的 token 预算、优先队列和算力调度能力。

就像电梯分普通梯和 VIP 梯，高速公路分普通车道和 ETC 快速通道，迪士尼分普通排队和快速通行，现在 AI 也开始这样了。 OpenAI 不只是在做模型，也在做「数字时代的优先通行证」。优速通卖的是少排队， Ultra-Fast 卖的是少等 AI 干活，这才是 Codex Ultra-Fast 背后，真正值得整个算力行业重视的商业信号。

觉得内容有用的话，欢迎点击上方蓝字「 AI 算力空间」关注我们，第一时间获取最新算力产业分析~