最近有开发者发现OpenAI 的 Codex 疑似出现了一个 Ultra-Fast 模式,号称可以让 agentic code generation 最高可能快 5 倍。这件事表面上看只是"代码生成更快",但你把它放进 OpenAI 过去一段时间的产品变化来看,会发现一个更大的信号: AI 服务正在从"卖智能",进入"卖速度、卖优先级、卖算力预算"的阶段。
这让我想到最近上海迪士尼的排队争议。普通游客排几个小时,优速通用户几分钟进场。大家买到的不是不同项目,而是不同等待时间。
迪士尼卖的不是门票,是时间优先权
很多人第一次去迪士尼都会困惑,明明已经花了几百块门票钱,为什么还要额外充值?因为门票只是「进入系统」的资格,真正的分层从排队开始。同样进园,有人为一个热门项目排 120 分钟,有人 5 分钟就能玩上,区别不是资格够不够,而是有没有额外付费。迪士尼真正赚钱的,从来不是卖游乐设施的使用权,而是卖时间优先权。这个逻辑放在任何行业都成立,人们愿意为「不用等」付费的意愿,往往远超过为产品本身付费的意愿。
Codex Ultra-Fast : AI 也开始有优速通了
OpenAI 也正在进入同一套逻辑。这次 Codex Ultra-Fast 的信号尤其明显:用户要的不是模型「更会聊天」,而是 Agent 能不能更快完成代码任务。过去 AI 编程最大的痛点之一,就是等待。你让 Agent 改一个功能、修一个 bug 、跑一轮验证,它可能要思考、检索、生成、执行、再修正。模型能力很重要,但等待时间同样重要。
如果 Ultra-Fast 真的能把 agentic code generation 提速到最高 5 倍,它卖的就不是简单的「更快响应」,而是更高优先级的任务执行通道。再往深一层看, OpenAI 现有的 reasoning effort 档位解决的是「想多深」的问题, Codex Ultra-Fast 解决的是「干多快」的问题。一个是 token 预算分层,一个是执行速度分层。两者合在一起,说明 AI 服务正在从卖智能,进入卖优先级的阶段。
对用户来说,这是体验分层;对 OpenAI 来说,这是算力预算分层。低档位少消耗 token 、低延迟、低成本;高档位多消耗 token 、高延迟、高质量,也更适合高价值任务。这不只是模型升级,更像是把「思考时间」和「执行时间」都变成了可交易资源。就像迪士尼把排队时间商品化一样, OpenAI 把机器的思考 token 和执行速度商品化了。这件事的影响远不止 OpenAI 本身,它给整个 AI 行业打了个样,告诉所有人:算力这个东西,是可以按维度切片卖的。
AI 服务正在拆成三个分层维度
现在看 OpenAI 的产品体系,其实已经形成了三个清晰的商业化分层维度:
Codex Ultra-Fast 代表的是速度分层, reasoning effort 代表的是推理预算分层。两者合在一起,说明 AI 服务正在进入优先级定价时代。在相近的任务结果面前,有人愿意为了少等半小时多付几倍的价钱,这个商业逻辑和迪士尼优速通、机场快速安检、航空公司优先登机,本质上没有区别。
为什么切档位比统一服务更赚钱
因为统一服务有天花板,但分层服务没有。同样一份算力,如果所有人都用最高档,成本会爆炸到根本扛不住;如果所有人都用最低档,利润又太薄,赚不到愿意多花钱的那部分用户的钱。最好的方式就是把同一条流水线,切成不同价格区间。
需要注意的是,下面这张表不是 OpenAI 官方倍率表,而是为了理解商业逻辑建立的相对模型。 OpenAI 没有公布每个 reasoning 档位对应的固定 token 倍率,实际 reasoning tokens 会随模型、任务复杂度、上下文长度和输出要求动态变化。如果把 medium 理解成一个标准预算档( 1x 基准),那么不同推理档位大致可以被理解成一条逐级放大的 token 预算曲线:
能用就行的任务走低成本低延迟档,追求平衡的任务走标准档,要结果的任务走高推理档,时间比钱贵、任务价值更高的客户,最终会走向企业级 SLA 。本质上就是同一套算力池,服务不同支付意愿、不同任务价值的需求,把每一份算力的商业价值发挥到最大。
真正高明的产品都在做时间分层
迪士尼懂,航空公司懂,很多高端服务业也懂,现在 AI 公司也开始懂了。他们都明白一个最朴素的人性事实:很多时候,人不是单纯怕贵,而是更怕等。人不怕花钱,怕的是自己和别人一样要花时间等。所以最赚钱的生意,从来不是卖商品,而是卖「比别人更快」。
你以为你买的是优速通、头等舱、 VIP 通道、 Ultra-Fast 模式,其实你买的是「不用和别人一样」,是那种「我的时间更值钱」的心理满足感。这种心理价值的定价弹性,比任何实体商品都要大得多。
AI 行业正在从卖智能进入卖优先级
这是一个比 Ultra-Fast 本身更大的产业信号。未来 AI 公司竞争的重点,可能不只是模型能力,而是谁能把算力切得更细、卖得更准。低延迟是一门生意,深度推理也是一门生意,高优先级 SLA 更是一门独立的大生意。真正值钱的,不只是模型本身,而是模型背后的 token 预算、优先队列和算力调度能力。
就像电梯分普通梯和 VIP 梯,高速公路分普通车道和 ETC 快速通道,迪士尼分普通排队和快速通行,现在 AI 也开始这样了。 OpenAI 不只是在做模型,也在做「数字时代的优先通行证」。优速通卖的是少排队, Ultra-Fast 卖的是少等 AI 干活,这才是 Codex Ultra-Fast 背后,真正值得整个算力行业重视的商业信号。
觉得内容有用的话,欢迎点击上方蓝字「 AI 算力空间」关注我们,第一时间获取最新算力产业分析~
夜雨聆风