OpenAI“断舍离”:为什么 Sora 必须为“超级应用”让位?

OpenAI 的残酷剪枝：为什么 Sora 必须为“超级应用”让位？

在 ChatGPT 夺冠后的那个圣诞派对上，OpenAI 总裁 Greg Brockman 嗅到了一种令他脊背发凉的气息。那不是失败的预兆，而是恰恰相反——办公室里弥漫着一种“我们赢了”的轻敌氛围。对于一家试图通往 AGI 的公司来说，这种领跑者的安逸感比算力短缺更致命。Brockman 随即在内部重申了一个残酷的信条：OpenAI 必须永远是那个饥饿的、处境危险的“下位挑战者（Underdog）”。

正是这种病态的危机感，驱动了 OpenAI 近期最冷酷的战略剪枝：将曾惊艳全球的视频模型 Sora 边缘化，调转资源全量押注所谓的“超级应用（Superapp）”。

算力悖论：它不是昂贵的开支，而是你的“头号销售”

外界常将 OpenAI 对算力的渴求视作一种挥金如土的豪赌，但在 Brockman 的逻辑里，算力采购从来不是一种资源消耗。他将其尖锐地类比为“雇佣销售员”：只要产品拥有近乎无限的市场需求，那么“销售团队”的规模越大，带来的营收增量就越直接。

当团队战战兢兢地询问“我们该买多少算力”时，Brockman 的回答只有三个字：“全部买。”但这并不意味着 OpenAI 财务自由。相反，即便坐拥百亿美金，他们依然像溺水者对待氧气一样，极其痛苦地分配着每一个计算单元。在这种极致的稀缺下，每一份喂给 Sora 的算力，都是从 GPT 推理引擎的嘴里夺走的口粮。这种资源争夺的残酷性，直接决定了技术的死生。

技术树的断裂：Sora 归于物理，GPT 归于逻辑

公众曾天真地认为 Sora 是 GPT 逻辑的视频化延伸，但 Brockman 亲手戳破了这个幻象。在技术底座上，它们生长在完全不同的分支：Sora 属于“世界模型（Diffusion 扩散模型）”，试图解构物理规律；而 GPT 则专注于“推理逻辑（Transformers 模型）”。

“如果你在技术树上分支太远，试图同时维持两套迥异的工程架构，在算力有限的现实面前是极难持续的。我们必须做出选择。” —— Greg Brockman

OpenAI 并没有彻底杀死 Sora，而是将其从消费级产品的 C 位撤下，扔给了研发进程更慢的“机器人（Robotics）”部门。这是一种战略上的断舍离：既然无法同时占领物理与逻辑的两座高地，OpenAI 选择了逻辑。Sora 沦为一个长期潜伏的“侧翼任务”，而 GPT 这种能直接提升人类管理复杂性能力的“推理引擎”，才是唯一的主线。

“参差不齐”的 AGI：一场还未定型的幻觉

Brockman 拒绝给 AGI 下一个科学定义，在他看来，AGI 更多地体现为一种“氛围（Vibe）”。他提出了一个名为“Jagged AGI（参差不齐的 AGI）”的概念，揭示了当前智能中那种令人不安的错位：

超神时刻： AI 可以在 12 小时内解决物理学家苦思冥想数载的数学难题。
愚蠢瞬间：它可能在同步电脑桌面、跨窗口读取信息等最基础的操作上显得笨拙不堪。

这种认知的锯齿感定义了现状。我们正处于 AGI 进度条的 70-80% 处，但它不是一个清脆的开关，而是一个不断抬高的“地板”。智能正以一种不均匀的密度渗透进现实，先是在高维脑力劳动中封神，然后再缓慢地去解决那些最琐碎的、关于如何“像人一样操作电脑”的低级问题。

超级应用：不仅是冰山一角，而是“控制台”

OpenAI 正在秘密构建的“超级应用”，其 UI 界面只是露在海面上的冰山之尖。真正的本体是藏在水下的“Harness（装具/控制台）”——这是一个将模型、语境、记忆与行动力彻底统一的技术基座。

这个蓝图的终点是“个体即 CEO”：你不再需要去学习各种软件的复杂操作（正如 Brockman 所说，不应让人去迁就机器，而应让机器来迁就人），而是直接管理一支“代理舰队（Agents）”。

1. 记忆：它不再是与你初次见面的陌生人，而是拥有共同历史的战友。

2. 上下文：它能嗅到你邮件、日历和工作流中的每一个细微脉络。

3. 行动：它能直接操纵浏览器和软件，完成从策划到执行的闭环。

但 Brockman 发出了冷峻的警示：这种权力的杠杆极其危险。你可以委派任务，但绝不能委派责任。如果你因为拥有了舰队而失去了对业务细节的“触感（Pulse）”，这种效率的倍增器只会让你在错误的方向上死得更快。

Spud 计划与“大模型气味”

代号为“Spud”的新一代预训练模型已完成基础训练，正在进入最后的强化阶段。它带来的不仅仅是参数的增加，而是一种被称为“Big Model Smell（大模型气味）”的定性改变。

这种“气味”意味着模型开始变得“圆融（Bending）”。过去，人类必须把自己扭曲成某种特定姿态（编写提示词）去适应机器；而现在，机器开始主动弯曲脊梁，顺从人类的意图。Brockman 分享了一个极具冲击力的对比：在他早年学习编程时，曾试图构建一个网站，那是一个耗时数月的巨大工程；即便在 GPT-4 早期，也需要花费约 4 小时、通过多轮对话才能拼凑完成。而现在，在 Spud 这种层级的模型面前，只需一次指令（One-shot），沉睡 25 年的技术梦想在瞬间即告实现。

这是 AGI 从“大脑练习”正式跨向“经济引擎”的转折点。

结语：关于人类连接的最后赌注

如果技术发展的终点，是让机器接管所有的数字事务——管理公司、优化代码、精准医疗——那么人类最终会被推向哪里？

Brockman 的观点中透着一种科技宿命论：当 AI 把人类从数字世界的琐碎中彻底释放出来时，它实际上是将人类推回了物理世界，推回了面对面的人际连接。当屏幕背后的一切都被代理化、自动化，那个坐在你餐桌对面、能产生真实情感共鸣的人类，反而成为了文明中最稀缺、最昂贵的资产。

当机器接管了所有数字世界的平庸，你还剩下什么值得追求？这或许是 OpenAI 在通往 AGI 的残酷征途中，留给人类的最后一道尊严题。