OpenAI 的残酷剪枝:为什么 Sora 必须为“超级应用”让位?
在 ChatGPT 夺冠后的那个圣诞派对上,OpenAI 总裁 Greg Brockman 嗅到了一种令他脊背发凉的气息。那不是失败的预兆,而是恰恰相反——办公室里弥漫着一种“我们赢了”的轻敌氛围。对于一家试图通往 AGI 的公司来说,这种领跑者的安逸感比算力短缺更致命。Brockman 随即在内部重申了一个残酷的信条:OpenAI 必须永远是那个饥饿的、处境危险的“下位挑战者(Underdog)”。
正是这种病态的危机感,驱动了 OpenAI 近期最冷酷的战略剪枝:将曾惊艳全球的视频模型 Sora 边缘化,调转资源全量押注所谓的“超级应用(Superapp)”。
算力悖论:它不是昂贵的开支,而是你的“头号销售”
外界常将 OpenAI 对算力的渴求视作一种挥金如土的豪赌,但在 Brockman 的逻辑里,算力采购从来不是一种资源消耗。他将其尖锐地类比为“雇佣销售员”:只要产品拥有近乎无限的市场需求,那么“销售团队”的规模越大,带来的营收增量就越直接。
当团队战战兢兢地询问“我们该买多少算力”时,Brockman 的回答只有三个字:“全部买。”但这并不意味着 OpenAI 财务自由。相反,即便坐拥百亿美金,他们依然像溺水者对待氧气一样,极其痛苦地分配着每一个计算单元。在这种极致的稀缺下,每一份喂给 Sora 的算力,都是从 GPT 推理引擎的嘴里夺走的口粮。这种资源争夺的残酷性,直接决定了技术的死生。
技术树的断裂:Sora 归于物理,GPT 归于逻辑
公众曾天真地认为 Sora 是 GPT 逻辑的视频化延伸,但 Brockman 亲手戳破了这个幻象。在技术底座上,它们生长在完全不同的分支:Sora 属于“世界模型(Diffusion 扩散模型)”,试图解构物理规律;而 GPT 则专注于“推理逻辑(Transformers 模型)”。
“如果你在技术树上分支太远,试图同时维持两套迥异的工程架构,在算力有限的现实面前是极难持续的。我们必须做出选择。” —— Greg Brockman
OpenAI 并没有彻底杀死 Sora,而是将其从消费级产品的 C 位撤下,扔给了研发进程更慢的“机器人(Robotics)”部门。这是一种战略上的断舍离:既然无法同时占领物理与逻辑的两座高地,OpenAI 选择了逻辑。Sora 沦为一个长期潜伏的“侧翼任务”,而 GPT 这种能直接提升人类管理复杂性能力的“推理引擎”,才是唯一的主线。
“参差不齐”的 AGI:一场还未定型的幻觉
Brockman 拒绝给 AGI 下一个科学定义,在他看来,AGI 更多地体现为一种“氛围(Vibe)”。他提出了一个名为“Jagged AGI(参差不齐的 AGI)”的概念,揭示了当前智能中那种令人不安的错位:
超神时刻: AI 可以在 12 小时内解决物理学家苦思冥想数载的数学难题。 愚蠢瞬间: 它可能在同步电脑桌面、跨窗口读取信息等最基础的操作上显得笨拙不堪。
这种认知的锯齿感定义了现状。我们正处于 AGI 进度条的 70-80% 处,但它不是一个清脆的开关,而是一个不断抬高的“地板”。智能正以一种不均匀的密度渗透进现实,先是在高维脑力劳动中封神,然后再缓慢地去解决那些最琐碎的、关于如何“像人一样操作电脑”的低级问题。
超级应用:不仅是冰山一角,而是“控制台”
OpenAI 正在秘密构建的“超级应用”,其 UI 界面只是露在海面上的冰山之尖。真正的本体是藏在水下的“Harness(装具/控制台)”——这是一个将模型、语境、记忆与行动力彻底统一的技术基座。
这个蓝图的终点是“个体即 CEO”:你不再需要去学习各种软件的复杂操作(正如 Brockman 所说,不应让人去迁就机器,而应让机器来迁就人),而是直接管理一支“代理舰队(Agents)”。
1. 记忆: 它不再是与你初次见面的陌生人,而是拥有共同历史的战友。
2. 上下文: 它能嗅到你邮件、日历和工作流中的每一个细微脉络。
3. 行动: 它能直接操纵浏览器和软件,完成从策划到执行的闭环。
但 Brockman 发出了冷峻的警示:这种权力的杠杆极其危险。你可以委派任务,但绝不能委派责任。如果你因为拥有了舰队而失去了对业务细节的“触感(Pulse)”,这种效率的倍增器只会让你在错误的方向上死得更快。
Spud 计划与“大模型气味”
代号为“Spud”的新一代预训练模型已完成基础训练,正在进入最后的强化阶段。它带来的不仅仅是参数的增加,而是一种被称为“Big Model Smell(大模型气味)”的定性改变。
这种“气味”意味着模型开始变得“圆融(Bending)”。过去,人类必须把自己扭曲成某种特定姿态(编写提示词)去适应机器;而现在,机器开始主动弯曲脊梁,顺从人类的意图。Brockman 分享了一个极具冲击力的对比:在他早年学习编程时,曾试图构建一个网站,那是一个耗时数月的巨大工程;即便在 GPT-4 早期,也需要花费约 4 小时、通过多轮对话才能拼凑完成。而现在,在 Spud 这种层级的模型面前,只需一次指令(One-shot),沉睡 25 年的技术梦想在瞬间即告实现。
这是 AGI 从“大脑练习”正式跨向“经济引擎”的转折点。
结语:关于人类连接的最后赌注
如果技术发展的终点,是让机器接管所有的数字事务——管理公司、优化代码、精准医疗——那么人类最终会被推向哪里?
Brockman 的观点中透着一种科技宿命论:当 AI 把人类从数字世界的琐碎中彻底释放出来时,它实际上是将人类推回了物理世界,推回了面对面的人际连接。当屏幕背后的一切都被代理化、自动化,那个坐在你餐桌对面、能产生真实情感共鸣的人类,反而成为了文明中最稀缺、最昂贵的资产。
当机器接管了所有数字世界的平庸,你还剩下什么值得追求?这或许是 OpenAI 在通往 AGI 的残酷征途中,留给人类的最后一道尊严题。
夜雨聆风