OpenAI 已经放弃,这条赛道还有机会吗?

2026年3月25日，OpenAI宣布关停Sora。从2024年2月以一段"东京街头漫步"视频封神，到全线退出消费者市场，25个月。迪士尼同步终止了10亿美元投资和三年IP授权协议。Sora团队声明简单直接："感谢每一位用Sora创作的人，我们即将与Sora告别。"

官方说法是聚焦IPO和下一代大模型Spud。但更接近真相的原因是，Sora的月活用户不到预期的十分之一。它犯了一个致命的错误：试图用封闭的产品逻辑切AI视频这个市场，但创作者需要的是能嵌入工作流的开放模块，不是一个孤立的"一键出片"盒子。

Sora关停当周，所有人的目光都转向了一个问题：AI视频赛道，到底还有没有机会？

如果只看视频生成模型这一层，答案不太乐观。Google的Veo 3.1在YouTube生态里做深度绑定。Runway Gen-4.5是专业创作者的默认选项，靠角色一致性和运动控制领先一个身位。中国的快手可灵更是碾压级的存在，单月收入突破2000万美元，6000万全球创作者，累计生成6亿条视频。字节的Seedance 2.0在物理还原和微表情上实现了"地震级"突破，开源加商业许可直接掀了桌子。

这一层的竞争，本质是参数规模、训练数据和推理成本的军备竞赛。创业公司几乎没有入场券。

但如果把镜头抬高一寸，会看到另一条赛道正在浮现。

一、AI视频的三条赛道

AI视频行业的竞争，其实是在三个不同的层面上同时展开。

第一层是视频生成模型。Sora、Veo、Runway、可灵、Seedance。这一层的核心能力是"从文本生成画面"，比的参数量、物理还原度和生成速度。这是最显性的战场，也是最拥挤的。大厂和准大厂把持着算力和数据，创业公司在这一层几乎没有生存空间。

第二层是视频创作工具。这一层做的是"让用户操作系统完成视频制作"，代表是传统的Adobe Premiere和剪映。它们在原有工具链上叠加AI功能，比如AI自动加字幕、AI调色、AI智能裁剪。这一层的核心能力是工具链的完整性和用户体验的流畅度。大厂有先发优势和用户存量。

第三层是视频创作Agent。这一层做的是"让AI代替用户操作系统完成视频制作"。用户只需要表达"我想要一条什么样的视频"，Agent自主完成从拆解意图、生成素材、组织叙事到剪辑输出的全流程。这一层对的是推理能力和方法论积累，而不是模型能力。这是创业公司唯一能和大厂差异化竞争的维度。

而Sora的失败，恰恰印证了这个判断。Sora本质上是一个第一层产品（视频生成模型）试图用第二层的模式（封闭消费平台）去打市场，结果两头不靠。

二、第三层的玩家们

做视频Agent的创业公司大约可以分成两类路线。

第一类是做Workflow引擎的。OiiOii由字节和B站动画背景的团队创办，产品走的是Workflow和Agent结合的混合路线，专注动画品类。它拿了腾讯和光速中国的投资，投后估值约2亿美元。产品体验上，OiiOii把整部影片划分成若干章节，每生成一组镜头需要用户确认，流程偏重，但在动画这一垂直场景下效果稳定。

Flova是另一家以Workflow为核心的产品，由脸萌创始人郭列创办，红杉和阿里先后入股。Flova更偏向模板化和流程化操作，生成速度快，但在编辑灵活性和长程叙事上不如Agent路线灵活。相比Medeo的"一句话驱动"，flova更像是一个"AI加持的剪辑流水线"。

另一家值得关注的是Sparki，拿了BAI资本数百万美元A轮，定位做Agentic AI视频创作与编辑平台。Sparki更偏向剪辑驱动的路线，在既有素材库内进行智能编辑和叙事重组。它的逻辑是"产出可控"，但天花板受限于素材池的深度。

第二类是全Agent路线的。一生智能的Medeo有一定的代表性，它不做预设的Workflow模板，而是让每一次对话驱动一条独一无二的推理路径。这个路线的好处是产品的自由度极高，理论上可以覆盖所有品类，缺点是确定性更难控制，训练出可用模型所需的数据量和时间窗口都是未知数。

两条路线不是简单的优劣之分。Workflow路线确定性高、见效快，但天花板被模板的预设逻辑锁死。Agent路线潜力更大，但对数据积累和技术进化的依赖性更强。某种意义上，这是"今天活得不错"和"未来有机会活得很好"之间的选择。

一生智能王冠的选择很清楚，别人在做流程优化，他们要做代际替代。Workflow本质是固化的if-then规则，规则越固定，产生的训练数据越单一，用单一数据训练的模型只会过拟合。而Agent路线每一次创作都走不同的推理路径，产生的数据高多样性，才有训练下一代推理模型的价值。

三、一场关于"内生数据"的豪赌

理解这条路线选择的深层逻辑，需要回到王冠对大模型行业的三阶段判断。

第一阶段，拼公域数据。互联网上公开数据的高质量清洗和预训练。这一阶段格局已定，是OpenAI和国内大厂的主场。

第二阶段，拼领域数据。垂直行业的私有数据，"我有你没有"。这一阶段利好大厂，因为它们有生态和场景优势。快手能做出可灵，本质上是它的短视频生态每天在产生海量的视频创作行为数据。

第三阶段，拼内生数据。这是王冠认为应用层公司唯一的护城河。所谓内生数据，是在产品出现之前世界上不存在的全新数据。ChatGPT出现之前，不存在海量的"通过对话方式解决复杂问题"的自然语言数据。这份数据是因为ChatGPT这个产品形态才被创造出来的。同样，Cursor出现之前，不存在海量的"开发者如何在AI辅助下写代码的决策过程"数据。这份数据是因为Cursor的生产环境才产生的。

Medeo在试图创造第三类数据，创作者在AI辅助下制作视频的完整决策过程数据。

这套逻辑能否成立，取决于一个前置条件：多模态大模型的能力是否会在近期出现非线性跃迁。如果视频模型始终停留在生成一段画面的水平，那System Two推理层的价值就很有限。但如果模型能力从GPT-2级别跃迁到GPT-4级别，即参数量扩大几个数量级，原生多模态和Video-to-Video编辑能力集体爆发，那提前搭建好推理环境和数据飞轮的公司，将第一个吃到红利。

这个赌注的时间窗口，王冠的判断是2026到2027年。Veo 3在2025年5月已经实现了音画同步等多项任务的融合。Sora 2在9月跟进。Nano Banana把图像编辑从静态扩展到了动态。音频模态的Suno v5、Eleven Multilingual v2在同一年集体跨越了可用性门槛。拐点的信号已经出现。问题只是拐点之后，曲线的斜率有多大。

四、一个正在分化的市场

Sora倒下的同一周，Runway宣布其Gen-4.5版本的月付费用户突破50万。快手可灵的年化收入飙升至2.4亿美元。Google Veo 3.1正在YouTube Studio、Google Workspace和Google Ads里深度嵌入式扩张。

这个市场没有死。它在分化。

底层模型层，大厂占据了绝对优势。但模型层的竞争越激烈，应用层的价值反而越高。因为当市面上有五个同样优秀的视频生成模型时，选择哪一个已经不是核心竞争力，知道如何用好它们才是。

这正是第三层玩家的核心叙事。当Runway和可灵在用更好的模型做更逼真的画面时，Medeo们在做一件不同的事。它们在做"导演"，而不是"摄影机"。

三条赛道有共识，也有分歧。共识是，视频创作Agent是一个足够大的市场。分歧是，最终蛋糕由谁来分配尚未可知。

从投资的角度看，多模态的竞争注定激烈，放在整个人工智能的未来产业格局来看，不把鸡蛋放在同一个技术路线的篮子里才是最明智的布局策略。

五、被低估的和被高估的

要重新定价一家像Medeo这样的公司，最诚实的方式是先搞清楚，市场高估了什么，又低估了什么。

被高估的，是当前的产品完成度。Medeo在2025年12月下旬才上线，到2026年1月底付费用户1072个，月均ARPU约90美元，累计收款刚过10万美元。公司账面现金1.3亿元人民币主要来自融资款，2025年全年亏损3400万。未来一到两年的亏损大概率会持续扩大。产品还在打磨阶段，自研模型甚至还没有开始训练。当下这个时间点上，没有人知道第一版模型需要多少标注数据，也不知道模型效果相对于现有方案能提升多少。

被低估的，反而是"不知道答案"这件事本身。Cursor在2022年成立时，同样没人知道Claude的代码能力会在两年后爆发。但它提前搭建的环境和数据管道，让它在拐点到来时成了天然的最大受益者。如果Medeo的数据飞轮能持续转动两年，等视频模型拐点真的来了，它同样可能是第一个准备好的。

被低估的第二个因素，是团队对"做一件对的事但不确定怎么做"的耐受度。王冠在月之暗面推出Kimi Chat之前，中国的长文本大模型是个空白。他在产品上线前经历了相当长的"不知道能不能做出来"的阶段。这种经验对Medeo今天的处境有直接的参考价值。

还有一个更隐蔽的被低估因素。Medeo从一开始就以Remote Native和无管理岗的方式运行。这种组织形态在AI创业公司里并不罕见，但当公司需要同时拉三条线，产品迭代、模型训练、全球市场拓展的时候，扁平化组织的信息传递效率和决策速度，可能恰好是最适配的。当然，前提是团队能在扩张中维持这种文化浓度。

Sora的关停给整个行业上了一课。AI视频不是一个做好模型就能赢的市场。它需要理解创作者的完整工作流，需要把自己嵌入到创作过程中而不是替代它，需要在模型能力不够的时候有自己的价值，也需要在模型能力爆发的时侯能第一时间接住。

Medeo同时在押注两个东西。一个是大模型会持续变强。另一个是，在大模型变强之后，真正稀缺的不再是生成能力，而是知道如何组织和驾驭生成能力的方法论。

这两层判断，第一层已经成为市场共识。第二层的答案还在生成中。

AI应用的故事才刚开始，看看“大厂不要的人”如何在AI时代卖铲子

成立15个月的无界动力，凭什么让红杉、高瓴连续三轮下注？

告别讲故事：AI 制药真正的主战场不在分子研发

高榕、联想、基石、红杉、高瓴、君联同时盯上AI基础设施新蓝海

谁将主导价值分配？中美具身智能创业投资分化的深层逻辑与产业格局

从今日宜休谈谈睡眠科技——一个千亿级刚需赛道的创业与投资逻辑