当前时间: 1970-01-01 08:00:00
分类:办公文件
评论(0)
OpenAI 已经放弃,这条赛道还有机会吗?2026年3月25日,OpenAI宣布关停Sora。从2024年2月以一段"东京街头漫步"视频封神,到全线退出消费者市场,25个月。迪士尼同步终止了10亿美元投资和三年IP授权协议。Sora团队声明简单直接:"感谢每一位用Sora创作的人,我们即将与Sora告别。"官方说法是聚焦IPO和下一代大模型Spud。但更接近真相的原因是,Sora的月活用户不到预期的十分之一。它犯了一个致命的错误:试图用封闭的产品逻辑切AI视频这个市场,但创作者需要的是能嵌入工作流的开放模块,不是一个孤立的"一键出片"盒子。Sora关停当周,所有人的目光都转向了一个问题:AI视频赛道,到底还有没有机会?如果只看视频生成模型这一层,答案不太乐观。Google的Veo 3.1在YouTube生态里做深度绑定。Runway Gen-4.5是专业创作者的默认选项,靠角色一致性和运动控制领先一个身位。中国的快手可灵更是碾压级的存在,单月收入突破2000万美元,6000万全球创作者,累计生成6亿条视频。字节的Seedance 2.0在物理还原和微表情上实现了"地震级"突破,开源加商业许可直接掀了桌子。这一层的竞争,本质是参数规模、训练数据和推理成本的军备竞赛。创业公司几乎没有入场券。一、AI视频的三条赛道
AI视频行业的竞争,其实是在三个不同的层面上同时展开。第一层是视频生成模型。Sora、Veo、Runway、可灵、Seedance。这一层的核心能力是"从文本生成画面",比的参数量、物理还原度和生成速度。这是最显性的战场,也是最拥挤的。大厂和准大厂把持着算力和数据,创业公司在这一层几乎没有生存空间。第二层是视频创作工具。这一层做的是"让用户操作系统完成视频制作",代表是传统的Adobe Premiere和剪映。它们在原有工具链上叠加AI功能,比如AI自动加字幕、AI调色、AI智能裁剪。这一层的核心能力是工具链的完整性和用户体验的流畅度。大厂有先发优势和用户存量。第三层是视频创作Agent。这一层做的是"让AI代替用户操作系统完成视频制作"。用户只需要表达"我想要一条什么样的视频",Agent自主完成从拆解意图、生成素材、组织叙事到剪辑输出的全流程。这一层对的是推理能力和方法论积累,而不是模型能力。这是创业公司唯一能和大厂差异化竞争的维度。而Sora的失败,恰恰印证了这个判断。Sora本质上是一个第一层产品(视频生成模型)试图用第二层的模式(封闭消费平台)去打市场,结果两头不靠。二、第三层的玩家们
第一类是做Workflow引擎的。OiiOii由字节和B站动画背景的团队创办,产品走的是Workflow和Agent结合的混合路线,专注动画品类。它拿了腾讯和光速中国的投资,投后估值约2亿美元。产品体验上,OiiOii把整部影片划分成若干章节,每生成一组镜头需要用户确认,流程偏重,但在动画这一垂直场景下效果稳定。Flova是另一家以Workflow为核心的产品,由脸萌创始人郭列创办,红杉和阿里先后入股。Flova更偏向模板化和流程化操作,生成速度快,但在编辑灵活性和长程叙事上不如Agent路线灵活。相比Medeo的"一句话驱动",flova更像是一个"AI加持的剪辑流水线"。另一家值得关注的是Sparki,拿了BAI资本数百万美元A轮,定位做Agentic AI视频创作与编辑平台。Sparki更偏向剪辑驱动的路线,在既有素材库内进行智能编辑和叙事重组。它的逻辑是"产出可控",但天花板受限于素材池的深度。第二类是全Agent路线的。一生智能的Medeo有一定的代表性,它不做预设的Workflow模板,而是让每一次对话驱动一条独一无二的推理路径。这个路线的好处是产品的自由度极高,理论上可以覆盖所有品类,缺点是确定性更难控制,训练出可用模型所需的数据量和时间窗口都是未知数。两条路线不是简单的优劣之分。Workflow路线确定性高、见效快,但天花板被模板的预设逻辑锁死。Agent路线潜力更大,但对数据积累和技术进化的依赖性更强。某种意义上,这是"今天活得不错"和"未来有机会活得很好"之间的选择。一生智能王冠的选择很清楚,别人在做流程优化,他们要做代际替代。Workflow本质是固化的if-then规则,规则越固定,产生的训练数据越单一,用单一数据训练的模型只会过拟合。而Agent路线每一次创作都走不同的推理路径,产生的数据高多样性,才有训练下一代推理模型的价值。三、一场关于"内生数据"的豪赌
理解这条路线选择的深层逻辑,需要回到王冠对大模型行业的三阶段判断。第一阶段,拼公域数据。互联网上公开数据的高质量清洗和预训练。这一阶段格局已定,是OpenAI和国内大厂的主场。第二阶段,拼领域数据。垂直行业的私有数据,"我有你没有"。这一阶段利好大厂,因为它们有生态和场景优势。快手能做出可灵,本质上是它的短视频生态每天在产生海量的视频创作行为数据。第三阶段,拼内生数据。这是王冠认为应用层公司唯一的护城河。所谓内生数据,是在产品出现之前世界上不存在的全新数据。ChatGPT出现之前,不存在海量的"通过对话方式解决复杂问题"的自然语言数据。这份数据是因为ChatGPT这个产品形态才被创造出来的。同样,Cursor出现之前,不存在海量的"开发者如何在AI辅助下写代码的决策过程"数据。这份数据是因为Cursor的生产环境才产生的。Medeo在试图创造第三类数据,创作者在AI辅助下制作视频的完整决策过程数据。这套逻辑能否成立,取决于一个前置条件:多模态大模型的能力是否会在近期出现非线性跃迁。如果视频模型始终停留在生成一段画面的水平,那System Two推理层的价值就很有限。但如果模型能力从GPT-2级别跃迁到GPT-4级别,即参数量扩大几个数量级,原生多模态和Video-to-Video编辑能力集体爆发,那提前搭建好推理环境和数据飞轮的公司,将第一个吃到红利。这个赌注的时间窗口,王冠的判断是2026到2027年。Veo 3在2025年5月已经实现了音画同步等多项任务的融合。Sora 2在9月跟进。Nano Banana把图像编辑从静态扩展到了动态。音频模态的Suno v5、Eleven Multilingual v2在同一年集体跨越了可用性门槛。拐点的信号已经出现。问题只是拐点之后,曲线的斜率有多大。四、一个正在分化的市场
Sora倒下的同一周,Runway宣布其Gen-4.5版本的月付费用户突破50万。快手可灵的年化收入飙升至2.4亿美元。Google Veo 3.1正在YouTube Studio、Google Workspace和Google Ads里深度嵌入式扩张。底层模型层,大厂占据了绝对优势。但模型层的竞争越激烈,应用层的价值反而越高。因为当市面上有五个同样优秀的视频生成模型时,选择哪一个已经不是核心竞争力,知道如何用好它们才是。这正是第三层玩家的核心叙事。当Runway和可灵在用更好的模型做更逼真的画面时,Medeo们在做一件不同的事。它们在做"导演",而不是"摄影机"。三条赛道有共识,也有分歧。共识是,视频创作Agent是一个足够大的市场。分歧是,最终蛋糕由谁来分配尚未可知。从投资的角度看,多模态的竞争注定激烈,放在整个人工智能的未来产业格局来看,不把鸡蛋放在同一个技术路线的篮子里才是最明智的布局策略。五、被低估的和被高估的
要重新定价一家像Medeo这样的公司,最诚实的方式是先搞清楚,市场高估了什么,又低估了什么。被高估的,是当前的产品完成度。Medeo在2025年12月下旬才上线,到2026年1月底付费用户1072个,月均ARPU约90美元,累计收款刚过10万美元。公司账面现金1.3亿元人民币主要来自融资款,2025年全年亏损3400万。未来一到两年的亏损大概率会持续扩大。产品还在打磨阶段,自研模型甚至还没有开始训练。当下这个时间点上,没有人知道第一版模型需要多少标注数据,也不知道模型效果相对于现有方案能提升多少。被低估的,反而是"不知道答案"这件事本身。Cursor在2022年成立时,同样没人知道Claude的代码能力会在两年后爆发。但它提前搭建的环境和数据管道,让它在拐点到来时成了天然的最大受益者。如果Medeo的数据飞轮能持续转动两年,等视频模型拐点真的来了,它同样可能是第一个准备好的。被低估的第二个因素,是团队对"做一件对的事但不确定怎么做"的耐受度。王冠在月之暗面推出Kimi Chat之前,中国的长文本大模型是个空白。他在产品上线前经历了相当长的"不知道能不能做出来"的阶段。这种经验对Medeo今天的处境有直接的参考价值。还有一个更隐蔽的被低估因素。Medeo从一开始就以Remote Native和无管理岗的方式运行。这种组织形态在AI创业公司里并不罕见,但当公司需要同时拉三条线,产品迭代、模型训练、全球市场拓展的时候,扁平化组织的信息传递效率和决策速度,可能恰好是最适配的。当然,前提是团队能在扩张中维持这种文化浓度。Sora的关停给整个行业上了一课。AI视频不是一个做好模型就能赢的市场。它需要理解创作者的完整工作流,需要把自己嵌入到创作过程中而不是替代它,需要在模型能力不够的时候有自己的价值,也需要在模型能力爆发的时侯能第一时间接住。Medeo同时在押注两个东西。一个是大模型会持续变强。另一个是,在大模型变强之后,真正稀缺的不再是生成能力,而是知道如何组织和驾驭生成能力的方法论。这两层判断,第一层已经成为市场共识。第二层的答案还在生成中。
基本
文件
流程
错误
SQL
调试
- 请求信息 : 2026-06-12 07:43:38 HTTP/1.1 GET : https://www.yeyulingfeng.com/a/736703.html
- 运行时间 : 0.194199s [ 吞吐率:5.15req/s ] 内存消耗:4,703.93kb 文件加载:145
- 缓存信息 : 0 reads,0 writes
- 会话信息 : SESSION_ID=ced4180b725d51b5d652fbae47fc15c1
- CONNECT:[ UseTime:0.001054s ] mysql:host=127.0.0.1;port=3306;dbname=wenku;charset=utf8mb4
- SHOW FULL COLUMNS FROM `fenlei` [ RunTime:0.001329s ]
- SELECT * FROM `fenlei` WHERE `fid` = 0 [ RunTime:0.000678s ]
- SELECT * FROM `fenlei` WHERE `fid` = 63 [ RunTime:0.000555s ]
- SHOW FULL COLUMNS FROM `set` [ RunTime:0.001232s ]
- SELECT * FROM `set` [ RunTime:0.000481s ]
- SHOW FULL COLUMNS FROM `article` [ RunTime:0.001198s ]
- SELECT * FROM `article` WHERE `id` = 736703 LIMIT 1 [ RunTime:0.000924s ]
- UPDATE `article` SET `lasttime` = 1781221418 WHERE `id` = 736703 [ RunTime:0.001391s ]
- SELECT * FROM `fenlei` WHERE `id` = 64 LIMIT 1 [ RunTime:0.000508s ]
- SELECT * FROM `article` WHERE `id` < 736703 ORDER BY `id` DESC LIMIT 1 [ RunTime:0.000998s ]
- SELECT * FROM `article` WHERE `id` > 736703 ORDER BY `id` ASC LIMIT 1 [ RunTime:0.000969s ]
- SELECT * FROM `article` WHERE `id` < 736703 ORDER BY `id` DESC LIMIT 10 [ RunTime:0.001901s ]
- SELECT * FROM `article` WHERE `id` < 736703 ORDER BY `id` DESC LIMIT 10,10 [ RunTime:0.002508s ]
- SELECT * FROM `article` WHERE `id` < 736703 ORDER BY `id` DESC LIMIT 20,10 [ RunTime:0.003044s ]
0.198100s