一边是Sora的退场,一边是国内视频生成工具的崛起——即梦、可灵的日活与收入不断攀升,阿里旗下的Happy Horse 1.0也高调亮相,带来新一轮行业狂欢。这种两极分化,最直接的驱动因素是用户急于寻找Sora之外的方案。
翻看多家海外科技媒体发布的“Sora替代方案清单”,即梦、可灵与Google Veo 3.1、Runway Gen-4.5等并列其中。Sensor Tower的数据也能说明问题:Sora关停公告发出后的一周内,可灵的全球周活跃用户环比上升了4%,达到260万。而即梦在第一季度的月活跃用户已达到1352.5万,下载量558.9万,牢牢占据视频生成赛道的第一名。
但更根本的变化在于,AI视频生成工具迎来了一个真正的“应用风口”——AI短剧的井喷。2025年,国内AI漫剧市场规模已达168亿元,2026年有望突破240亿元,而支撑这一市场的正是视频生成模型。只是,用户和营收的增长只是开场。当技术吸引了足够的注意力之后,一个现实得近乎残酷的问题被摆上台面:如何把流量和口碑,转化为一条清晰、可持续的赚钱路径?
Sora的结局已经敲响警钟:在算力成本高烧不退的AI视频行业,商业上的成功远比技术上的领先更难实现。
01 踩准AI短剧的风口
今年一季度,即梦AI的MAU达到1352.5万,下载量558.9万。行业内保守估计,春节前后Seedance2.0的月活曾一度突破4500万。这个数字不仅超过了Sora顶峰时期的600万月活,也压过了可灵。同期,可灵的每月下载量平均为56.2万,MAU为119.1万,3月份的移动端平均MAU为780万。
即梦能在用户规模上领先,离不开字节系生态的扶持:融入豆包,登陆CapCut(剪映国际版),承接抖音的流量池与内容消费场景。Seedance2.0上线后更是带来了新增量:极低的使用门槛加上免费赠积分策略,几乎是零成本点燃了普通用户的AI创作热情。
全网刷屏的“酱板鸭与狐狸”就是即梦制造的现象级作品——一个贵州酱板鸭品牌团队使用即梦Seedance2.0,只用了5个小时、40块钱的算力成本,就生成了一段邵氏武侠风的荒诞短剧,之后迅速引爆网络,催生出全民参与的“酱板鸭宇宙”。
相比之下,可灵的用户盘子虽然小一些,但付费意愿更强——主要是自媒体视频制作者和广告营销从业者这类P端付费会员。快手CEO程一笑曾对外表示,P端付费会员为可灵贡献了近七成收入,他们既有C端的传播力,又有B端的付费能力,正是视频生成大模型最核心的用户群。
在影视前期阶段,可灵的智能分镜和主体参考技术,能将原本需要大量沟通才能落地的创意构想,变成一个精准可控的可视化过程。在广告制作领域,可灵被广泛用于生成不同场景下的广告Demo。编剧杨选认为,可灵3.0的多主体参考和音画同出功能,能高效生成完整的剧情片段,大大简化了从分镜到成片的流程。
由于画质接近电影质感,可灵常被用于专业影视工业链条。开年大戏《太平年》与亚马逊热播剧《大卫王朝》的部分虚拟场景和特效镜头,就是由可灵制作的。前期阶段,制作团队还大量使用可灵的图像模型来生成并筛选场景概念图和角色设定稿。时光坐标创始人陈奕在评价《太平年》中的AI应用时表示:“可灵在光影和材质的细节表达上,能经得起专业视觉艺术家的审视。”
即梦也在加码专业领域。热播剧《万兽独尊》使用的就是搭载Seedance2.0的“小云雀AI短剧Agent”全流程制作工具。即梦还参与了今年春晚《贺花神》《快乐小马》《驭风歌》等节目的视觉定制。火山引擎总裁谭待曾透露,春晚其实是Seedance2.0正式发布前的第一个商业客户。
这些积累,让即梦和可灵在AI短剧风口来临时能够快速承接需求。2026年,字节旗下漫剧的日token消耗已突破7000万元,首次反超真人短剧。多镜头叙事、专业级的参考控制能力,让这些工具成为大量短剧制作团队的标配。
02 从“生成画面”走向“理解故事”
AI视频模型的成熟,给影视行业带来的第一个颠覆性变化是:可以在极短时间内完成一部作品。
以AI短剧为例,一年前单集制作周期通常要5-7天,精品项目可能7-10天甚至更久。现在,这个周期被急剧压缩。今年年后走红的《霍去病》和《万兽独尊》就是典型:前者从策划到成片大约用了4天,核心团队只有3人;后者使用字节的全流程AI短剧制作工具,5个人8天就做出了60集。清明节期间刷屏的AI短片《纸手机》,使用可灵3.0 Omni模型,仅用3天就完成了从创意到成片的全过程。
这种效率飞跃的背后,是模型可用性与可控性的根本性提升。即梦Seedance2.0和可灵3.0的相继发布,可以说是一个分水岭。
Seedance2.0最具突破性的功能是“全能引用模式”:允许用户在单次生成中,混合引用最多9张图片、3段视频和3段音频作为多模态参考素材。创作者可以先通过图像模型确定角色设定和场景概念图,再把定稿画面导入视频模型作为强约束视觉参考,从而在单次生成中将角色、动作、音效等复杂元素一次融合到位。
可灵3.0走的是另一条路:通过“All-in-One”全流程整合系统与“主体库”模式,用户只需输入一句话的剧情描述,模型就能自动拆解出包含不同景别和镜头运动的多个分镜,预先输出高质量、高一致性的视觉分镜稿,并在15秒镜头内保持主体外观和动作的一致性。
“声画同出”能力的成熟也是效率提升的关键。所谓“声画同出”,就是模型能一次性生成音效、口型、音乐与画面高度同步的完整片段,声音能随着剧情节奏起伏——这意味着模型必须理解“叙事”,甚至达到“开箱即用”的水平。国内最早商用的是阿里通义万相Wan2.5,但真正靠这个功能破圈的却是即梦Seedance2.0。
控制能力的提升,直接带来了“抽卡”随机性的大幅下降。以前用AI做视频,一个分镜往往要抽卡20次以上才能得到几秒能用的画面;要是涉及复杂物理的打斗戏,抽卡上百次也可能得不到前后连贯的镜头。汤臣倍健曾花上百万元制作了一支纯AI生成的广告片《敢探极境》,两分多钟、一百个镜头,每个镜头的图片和视频都要抽卡数百次。而现在,抽卡效率大幅提高。漫剧从业者流萤分享说,即梦让抽卡效率“至少提升了十倍”,“新模型的构图思维进步极大,有时一句话就能生成一个基本可用的初版。”
效率提升的同时,成本也在跳水。传统真人短剧单集成本在5-10万元,精品项目要50-300万元;而新的AI视频工具可以把单集成本压到5000元以内,算力成本最低只有千元级别,降幅超过90%。像前面提到的《霍去病》,算力成本仅3000元。《万兽独尊》那种5人8天60集的案例,更是把传统数月的周期压缩到了几天。
但也要看到,在满足专业影视级制作的深度和稳定性上,即梦和可灵还有不小的提升空间。有创作者指出,即梦目前还做不到长叙事的稳定输出,一旦超过一分钟,短板就会暴露出来,“对于复杂空间和高密度的情绪表达也不太擅长,面部表情不够细腻,比如微笑表现得太急促或不到位,还是得靠真人演员。”此外,即梦暂不支持真人人脸参考和IP形象生成,也限制了专业团队的使用效率。Seedance2.0最近还遇到排队和“降智”的问题:高峰时段排队要8-10小时;同样的提示词,现在出来的效果比刚发布时明显差了一截,理解力下降,前后一致性也不够。
03 赚钱的速度能否追上烧钱的速度?
无论是在用户规模还是行业声量上,即梦和可灵都已经坐稳国内头部的位子。但技术领先不等于商业成功——当推理成本盖不过收入时,再酷炫的技术也撑不下去,Sora的关停就是前车之鉴。即梦和可灵必须尽快证明,自己不仅能圈用户,更能持续赚钱。
最近一个月,即梦已经连续涨价三次。从3月上调积分消耗,到上线Seedance2.0 VIP会员专属通道、在原有会员基础上再收加速费,再到4月8日继续提价并削减赠送积分。对即梦来说,C端用户越多,API并发压力越大,但创造的价值却有限。把算力卖给能付得起钱的企业客户,才能建立起可持续的商业模式。所以即梦一边涨价,一边开放API——4月2日火山引擎开放Seedance2.0 API公测,4月14日全面上线,企业客户可以直接购买批量调用能力。
但涨价不可能没有代价。频繁调价直接影响了用户体验,吐槽声四起。有创作者算了一笔账:即梦月卡会员从299元涨到499元,生成一条10秒素材的成本从0.6元飙升到6.67元,涨幅超过10倍。与此同时,排队时间也暴增,即便是VIP会员,凌晨时段也要等好几个小时。涨价本质上是在用价格筛选用户,让愿意付高价的留下。这种“控流”虽然能缓解算力压力,但也在无形中给对手留出了空间。
比如4月突然冒出来的Happy Horse,号称720P视频每秒钟只要0.44元,1080P是0.78元/秒。而且通过阿里云调用Happy Horse的API没有任何门槛。阿里ATH创新事业部之前对外说,4月底开放测试后,HappyHorse-1.0会在5月正式商用。
与此同时,可灵选择了降价策略。一方面是为了在Seedance2.0的冲击下守住P端用户,另一方面也是想用性价比吸引更多专业用户和潜在付费群体,为B端企业服务的规模化铺路。只不过,降价到底是解决问题还是制造新问题,还不好说。可灵之前能实现规模化盈利,靠的是高ARPU值的付费用户来覆盖算力成本,用户结构以高价值付费群体为主。用低价吸引来的用户,不仅付费意愿低,还会带来巨大的API并发压力和算力消耗,推高运营成本。
和字节相比,快手的算力底子并不占优。快手自有的公有云基础设施比较薄弱,而AI视频生成又是一个重资产赛道。算力缺口意味着可灵未来可能更多要靠第三方云服务,其商业化收入的一部分会以算力账单的形式流出去。如何才能在低价拉新、算力投入和盈利预期之间找到一条可持续的路,是快手眼下最棘手的难题。
根据快手2025年财报,可灵全年营收10.4亿元,只占总营收的0.73%。快手计划2026年新增110亿开支来支撑可灵的算力。财报发布第二天,快手股价大跌14.04%。可灵对快手的意义早已不只是收入来源:它既承载着资本市场的想象力,也是给主业创造增量的重要因素,是快手在AI时代的一张“船票”。所以即便冒着利润受损的风险,快手也要咬牙继续加注。
不过,AI视频赛道的竞争从来不是静止的。技术迭代、资本预期、监管政策、玩家格局的每一次变化,都可能改写现有的平衡。今年OpenClaw的大火就是一个重要变量。在AI视频领域,未来的创作流程可能不再是人类直接操作视频生成模型,而是由Agent调用一系列专业化Skill来完成——从脚本生成、分镜设计、视频生成到后期剪辑,每个环节都可以封装成被Agent调用的标准化能力。
这对即梦和可灵既是机会也是威胁。机会在于,如果它们能把视频生成能力封装成Agent可调用的Skill,就能嵌入更广泛的企业工作流;威胁在于,一旦视频生成变成Agent生态中一个可被替换的模块,用户的忠诚度将取决于API的性价比和稳定性,而不是产品自身的品牌黏性。
AI视频赛道没有永远的赢家,只有永不间断的赶考者。
夜雨聆风