扔篇小说进去,AI直接给你吐出一部短剧
前段时间我不是一直想折腾 AI 视频吗。
想着现在模型都这么猛了,按理说做个“小说转短剧”的流水线,应该也没那么难吧?
结果真上手之后才发现,难。
而且不是那种“努力一下就能搞定”的难,是那种你刚把剧本拆完,角色又崩了;角色刚稳一点,镜头又乱了;镜头刚能看,配音又不像人说话了。
最后做出来的东西,怎么说呢。
能跑。
但不太能看。
直到我顺手问了下 DeepSeek,想看看有没有类似的开源项目可以参考一下。
结果它给我丢出来一个东西。
我点进去一看。
好家伙。
这不就是我一直想要的那条流水线吗?
而且更离谱的是,这项目才上线没多久,官方仓库已经冲到 11.8k stars。
一个月左右,这个速度,真不是一般热闹。
更反差的是,它不是哪个大厂 AI 团队攒出来的,也不是一堆人憋了半年搞的商业产品。
作者自己说得很直白:
目前只有我一个人开发,存在部分 bug 和不完善之处。我们正在快速迭代更新中!
一个人。
做出一个小说进、短剧出的开源项目。
我看到这里已经有点沉默了。
不是被震惊到说不出话,是那种:
“哥们,你把我想做但没做成的东西,直接端上来了?”
1

这个项目到底能干啥
The First Touch of AI Drama
简单说,它叫 waoowaoo。
你可以把它理解成一个开源的 AI 漫剧 / 短剧生产线。
别被这个说法吓到,其实它的逻辑很直白:
你给它一段小说,或者一集剧本文本。
它帮你自动拆。
拆角色、拆场景、拆剧情、拆分镜。
然后继续往下跑。
生成人物图,生成场景图,生成视频,生成配音,再把这些东西合起来。
最后给你吐出来一段完整的短剧视频。
听起来像吹牛是吧。
但它的目标确实就是这个。
以前你想做一条 AI 短剧,基本要会好几门手艺。
你得会写故事。
得会把故事拆成镜头。
得会写提示词。
得会盯着角色一致性,不然上一秒还是霸总,下一秒就变成隔壁卖烤冷面的。
还得会剪辑、配音、合成。
中间随便一个环节掉链子,最后成片就很灾难。
而 waoowaoo 这个项目最打动我的地方,不是它说“我能生成视频”。
现在能生成视频的工具太多了。
真正要命的是,它在尝试把“短剧生产”这件事流程化。
也就是,你不用每一步都靠手搓。
它会先理解文本,再根据剧情去维护角色和场景。
同一个角色,不同镜头里尽量保持一致。
同一部剧,不要一会儿赛博朋克,一会儿古早言情影楼风。
这点很关键。
AI 视频最大的问题,从来不是“能不能动”。
而是“动起来之后还像不像同一部片”。
2
为什么我看到它会这么激动
The Blooming Season
因为我真的被现有工具折磨过。
比如我一直在等即梦这种平台,什么时候能把漫剧流水线做出来。
不是单纯生成一张图、一段视频,而是从文本到成片,帮你把角色、分镜、场景、配音都串起来。
但等来等去,它就是不上。
小云雀倒是有类似方向的功能。
可问题也很现实。
积分消耗快,提示词又不好控。
你想稍微细一点,就发现自己还是得亲自下场,一遍遍改,一遍遍试。
试到后面,钱包和耐心一起见底。
所以我一直想要的东西其实很简单:
一个我能自己控制的短剧工作台。
剧本可以交给创作能力强的大模型。
角色形象可以统一管理。
画风可以稳定下来。
视频模型可以自己选。
不要被某个平台的限制卡住。
更不要每生成一次都像抽盲盒。
waoowaoo 吸引我的点就在这。
它不是把你关在一个固定平台里,而是让你自己配置 API 服务商,按需接入模型。
你想用哪个大模型、哪个图像模型、哪个视频模型,至少在流程上有得选。
这种“可控感”,对做内容的人来说太重要了。
有时候不是工具不强。
是工具太封闭。
你想往左,它偏往右。
你想要真人脸,它告诉你暂不支持。
你想统一角色,它给你现场表演一个“转世投胎”。
真的,AI 创作者最怕的不是慢。
是不可控。
慢一点还能等。
不可控就只能骂。
3

部署这块,没有想象中吓人
The Practical Part
当然,它毕竟是开源项目,不是打开网页就能直接点两下开干的那种。
你需要部署。
但也没有到“非程序员勿入”的程度。
大概流程就是先装 Docker。
如果你之前玩过一些本地 AI 项目,或者用过类似小龙虾这种工具,对命令行应该不会太陌生。
苹果电脑可以用 Homebrew 装 Docker:
brew install --cask docker
装完之后记得打开 Docker,授权、更新、重启,该点的都点一下。
然后把项目拉下来:
git clone https://github.com/saturndec/waoowaoo.git
后面如果要更新项目,就进目录执行:
git pull
跑起来之后,看 Docker 里相关服务状态正常,基本就差不多了。
本地访问地址是:
http://localhost:13000
第一次进去需要注册账号密码。
这个密码自己记好。
别到时候项目跑起来了,人进不去了,那就很尴尬。
进工作台之后,比较重要的是去 设置中心 – API 配置。
这里要填你自己的模型服务 API。
作者这块做得还挺细,有添加模型的教程,也可以快速测试接口是否可用。
这个细节我挺喜欢。
很多开源项目最大的问题就是:项目很强,文档像谜语。
你照着配半天,不知道到底是你错了,还是它坏了。
这里至少能测一下,心里有底。
4
真正开始做短剧,重点不是“点生成”
The Moment of Creation
新建项目,起个名字。
然后你就可以丢文本了。
来源里作者的玩法也挺真实:没灵感,直接让 DeepSeek 先写一个剧本。
DeepSeek 很快给了一套 20 集的剧本。
然后把第一集复制进去,点开始创作。
这一步之后,waoowaoo 会开始分析内容。
它会把故事里的角色、场景、情节关系拆出来。
你会看到它不是简单把文本塞给视频模型,而是在前面先做结构化处理。
这就是这类工具和普通“文生视频”的区别。
普通文生视频更像是:
“给你一句话,来,猜吧。”
而短剧生产线更像是:
“先把剧本理解清楚,再把角色和镜头管理起来。”
这一步看着没那么酷,但非常重要。
因为短剧不是单镜头炫技。
短剧要连续。
连续就意味着角色要稳定,场景要稳定,叙事要能接上。
你不能第一幕女主穿白裙,第二幕变黑甲,第三幕突然长出猫耳。
除非这是剧情需要。
不然观众只会想:
你这剧组是不是昨天刚被 AI 入侵了。
waoowaoo 的思路,就是先给角色建档案。
人物外貌、风格、相关描述都尽量固定下来。
后续镜头再围绕这些档案生成。
这不能保证百分百完美,毕竟作者也说了还在快速迭代,可能有 bug,也有不完善的地方。
但方向是对的。
AI 短剧想真正可用,就必须解决一致性。
不然再高清也没用。
画面再好看,人物一直换脸,观众一秒出戏。
5

成本也别装看不见
The Last Whisper of Reality
这里也说点现实的。
开源免费,不等于你做视频完全不花钱。
项目本身是开源的,你可以部署,可以改,可以自己控制流程。
但你接入的大模型、图像模型、视频模型,如果是调用第三方服务,通常还是会产生费用。
尤其视频模型。
真的烧。
这点别幻想。
你可以把它理解成:
waoowaoo 给了你一套厨房。
锅碗瓢盆、动线、菜单流程都给你搭好了。
但食材和燃气,还是要你自己准备。
所以如果你要认真跑短剧,建议先小段测试。
别一上来就丢十万字小说进去。
先拿一集,甚至先拿一小段剧情跑通。
看看角色是不是稳。
看看画风是不是你要的。
看看配音节奏能不能接受。
看看视频生成成本你能不能扛。
能接受,再放大。
别上头。
AI 工具最容易让人上头的地方就是:它给你一种“马上就能发财”的错觉。
但真正能用起来的人,一般都不是只会点生成的人。
而是知道怎么控制流程、怎么试错、怎么省成本的人。
6
它适合谁
A Tool for Creators
如果你是短视频创作者,尤其对小说改漫剧、口播短剧、剧情号有兴趣,这个项目值得看。
如果你是 AI 工具玩家,喜欢研究开源项目,它也值得装起来试试。
如果你是开发者,想看 AI 视频工作流怎么串,这个项目同样有参考价值。
但如果你完全不想碰部署、不想配 API、不想看 Docker,也不想承担模型调用成本。
那你可能会觉得它还是有点折腾。
这很正常。
开源项目的快乐,本来就不只是“省钱”。
更大的快乐是可控。
你能看到流程。
你能换模型。
你能自己调。
你不会被某个平台一句“暂不支持”直接按死。
对内容创作者来说,这种自由度真的很香。
尤其现在 AI 视频发展太快了。
今天还在手搓分镜,明天可能就有新的模型把某个环节干掉。
如果你的工作流是开放的,你就能跟着换。
如果你的工作流全锁在某个平台里,那就只能等它更新。
等它大发慈悲。
写在最后
END OF AI DRAMA

这次看到 waoowaoo,我最大的感觉不是“AI 又要取代谁了”。
而是个人创作者的工具箱,真的越来越夸张了。
以前一个人想做短剧,剧本、分镜、美术、配音、剪辑,哪一个都够喝一壶。
现在至少已经有人在尝试,把这些环节串成一条能跑的流水线。
它现在肯定还不是完美状态。
作者也说了,一个人开发,还会有 bug,还在快速迭代。
但一个月冲到 11.8k stars,说明大家确实需要这个东西。
不是因为它已经完美。
而是因为它踩中了创作者最痛的地方:
我有故事。
我有想法。
但我不想每一步都从零手搓。
如果你之前也被 AI 视频项目折磨过,被角色一致性气过,被平台限制卡过,被积分消耗吓过。
那这个项目可以去看看。
不一定立刻拿来商用,也别幻想一键暴富。
但作为一个开源 AI 短剧流水线,它已经挺有意思了。
有种春天刚冒芽的感觉。
看着还嫩,但你知道它后面会长得很快。
而我们这些做内容的人,最好别等到满城花开了,才想起来出门看一眼。
夜雨聆风