还在手动搓视频?这款全自动开源AI工具彻底解放双手
如果你最近也在做 AI 视频,大概率会被同一件事折磨过:
每一帧都要抠,每一句提示词都要磨,每个角色都像随机投胎。
上一秒还是霸总脸,下一秒突然变成隔壁健身教练。
上一镜头是赛博都市,下一镜头直接穿越到古风客栈。
你说它不能用吧,它确实能出图;你说它能用吧,剪到最后人都快裂开了。
更别提有些商业工具,一会儿限制真人人脸,一会儿积分刷刷掉,一会儿又要你自己写一堆复杂提示词。
做个小说推文、短剧切片、漫画视频,结果变成了大型人类耐心测试。
直到看到这个开源项目:waoowaoo。
真的,有点“夏天突然喝到冰汽水”的感觉。
不是那种只给你画两张图的小玩具,而是直接冲着 AI 漫剧全自动流水线 去的。
你把小说文本丢进去,它负责拆剧情、拆角色、做分镜、生成画面、合成视频、匹配语音。
说白了就是:
从文字到短剧,一条龙。
更离谱的是,它还是开源的。
GitHub 上已经到了 11.8k stars,而且项目今年 3 月才正式上线。
这速度,多少有点猛。
1

从手搓视频,到自动流水线
The First Touch of Automation
以前做 AI 视频,最痛苦的地方不是“不会剪辑”。
真不是。
剪辑软件学一学,总能会一点。
真正要命的是:
你要把一个故事,拆成 AI 能听懂的东西。
比如一段小说里写:
女主推开会议室的门,所有人都安静下来,男主抬头看了她一眼。
人看着很简单,对吧。
但你要让 AI 做视频,就得想一堆东西:
女主长什么样?
会议室是什么风格?
男主坐在哪里?
镜头是近景还是远景?
灯光是冷色还是暖色?
人物表情怎么写?
这一幕要不要加旁白?
下一幕怎么接才不跳戏?
然后你开始写提示词。
写完第一条,第二条又要保持一致。
第三条角色脸崩了。
第四条场景跑偏了。
第五条你开始怀疑人生。
哈哈,懂的都懂。
这就是为什么很多人看 AI 视频很兴奋,真正上手做两天之后,直接沉默。
不是不想做。
是太碎了。
碎到你感觉自己不是创作者,而是 AI 的临时保姆。
waoowaoo 这个项目最爽的点,就在这里。
它不是让你一张一张图去生成,而是把“故事生产视频”的过程,尽量做成一条流水线。
你给它一段小说或剧本,它会先去理解内容。
然后自动拆出角色、场景、剧情节点。
接着生成统一风格的人物和场景图。
再往后,就是视频合成、角色配音这些流程。
当然,不是说你丢进去就能 100% 出电影级作品。
别误会。
但它把最折磨人的那部分,真的往前推了一大步。
尤其对做小说推文、AI 漫剧、短剧出海、剧情号的人来说,这种工具的意义很直接:
不用从零开始搓每个镜头了。
2
最难的不是生成,而是一致
The Blooming Season of AI Video
AI 视频现在最烦人的问题是什么?
不是“它不会动”。
而是:
它太会自由发挥了。
自由到有点吓人。
你让它生成一个黑发女主,它第一张图很正常。
第二张图刘海变了。
第三张图衣服换了。
第四张图脸型不一样了。
第五张图直接像换了演员。
这还只是人物。
场景也一样。
明明是同一个办公室,AI 每次都给你装修一遍。
今天极简现代风,明天豪门宫殿风,后天像网吧包间。
观众一看就出戏。
这就是 AI 漫剧里最核心的难点:角色一致性、画风一致性、场景一致性。
waoowaoo 的思路比较清楚。
它会根据剧本自动给角色建立形象档案。
也就是说,它不是每个镜头都重新“猜”一遍人物,而是尽量让同一个角色在不同镜头里保持统一。
你可以理解成,它先把演员表、人物设定、场景设定整理出来,再去推进后面的画面生成。
这个逻辑很关键。
因为短剧不是单张海报。
短剧要连续。
观众要知道这个人是谁,要能跟着剧情走。
如果角色一会儿像 A,一会儿像 B,剧情再爽也没用。
看着看着就开始出戏:
“这人谁啊?刚才那个女主呢?”
所以它能自动做角色档案、自动拆分场景、自动生成分镜,这就比单纯的 AI 生图工具更接近“生产系统”。
这也是它为什么能让人眼前一亮。
不是因为它多会炫技。
而是它真的在解决创作者每天都会撞上的墙。
3

本地部署,才是它真正香的地方
The Last Whisper of Manual Editing
还有一点很重要:
它可以本地部署。
对很多极客和开发者来说,这四个字就已经很有吸引力了。
商业工具当然方便。
打开网页、上传素材、点生成,省事。
但问题也很明显:
规则你说了不算。
模型你不一定能选。
流程你不一定能改。
积分消耗你也只能看着它掉。
更麻烦的是,有些场景它直接限制。
比如涉及真人人脸时,某些平台可能就会提示暂不支持。
你本来想做一条完整的内容流水线,结果卡在一个小限制上。
那种感觉,真的很难受。
waoowaoo 这种开源项目的好处就在于:
你能把它拉到自己的环境里跑。
流程更可控。
模型配置也更灵活。
项目里可以配置 API 服务商,配置完成后还能测试。
它不是把所有东西藏在黑盒里,而是尽量把入口给你留出来。
当然,这里也要说句实话。
本地部署不是完全无门槛。
你至少要能接受 Docker、命令行、API 配置这些东西。
如果你之前完全没碰过,刚开始可能会有点懵。
但它的部署流程并不算离谱。
大致就是:
下载 Docker。
拉取项目仓库。
启动服务。
打开本地地址。
注册登录。
进入工作台配置 API。
然后开始创建项目。
跑起来之后,看到服务正常运行,那一下还是挺爽的。
有种“这条生产线终于归我管了”的感觉。
不过也别把它想成完全免费的魔法。
开源项目本身可以拿来部署,但你调用大模型、图像模型、视频模型时,具体成本要看你接入的服务。
尤其视频生成,通常都不算省。
所以更准确地说,它给你的不是“零成本生产”,而是:
把原本分散、痛苦、不可控的流程,整合成一个你能掌控的系统。
这个价值很大。
4
丢进一段剧本,它开始自己拆活
A Story Becomes a Short Drama
真正开始用的时候,流程就很像做一个项目。
先新建项目。
给项目起个名字。
然后把准备好的小说或剧本文本放进去。
如果你一开始没灵感,也可以先用大模型生成一段短剧脚本。
比如职场逆袭、都市悬疑、爽文反转、出海短剧常见的强冲突题材,都可以先拿来试水。
文本放进去之后,它会开始分析故事。
这里就有点像一个自动编导在干活。
它会把故事里的角色捞出来。
把关键场景拆出来。
把剧情推进拆成镜头。
然后你会看到整个内容开始变得“结构化”。
这一步很重要。
因为很多人做 AI 视频失败,不是审美不行,而是故事没有被拆成可执行的镜头。
文字是流动的。
视频是一个一个镜头拼起来的。
中间这个转换,以前基本全靠人脑。
现在它帮你做一大半。
你需要做的,更像是检查和调整:
角色设定对不对?
场景有没有跑偏?
镜头顺序是不是合理?
画风是不是统一?
模型配置有没有选好?
确认没什么大问题,就可以继续往下跑。
后面的过程,说没技术含量可能有点夸张,但确实比以前轻松太多。
以前是你追着 AI 跑。
现在更像 AI 在前面铺路,你在后面把方向盘扶稳。
这区别太大了。
5
它适合谁?不是所有人,但有几类人会很爱
Who Needs This Pipeline

如果你只是偶尔做一张 AI 图,发朋友圈玩玩,那它可能有点重。
没必要上来就部署一套流水线。
但如果你是下面这几类人,就很值得看一眼。
做小说推文的人
小说推文现在卷得很厉害。
以前一张封面、几段字幕、一个配音还能跑。
现在大家都想做得更像短剧,更有画面感。
但手动做图、手动分镜、手动配音,真的很耗时间。
如果能把小说文本直接变成一套可用素材,哪怕后期再人工精修,也能省掉很多重复劳动。
做 AI 漫剧的人
漫剧最怕角色崩。
一崩就廉价。
waoowaoo 这种自动角色档案和统一风格的思路,刚好戳中痛点。
它不一定每次都完美,但方向是对的。
做短剧出海的人
出海短剧讲究效率。
题材测试、脚本测试、画风测试,都需要快速跑样片。
如果每个样片都手动搓,成本太高。
一条自动化流水线,至少可以帮你更快做原型。
先看故事、节奏、画风有没有机会,再决定要不要投入更重的制作。
对开源 AI 感兴趣的开发者
这个就不用多说了。
开源、可部署、可配置模型、流程化生产,这几个关键词放一起,本身就很适合研究。
不管你是想学习 AI 视频流水线,还是想二次开发自己的工具,它都有参考价值。
6
别神化,但它确实打开了一扇门
From Tool to Workflow
还是要冷静一点。
waoowaoo 不是万能的。
项目还很新,实际使用中可能会遇到 bug,也可能有不完善的地方。
生成质量也会受到你接入模型、脚本质量、配置方式的影响。
如果你指望它一键产出院线大片,那肯定不现实。
但如果你把它看成一个“AI 短剧生产框架”,那它就非常有意思。
因为它解决的不是单点能力。
不是只会写文案。
不是只会画图。
不是只会配音。
它想做的是把这些环节串起来。
这才是未来内容生产真正会变化的地方。
以前一个人做短剧,得会写、会画、会剪、会配音、会调模型。
现在工具开始把流程搭起来。
人的角色就会从“苦力型执行”,慢慢变成“导演型控制”。
你负责判断故事好不好。
判断人物立不立得住。
判断镜头有没有情绪。
判断成片能不能让人看下去。
剩下那些重复、琐碎、磨人的步骤,尽量交给系统。
这才是真正让人兴奋的地方。
不是 AI 替你创作。
而是它终于开始替你干脏活累活了。
结尾
从手动搓片,到一键开工
A New Season for Solo Creators

现在回头看,AI 视频最早给人的感觉像春天刚冒头的芽。
大家都觉得有希望,但用起来很别扭。
画面会崩,角色会飘,流程会断。
很多想法只停在脑子里,真要落地就卡住。
而像 waoowaoo 这样的开源项目,开始把这些零散能力接成一条路。
它不一定完美。
但已经足够让人感觉到:
个人创作者的生产力,真的被重新放大了。
一个人,也能搭一条自己的 AI 漫剧流水线。
一个小团队,也能快速验证短剧内容。
一个开发者,也能基于开源项目继续往前改。
这事放在以前,多少有点夸张。
现在看,反而越来越正常了。
所以如果你还在一条一条手写提示词、一张一张修角色、一段一段拼视频,真的可以去看看这个项目。
不一定立刻拿来商用。
但至少值得跑一遍。
因为你会很直观地感受到:
AI 视频这件事,已经不只是“生成一个片段”了。
它开始往真正的内容工业流水线走了。
而开源,把这条路直接铺到了普通人面前。
这才是最爽的地方。
夜雨聆风