前两篇聊完「我们在做什么」和「能不能赚钱」,后台出现频率最高的三个字你知道是什么吗。
"用什么?"
行吧。这篇就把我的工具箱全部摊开。从头到尾,做一集AI漫剧到底要用哪些东西。不是那种「推荐100个AI工具」的流水账——只列我实际在《被迫营业的仙尊》里用过的。没用过的不瞎说。
剧本:别一上来就AI,先自己写
这一块我走了弯路所以先说。
最开始我也是把《被迫营业的仙尊》大纲丢给AI让它写剧本。结果出来的东西怎么说呢——每一集都像上一集,人物说话像在做汇报,笑点全是谐音梗。两个星期废了四版,最后我做了个很笨的决定。
自己写。
不是说AI写剧本不行。是你得先有一集你自己写的「锚定版」。这集里有人物的说话节奏、有你觉得好笑的点、有你想要的转场方式。然后你把这个丢给AI说「照着这个味来」,它就跑不偏了。
我现在剧本部分的工具流是这样的:
初稿:自己写。手机备忘录敲也行,语雀也行。重点是写出「人味」——人物会说人话,而不是「启禀仙尊,灵脉异动」。
扩写和变体:把初稿丢给Claude或者ChatGPT。关键是指令得写对——不是「帮我写一集仙侠短剧剧本」,而是「这是我写的第X集,按照这个节奏和人物语气,帮我写出第X+1集的三种可能走向」。第一种跟我的风格一样,第二种加一个意外反转,第三种走搞笑路线。然后我来挑,我来改。
分镜拆解:剧本写完要把每句台词对应到画面。这个我目前还是手动。试过几个AI分镜工具效果都不好——它不知道你图片生成能出什么效果。这个暂时没有捷径。
时间成本:剧本+分镜,一集约3-4小时。第一集花了两天,现在熟了快很多。
画面:这个才是AI真正干活的环节
做漫剧不像做真人短剧。你不用架机器、不用找演员、不用等天气。你唯一的生产资料就是AI出图能力。
我目前画面这头的工具链长这样:
角色定妆照 → Midjourney / Stable Diffusion
先用MJ跑出主角的形象。这一步很重要——你得先锁定每个角色的「定妆照」。正面、侧面、全身、半身各一张,表情包也来一套。以后每一集所有角色的镜头都从这一套定妆照衍生。
MJ的好处是画质稳、审美在线。缺点是你得花钱。一个月三十美金的基础套餐差不多够用——我一般集中两天把一个角色的全部角度跑完,然后切Stable Diffusion做后续。
批量出图 → Stable Diffusion + ControlNet
定妆照有了以后,每一集需要什么画面就靠SD跑。比如这一集有27个镜头,每个镜头的画面描述丢进去,配上角色定妆照做参考图,跑出来挑最好的。
SD最大的好处是可以本地部署不花钱。但你的显卡要好——我用的是一块4090,跑一张图大概3秒。如果你显卡不够,可以考虑云端方案(AutoDL、仙宫云这些,按小时租GPU,一小时一块五到三块钱不等)。
ControlNet是SD的一个插件,用来控制角色一致性。简单说就是告诉AI「这个人的脸长这样,别给我瞎画」。但说实话,就算开了ControlNet,角色完全一致还是做不到。有时候眼睛突然变大,有时候发型自己变了。这个问题我目前还没有完美解决——每集大概有10%的图要手动修或者重新跑。
画面转视频 → Runway / Pika / 可灵
图片跑完了,得让它动起来。
Runway Gen-2:画面质量最高,但贵。一个月标准套餐15美金,只够做150秒视频。一集漫剧三分钟,光画面就超了。所以我现在只在关键镜头用Runway——打斗、特效、情绪高潮。
Pika:便宜,免费额度就够用。但画面质量不如Runway稳定。日常对话、走路、场景切换这些普通镜头我用Pika。
可灵:快手的那个。优点是中文界面、操作简单,缺点是有些画面会莫名其妙糊。我一般当备选,前两个出问题的时候顶上。
配音:这个环节最容易被低估
画面做好了,声音不行就全毁了。观众对声音的容忍度远低于画面——画面糊一点可以理解为「风格」,声音一劈叉直接划走。
我目前用的是剪映的自带配音。免费,声音选择也够多。仙尊用沉稳男声,女主用清冷女声,配角用一些有辨识度的音色,差不多能分出三四个人来。
但问题也有。剪映的配音你没办法精细调语气——同一句话说三遍都是一个调。情绪激动和情绪低落语气完全一样。我现在只能靠BGM和音效来弥补。
试过微软Azure的TTS和ElevenLabs。前者声音更自然但申请麻烦,后者能克隆音色但贵——一个月基础版就22美金。以我现在《被迫营业的仙尊》的体量还用不起。以后如果真跑通了可能会切过去。
音效和BGM:全部用剪映自带素材库。够用。别在音效上花大钱,观众分不出来你用的付费版还是免费版。
剪辑:把一切都拼起来
最后一环。画面有了、配音有了、音效有了,得把它们码在一起。
我现在全用剪映。没别的理由——便宜、上手快、够用。PR我也装了但基本没打开过。做漫剧又不是做电影,剪映的字幕功能、转场效果、画面裁切完全够用了。
唯一要提的是导出参数。抖音和B站对画质要求不一样——抖音1080P就够了,B站建议2K以上。我现在每集单独导两版,参数表贴在剪辑文件夹里免得每次重设。
[配图:剪映剪辑时间线截图,显示音视频轨道的分布]
整条工具链拉下来,做一个月的AI漫剧,工具花费大概是这样:
Midjourney月费:30美金 Runway月费:15美金 剪映SVIP:79块人民币/月 云端GPU(偶尔用):大概50块
总共差不多350块一个月。不含你的人工。你自己的时间是无价的,也是这条链子上最值的一环。
好了。工具都摊完了,下一篇是周三的《被迫营业的仙尊》第一集制作全记录——从第一个画面到最后一帧,每一步怎么走的、哪里出了问题、花了多少时间。不写字了,上视频截图。
漫剧小贴士:工具只是锤子。你拿锤子敲什么,才是你的事。
评论区跟我说说:你手上有哪些工具已经在用了?哪个环节你觉得最难啃?剧本、画面、配音、剪辑,四选一。我统计一下,下一篇继续聊。
关注回复【工具包】,领我整理的AI漫剧工具清单(含所有工具的官网链接和基础教程)
夜雨聆风