AI漫剧制作全流程拆解:从选文到成片的9步实操指南
最近刷短视频,你会发现一个趋势——AI漫剧的产量正在肉眼可见地暴涨。
抖音、快手、B站,到处都是用AI生成的动漫短剧内容,有些播放量甚至能跑到百万级。
评论区最多的问题就一个:
“这东西到底怎么做出来的?我也想试试。”
今天就帮你把这件事从头到尾拆清楚。
不是概念科普,不是工具堆砌,而是一套真正能从0跑到1的实操流程。



很多人一上来就打开AI绘图工具开始生成角色,结果画了半天发现——根本串不起来。
AI漫剧的本质是“用视觉讲故事”,而故事的前提是你得先有一个故事。
所以正确的起步顺序是:选文 → 拆剧本 → 拆分镜 → 做角色/场景 → 出图 → 出视频 → 配音 → 剪辑。
这8个环节,缺一不可,顺序也不能乱。
下面按顺序,一个个讲。


不是所有小说都适合做漫剧。
最适合新手的,是那种“冲突明确、人物少、画面感强”的短片段。
比如一段校园剧情的开头:男生宿舍楼下突然来了个女生,所有人炸锅了——这种场景天然自带戏剧张力,人物关系一目了然,镜头也很好拆。
不需要选整篇小说,拿开头300-800字就够了。
漫剧的关键从来不是字数多少,而是情节节点够不够清晰、人物反应够不够鲜明。


小说和剧本是两套完全不同的语言体系。
小说靠大段描述营造氛围,剧本要的是:场景、人物、对白、动作、情绪、转场。
这一步建议直接交给DeepSeek来做,给一个编剧角色的提示词,让它帮你把小说片段转成标准短剧剧本格式。
输出内容包括出场人物、场景编号(场号+场景名+内外+日夜间)、舞台指示和台词。
一个合格的漫剧剧本,每集控制在1分钟左右,场景不超过5个,人物不超过4个。
场景太多,AI生图和视频的工作量会暴增;人物太多,角色一致性更难维持。


剧本解决的是”演什么”,分镜解决的是”怎么拍”。
AI漫剧最终呈现的是一张一张具体的画面,这些画面对应的就是分镜。
这一步同样可以用DeepSeek完成,给它一个”20年资历导演/分镜设计师”的角色提示词。
拆分镜有几个核心原则需要遵守:
-
情绪转变必须切镜。 角色从平静到震惊、从冷漠到微笑,每一次显著的情绪变化都需要独立镜头来呈现。 -
复杂动作要拆成3-5个步骤。 比如喝水不是”他喝了口水”一个镜头搞定,而是伸手→拿水→喝水→放下,分3-4个镜头。 -
对话要遵循”视线乒乓”逻辑。 说话者→聆听者→说话者,每次发言者切换都要触发镜头切换。
一个实用技巧:在分镜表格里直接加一列“AI画面提示词”。
这样后面出图时不用重新整理,直接复制粘贴就能用,效率提升至少一倍。


进入视觉阶段了。
这一步的核心目标就一个:把所有角色的形象“定”下来。
角色设计就像给一部戏选演员。
一个角色后面会反复出现几十次,如果形象不稳定,整条漫剧的观感会非常割裂。
建议用即梦(jimeng.jianying.com)生成角色参考图,标准配置是一张脸部特写加一套三视图(正面、侧面、背面)。
主角要做,女主要做,重要配角也要做。群演就不需要单独设计了。
场景图有一个铁律:画风必须和人物保持统一。
人物是日系2D风,场景就不能偏写实;人物是水彩风,场景就不能是厚涂。否则合成之后会非常违和。
场景图同样可以用即梦生成,生成时把角色参考图放进去做风格参考,一致性会好很多。



分镜表格准备好之后,这一步就是把它”翻译”成画面。
核心原则是:每一个镜头的生成都要参考前面三样东西——角色参考图、场景参考图、分镜提示词。
不是随便输入一段描述然后从结果里挑一张,而是把提示词和参考图结合起来,让AI在既定的视觉框架内生成画面。
第一次生成不满意很正常,继续抽卡、继续调整提示词,直到得到一张能用的。
新手最容易犯的错是:急着往下走,没把单张画面调好就进入下一步。
单张画面质量不过关,后面做成视频只会放大问题,不会掩盖问题。


静态分镜图有了,下一步就是让它动起来。
操作思路很简单:给AI一段运动描述,告诉它画面里的元素该怎么动。
比如:”阳光角度缓慢变化,风吹拂衣服,镜头向左平移”;或者”女生往前走,树叶和头发随风飘动”。
描述的关键是:说清楚“谁在动、什么在动、镜头怎么动”。
不需要写得很复杂,基础的运动描述就能出不错的效果。
即梦目前支持图生视频,生成之后还可以在右下角点”AI音效”自动补环境音效,省去了后期单独找音素材的麻烦。


画面和视频都有了,最后缺一个关键元素:声音。
推荐用dubbingx(dubbingx.com)做AI配音。
把角色台词输入进去,选一个合适的音色,导出即可。
唯一要强调的是:同一个角色的音色必须前后一致。
观众对声音的敏感度远超想象。一旦角色前后音色不统一,代入感会断崖式下跌。
所以建议在配音阶段就把每个角色的音色”锁”下来,记在文档里,后续每一集都用同一个音色。


所有素材都准备好了,最后一步就是剪辑。
工具用剪映就够了,把分镜图、视频片段、配音、环境音效、BGM全部导进去。
这一步拼的不是技术,是节奏感。
画面和声音要对应,转场要自然,BGM的情绪起伏要和剧情节点吻合。
先粗剪把整体结构搭起来,再细调每个镜头的时长和转场效果,一条完整的AI漫剧就出来了。


选小说片段 → 拆剧本 → 拆分镜脚本 → 角色设计 + 场景设计 → 逐镜生成分镜图 → 图生视频 → AI配音 → 剪映合成
八个环节,环环相扣。每个环节都有对应的AI工具可以帮你完成。
以前这套流程需要一个团队协作,现在一个人加几台AI工具就能跑通。
当然,AI不能保证每一步都一次到位,但它确实把很多原本高门槛的工作压缩成了可以反复迭代的过程。
所以做AI漫剧这件事,真正卡住大多数人的从来不是工具——
而是有没有按流程动手,把第一条片子做完。


|
|
|
|
|
|
DeepSeek |
|
|
|
即梦 |
|
|
|
即梦 |
|
|
|
即梦 |
|
|
|
即梦 |
|
|
|
dubbingx |
|
|
|
剪映 |
|

夜雨聆风