从 0 手搓 AI 漫剧:带你 1 小时出片


AI 漫剧太火了
小堡花了一周时间,啃完一个万星开源 AI 漫剧项目 waoowaoo,硬生生总结出一条简化流程。
这篇不讲大词,只讲一条真实跑通过的最小流程。并且文末调研了 AI 漫剧行业报告,让你了解这个行业真实的情况。
全文包含11 个可直接复用的提示词,累计近7000 字,覆盖从剧本到后期的完整链路。
照着走,你也能做出自己的第一条 AI 漫剧。
准备好了吗?我们开始吧!
本文为节选,完整版见:(完整版)从 0 手搓 AI 漫剧:带你 1 小时出片

-
一条 AI 漫剧是怎么被”拼”出来的 -
第一步:剧本,一个完整的故事 创意 写剧情大纲 设定角色和剧情弧 写每一集的可拍文本 -
第二步:资产,视觉的一致性 角色资产图 场景资产图 道具资产图 -
第三步:分镜,把文字故事拆成镜头 剧本输入 分镜生成:写每个镜头的提示词 文生图:生成多宫格分镜图 -
第四步:镜头视频,让分镜图动起来 准备输入材料 生成视频提示词 提交视频生成 检查和返工 -
第五步:后期,最后成片靠的是人工判断 -
最容易踩的 5 个坑 -
一些感想 -
挣钱吗?看看报告吧 -
完整提示词 -
写在最后

AI 漫剧的制作是一条高度工业化的流水线,每个环节都能做大量优化。
最简化的流程可以拆成五步:
-
剧本:把一个想法变成完整故事,包括世界观、主角设定、大纲和每集的骨架 -
资产:制作角色、道具、场景的参考图,后续所有镜头都靠它们保持一致性 -
分镜:用 25 格分镜把文字故事拆成具体镜头 -
镜头视频:给每个镜头写视频提示词,分别生成单镜头视频 -
后期:把所有镜头放进剪辑软件,调整节奏、加音效和配乐
先知道全局长什么样,后面就不会慌。
小堡这里也贴一个自己做的样片给大家看看:


做什么
写剧本分四步走:
- 创意
。抠脑壳想点子,或是借助 AI 引导。 - 剧情大纲
。定题材、搭三幕剧、建世界观、选画风,核心是好故事。 - 角色和剧情弧
。设计主角成长轨迹和关键转折。 - 可拍剧本
。带着大纲写可以直接拍摄的可拍文本。
如果你只有一个模糊的想法,可以用下面这个提示词,让 AI 帮你把创意理清楚:
33 lines 1请根据我提供的想法,帮我整理一个 AI 漫剧的项目框架。 2 3我的想法:{简单描述你的想法,例如:我想做一个关于退休杀手在日本开餐馆的故事} 4 5请按照经典的三幕剧结构,帮我输出: 6 ……
千万不要让 AI 替你决定剧情
你的输入越多,AI 输出就越稳定。否则 AI 就会天马行空,拉都拉不住。
因此建议大家多输入一些信息。如果实在不知道写什么,就让 AI 帮你找灵感,但最终还是要你自己拍板。
错误示范:制作一个关于退休杀手在日本开餐馆的故事
正确示范:
4 lines 1世界观:日剧动漫风格,二次元,轻松搞笑,现代社会,地点在日本某个城市, 2主角: 3真名是xxx(取个名字,名字里有”蝶“这个字),家里人都叫她”小蝶“,18-25岁女生,长相可爱甜美,短发,但性格高冷,身材苗条,身高165左右,高挑身材。 4角色背景:出生不详,从小就是当成特工来培养的,帮助xx执行一些顶级秘密活动,她的身份很少有人知道。在经历了某件事(你补充)后,不得不隐退。回归日常生活后,日常职业是xxx,没有家里人,独自一人生活。爱好是枪、弓箭等”射击“,天才枪手,枪法了得。
AI 的输出:
11 lines 1蝶野凛 2同事称呼:小蝶 / 蝶酱
有了框架后,再写剧情大纲:
-
标题 -
一句话梗概 -
三幕剧结构(开场 – 发展 – 收尾) -
关键场景描述
不要一上来就写完整剧本。新手最稳的做法是先写大纲,500-800 字就够了。
AI 也会总结输出全剧的框架:
3 lines 1前天才杀手蝶野凛被降职后,第一次以便利店夜班店员的身份开始普通生活,却把每一件小事都当成秘密任务处理,结果闹出一连串冷脸搞笑事故。 2核心看点:一个冷酷杀手,第一次认真学习“普通人如何上班”。 3……
这一步做完,后面才不会越做越偏。
剧本不是写小说,而是给后续所有步骤一个共同锚点。
大纲够清楚,后面拆镜头才不会乱。
不要试图先把整季的蓝图都画好,再开始做样片。
重要区分:
- 项目策划层
:世界观、总主线、角色弧。这些是长期规划,用来指导整个项目的方向。 - 执行输入层
:第一集或当前样片的可拍文本。这些是短期执行,用来直接生成视频的具体内容。
这样做的好处是:快速验证可行性,避免前期投入过多时间在不确定的规划上。
有了全剧大纲后,相当于给剧本定了个性,后面的设定都在这个”框架”内进行。
最重要的一步就是:角色设定和成长轨迹。
角色设定指的是把第一步里的”主角设定”变得更具体、更立体:
-
基本信息:姓名、年龄、外貌、职业、日常习惯 -
性格特点:表面性格 vs 内在性格、优点、缺点、怪癖 -
背景故事:过去经历、重要事件、人际关系 -
动机驱动:想要什么、害怕什么、信念是什么
角色弧(Character Arc)指的是主角在整部剧中的内心变化:
-
起点:主角刚开始是什么样的人,有什么弱点或恐惧 -
转折点:哪些事件迫使主角改变 -
终点:主角最终成长为什么样的人
用下面这个提示词,让 AI 帮你把角色设定和角色弧一起理清楚(后面可拍文本的重要参考来源):
31 lines 1基于上面的项目框架和剧情大纲,帮我展开角色设定和角色弧: 2 3## 角色设定 4 51. 主角详细信息: 6 - 基本信息(姓名、年龄、外貌特征、穿着风格)
比如我这部主角的设定是:
7 lines 1蝶野凛,22 岁,身高约 165cm,短发,长相可爱甜美,身材高挑苗条。外表像普通城市女孩,性格却冷淡、精准、缺乏日常社交感。 2 3她出生不详,从小被秘密组织培养成特工,长期执行顶级秘密任务,尤其擅长枪械、弓箭和远距离射击,是极少数人知道的天才枪手。 4 5某次暗杀任务中,她发现目标并不是情报里描述的恶人,而是被卷入阴谋的普通人。她第一次违抗命令,心软放过目标,因此被调离暗杀部门,降级到“日常掩护型秘密任务”岗位。 6 7现在她独自生活在日本某座现代城市,表面职业可以设定为便利店夜班店员、射击馆兼职教练,或小型咖啡店员工。她没有家人,同事们叫她“小蝶”,日文是“蝶酱”。
为什么需要这一步
角色设定越详细,后面生成资产图、写分镜、做视频时就越有依据。
角色弧越清晰,每集的事件才能服务于主角的成长,故事才有情感张力。
这一步的本质,是把”抽象的角色概念”变成”具体的人”。
有了大纲和角色弧,就可以写每一集的剧情了。新手最稳的做法是先写可拍文本,而不是完整剧本。
可拍文本需要拆成三个部分:
-
Action(动作):角色的动作、表情、环境变化 -
Dialogue(对白):角色说的话 -
Voiceover(旁白):画外音、内心独白
这样拆的好处是:后续分镜和视频生成时,可以直接复用这些模块,减少重复劳动。
用AI生成可拍文本的提示词:
12 lines 1基于上面的项目框架、剧情大纲和角色设定,帮我生成第一集的可拍文本,拆分为Action/Dialogue/Voiceover三部分。 2 3项目框架:{粘贴你的项目框架}
输出:
19 lines 1【开头】 2Action:深夜,日本某座城市。蝶野凛穿着黑色战术服完成一次秘密任务,她动作精准、表情冷淡,像没有感情的武器。 3Dialogue:无
重要提醒:做 30-60 秒样片时,只需写第一集里要拍的片段,不必写完整一季。
新手常犯的错误是一上来就写完整长剧本,结果难以拆成镜头。正确做法是先定好可执行锚点,再逐步细化。
文本负载差异:
15-60 秒样片和完整一集(2-4 分钟)的文本负载差异很大:
-
样片只需要 100-200 字的可拍文本 -
完整一集需要 1000-2000 字的可拍文本
不要用完整一集的标准来要求样片。AI 生成视频成本较高,建议先把样片的剧本、分镜、资产都打磨到位,再进行视频生成。
优化建议:
-
先把 30-60 秒样片的剧本打磨到可以直接拍摄的程度 -
生成角色、场景、道具的参考图并确认一致性 -
制作分镜图并调整镜头节奏 -
最后再进行视频生成
这样可以减少重复生成视频的成本,提高一次成功率。
剧本阶段总结
至此,剧本阶段完成。你手里应该有:
-
一份项目框架文档(用提示词生成) -
一份剧情大纲文档(500-800 字) -
一份角色设定文档(主角的成长轨迹、各个角色的设定) -
第一集的可拍文本(拆成 Action/Dialogue/Voiceover 三部分)
这四份文档是后续所有步骤的共同锚点。不要急着往下走,先确认它们够清楚。
进入分镜前的最后检查:
-
可拍文本是否拆成了 Action/Dialogue/Voiceover? -
每个镜头的核心动作是否明确? -
角色的动机和情绪是否连贯? -
场景的转换是否自然?
如果有不确定的地方,先修改剧本,再进入分镜阶段。


……
完整版文章:(完整版)从 0 手搓 AI 漫剧:带你 1 小时出片
……

要制作出精良的漫剧,是非常不容易的事。其中每一个环节,都需要做非常多的优化。
但先跑通第一条样片,比空想一整部更重要!
现在,从第一步开始吧!
往期文章:
无限调用!5分钟带你打造专属 Gemini 生成图片、视频 API,可用 NanoBananaPro、NanoBanana2
使用 Gemini-API 搭建自己的自动化工作流,批量出图
END
夜雨聆风