乐于分享
好东西不私藏

我用 AI 做漫剧的踩坑实录:从故事大纲到分镜生成的真实分享

我用 AI 做漫剧的踩坑实录:从故事大纲到分镜生成的真实分享

最近这段时间,我每天都在研究怎么用 AI 来生成漫剧。光看教程不动手肯定不行,所以我结合自己生活里遇到的一个小例子,从零开始做了一部短篇漫剧。整个过程我踩了不少坑,也摸索出了一些经验,今天就把从故事大纲、分镜脚本,到使用过哪些 AI 工具、文生图阶段的心得都分享出来,给大家做个参考。

整部漫剧目前还没完全制作完成,后续我也会继续把创作过程和使用心得分享给大家。

一、先有故事:从生活里找灵感

做漫剧第一步,肯定是要有故事。我想做一个偏儿童向的短剧情漫剧,所以从生活里找了个小场景,写了下面这个大纲:

早上我不想去上学,一直哭闹着不肯出门。妈妈蹲下来温柔地安慰我,递过来一只小恐龙,告诉我它是我的专属守护者,会在幼儿园陪着我,保护我不被欺负。我半信半疑地点点头,抱着小恐龙跟着妈妈去了幼儿园。

课间的时候,有几个调皮的小朋友围过来抢我的恐龙,还推我,我吓得眼睛都红了,死死抓着玩具不松手。就在这时,小恐龙突然发出亮光,一下子变大变成了真的恐龙,对着他们轻轻吼了一声,那些小朋友吓得赶紧跑开了。

之后小恐龙又变回了玩具,蹭了蹭我的手心,我一下子就笑了出来,再也不害怕啦。

考虑到纯中文版可能有点单调,我顺手又生成了一份英文版,方便后面用儿童配音来进行故事的叙述:

In the morning, I didn’t want to go to school and kept crying and refusing to leave. My mother squatted down, comforted me gently, and handed me a small dinosaur, telling me that it was my exclusive guardian, who would accompany me in kindergarten and protect me from being bullied. I nodded in disbelief, hugged the small dinosaur, and followed my mother to kindergarten.

During the break, a few mischievous children crowded around me, grabbing for my dinosaur and pushing me. I was so scared that my eyes turned red, and I held onto the toy tightly without letting go. At that moment, my little dinosaur suddenly emitted a bright light, instantly growing larger and transforming into a real dinosaur. It let out a gentle roar at them, and the children were so frightened that they quickly ran away.

Afterwards, the little dinosaur turned back into a toy and rubbed against my palm. I suddenly laughed and wasn’t afraid anymore.

二、人物设定:踩到的第一个大坑

故事大纲搞定后,就要开始确定漫剧里涉及的人物了。我一开始构思的是一个幼儿园小女孩的形象,再结合她所处的环境(温馨的卧室)。

说实话,我自己写提示词总觉得不够细致,所以干脆把我想要的形象和环境直接丢给豆包,让它帮我润色和丰富一下提示词。豆包给我提示词后,我复制粘贴到文生图工具就能直接用,省事不少。

但问题马上就来了。

我尝试把已经生成好的人物背景图作为参考,再往里面加新的人物,结果发现生成出来的图片根本保证不了人物的一致性,而且人物比例也明显对不上。我前前后后试了千问、豆包、Gemini、Lovart、可灵,全都差不多,没一个能搞定。

后来我专门去学了一下,才知道正确的做法应该是:

先把漫剧里的主要人物单独生成”三视图”(也就是人物的正面、侧面、背面形象),三视图都生成完毕后,再以这张单人图作为参考图去生成后续画面,效果会好很多。

人物确定下来之后,接着就是生成场景。我这部漫剧用到的场景主要有三个:家里的卧室、幼儿园门口、教室,再加上不同镜头的切换。

三、几个 AI 工具的真实使用感受

1. 可灵:画面问题比较明显

我一开始用的是可灵,但生成效果让我有点失望,主要问题集中在画面逻辑、细节崩坏、空间违和这三点。

看上去是 Q 版 / 二次元软萌风格,但人物比例和房间细节有点”硬凑”的感觉。比如右下角的房间变成了”透明盒子视角”,家具(床、墙)边缘特别生硬,没有真实房间的温馨质感,反而像积木拼出来的,萌度大打折扣。

粉色卧室本来应该很有生活感才对,但图里除了床、兔子和几张零星挂画,几乎没别的装饰——窗帘、窗台、床头摆件都太简单了,整个房间显得”光秃秃”的,治愈感差了不少。

更要命的是手部细节:

  • 左上角 / 右上角:手的形状完全不对,手指糊成一团,分不清是”攥着”还是”垂着”,甚至像没手一样;
  • 左下角 / 右下角:手虽然能看出动作,但手指比例畸形、长短不一。这在二次元 / 手绘风格里就是最致命的”穿帮点”,看一眼就劝退。

另外可灵每月只有 128 个积分,确实不够用。不过它生成的视频效果还算可以,会自动帮我切换近景镜头,这点挺加分。

2. Gemini 企业版 / 商业版:效果好但稳定性堪忧

Gemini 有免费一个月的使用体验,生成的几张成品图片效果是真的不错,整体内容很丰富,甚至考虑到了一些我自己都没想到的细节。

但问题是——当我想延续之前的画面继续生成时,经常会因为延迟或者无响应直接出不了图,只能干着急。

3. 豆包:性价比之选

豆包生成的整体视频效果还行,唯一的小问题是镜头切换的时候衔接不太连贯。不过这个我可以在剪辑阶段把不连贯的部分剪掉,也算是能用。

豆包每天有 8 次免费视频生成额度,对我前期的视频制作来说已经够了,实在不够还可以换个账号继续白嫖,挺友好的。

四、图生视频:另一个让我头疼的坎

不知道你们会不会遇到和我一样的问题——

我原以为用各类工具生成图片,要不停地”抽卡”、调整,又要面对工具的使用次数限制,已经够麻烦了。结果场景大概都描述好之后,图生视频又给我立了一道新坎。

我的流程一般是这样的:先把想要的视频内容大概描述一下,让 AI 帮我修改提示词、补充一些没想到的细节,然后我再检查一下,发送给视频生成工具去做文生视频。

但生成结果总会有偏差。举个例子:小女孩和妈妈在校园门口挥手告别,我在提示词里明确写了”女孩转身向校园走去的一个动作画面”,结果生成出来呢?小女孩从头到尾都在挥手,根本没有转身的动作。

我把不满意的地方反馈给 AI,再次生成——还是一样。

我在想,这可能就是目前 AI 的局限性吧,复杂动作或者镜头切换上总有些细节做不到位。所以我打算换个思路:与其死磕一个长镜头,不如多生成一些不同角度的特写和画面转变镜头,靠后期剪辑拼起来,效果说不定反而更好。


整部漫剧目前还在制作中,后续等我做完,再来跟大家分享完整的成片和更多踩坑心得。如果你也在尝试用 AI 做漫剧,欢迎留言一起交流,看看有没有更高效的工作流可以互相借鉴!