我用 AI 做漫剧的踩坑实录:从故事大纲到分镜生成的真实分享-夜雨聆风

我用 AI 做漫剧的踩坑实录:从故事大纲到分镜生成的真实分享

最近这段时间，我每天都在研究怎么用 AI 来生成漫剧。光看教程不动手肯定不行，所以我结合自己生活里遇到的一个小例子，从零开始做了一部短篇漫剧。整个过程我踩了不少坑，也摸索出了一些经验，今天就把从故事大纲、分镜脚本，到使用过哪些 AI 工具、文生图阶段的心得都分享出来，给大家做个参考。

整部漫剧目前还没完全制作完成，后续我也会继续把创作过程和使用心得分享给大家。

一、先有故事：从生活里找灵感

做漫剧第一步，肯定是要有故事。我想做一个偏儿童向的短剧情漫剧，所以从生活里找了个小场景，写了下面这个大纲：

早上我不想去上学，一直哭闹着不肯出门。妈妈蹲下来温柔地安慰我，递过来一只小恐龙，告诉我它是我的专属守护者，会在幼儿园陪着我，保护我不被欺负。我半信半疑地点点头，抱着小恐龙跟着妈妈去了幼儿园。

课间的时候，有几个调皮的小朋友围过来抢我的恐龙，还推我，我吓得眼睛都红了，死死抓着玩具不松手。就在这时，小恐龙突然发出亮光，一下子变大变成了真的恐龙，对着他们轻轻吼了一声，那些小朋友吓得赶紧跑开了。

之后小恐龙又变回了玩具，蹭了蹭我的手心，我一下子就笑了出来，再也不害怕啦。

考虑到纯中文版可能有点单调，我顺手又生成了一份英文版，方便后面用儿童配音来进行故事的叙述：

In the morning, I didn’t want to go to school and kept crying and refusing to leave. My mother squatted down, comforted me gently, and handed me a small dinosaur, telling me that it was my exclusive guardian, who would accompany me in kindergarten and protect me from being bullied. I nodded in disbelief, hugged the small dinosaur, and followed my mother to kindergarten.

During the break, a few mischievous children crowded around me, grabbing for my dinosaur and pushing me. I was so scared that my eyes turned red, and I held onto the toy tightly without letting go. At that moment, my little dinosaur suddenly emitted a bright light, instantly growing larger and transforming into a real dinosaur. It let out a gentle roar at them, and the children were so frightened that they quickly ran away.

Afterwards, the little dinosaur turned back into a toy and rubbed against my palm. I suddenly laughed and wasn’t afraid anymore.

二、人物设定：踩到的第一个大坑

故事大纲搞定后，就要开始确定漫剧里涉及的人物了。我一开始构思的是一个幼儿园小女孩的形象，再结合她所处的环境（温馨的卧室）。

说实话，我自己写提示词总觉得不够细致，所以干脆把我想要的形象和环境直接丢给豆包，让它帮我润色和丰富一下提示词。豆包给我提示词后，我复制粘贴到文生图工具就能直接用，省事不少。

但问题马上就来了。

我尝试把已经生成好的人物背景图作为参考，再往里面加新的人物，结果发现生成出来的图片根本保证不了人物的一致性，而且人物比例也明显对不上。我前前后后试了千问、豆包、Gemini、Lovart、可灵，全都差不多，没一个能搞定。

后来我专门去学了一下，才知道正确的做法应该是：

先把漫剧里的主要人物单独生成”三视图”（也就是人物的正面、侧面、背面形象），三视图都生成完毕后，再以这张单人图作为参考图去生成后续画面，效果会好很多。

人物确定下来之后，接着就是生成场景。我这部漫剧用到的场景主要有三个：家里的卧室、幼儿园门口、教室，再加上不同镜头的切换。

三、几个 AI 工具的真实使用感受

1. 可灵：画面问题比较明显

我一开始用的是可灵，但生成效果让我有点失望，主要问题集中在画面逻辑、细节崩坏、空间违和这三点。

看上去是 Q 版 / 二次元软萌风格，但人物比例和房间细节有点”硬凑”的感觉。比如右下角的房间变成了”透明盒子视角”，家具（床、墙）边缘特别生硬，没有真实房间的温馨质感，反而像积木拼出来的，萌度大打折扣。

粉色卧室本来应该很有生活感才对，但图里除了床、兔子和几张零星挂画，几乎没别的装饰——窗帘、窗台、床头摆件都太简单了，整个房间显得”光秃秃”的，治愈感差了不少。

更要命的是手部细节：

左上角 / 右上角：手的形状完全不对，手指糊成一团，分不清是”攥着”还是”垂着”，甚至像没手一样；
左下角 / 右下角：手虽然能看出动作，但手指比例畸形、长短不一。这在二次元 / 手绘风格里就是最致命的”穿帮点”，看一眼就劝退。

另外可灵每月只有 128 个积分，确实不够用。不过它生成的视频效果还算可以，会自动帮我切换近景镜头，这点挺加分。

2. Gemini 企业版 / 商业版：效果好但稳定性堪忧

Gemini 有免费一个月的使用体验，生成的几张成品图片效果是真的不错，整体内容很丰富，甚至考虑到了一些我自己都没想到的细节。

但问题是——当我想延续之前的画面继续生成时，经常会因为延迟或者无响应直接出不了图，只能干着急。

3. 豆包：性价比之选

豆包生成的整体视频效果还行，唯一的小问题是镜头切换的时候衔接不太连贯。不过这个我可以在剪辑阶段把不连贯的部分剪掉，也算是能用。

豆包每天有 8 次免费视频生成额度，对我前期的视频制作来说已经够了，实在不够还可以换个账号继续白嫖，挺友好的。

四、图生视频：另一个让我头疼的坎

不知道你们会不会遇到和我一样的问题——

我原以为用各类工具生成图片，要不停地”抽卡”、调整，又要面对工具的使用次数限制，已经够麻烦了。结果场景大概都描述好之后，图生视频又给我立了一道新坎。

我的流程一般是这样的：先把想要的视频内容大概描述一下，让 AI 帮我修改提示词、补充一些没想到的细节，然后我再检查一下，发送给视频生成工具去做文生视频。

但生成结果总会有偏差。举个例子：小女孩和妈妈在校园门口挥手告别，我在提示词里明确写了”女孩转身向校园走去的一个动作画面”，结果生成出来呢？小女孩从头到尾都在挥手，根本没有转身的动作。

我把不满意的地方反馈给 AI，再次生成——还是一样。

我在想，这可能就是目前 AI 的局限性吧，复杂动作或者镜头切换上总有些细节做不到位。所以我打算换个思路：与其死磕一个长镜头，不如多生成一些不同角度的特写和画面转变镜头，靠后期剪辑拼起来，效果说不定反而更好。

整部漫剧目前还在制作中，后续等我做完，再来跟大家分享完整的成片和更多踩坑心得。如果你也在尝试用 AI 做漫剧，欢迎留言一起交流，看看有没有更高效的工作流可以互相借鉴！