乐于分享
好东西不私藏

AI漫剧制作全流程:工具详细使用示例

AI漫剧制作全流程:工具详细使用示例

1. 角色资产库构建

目标:生成标准化、可复用的角色三视图与定妆图,确保后续制作中角色不“崩坏”。

TGI2 图像生成模型

功能:生成角色标准三视图(正/侧/背)及多角度定妆图。

使用示例(提示词结构)[主体描述], 全身像, 白色背景, 3D Pixar风格, 高清8K –niji 5 –style expressive

实操案例

输入提示词:RUI, 28岁亚裔女性, 齐肩黑色波波头, 穿米色风衣配牛仔裤, 鼻梁右侧有小痣, 全身像, 正面视角, 白色背景, 3D Pixar风格, 高清8K

操作:生成后,挑选最符合预期的图像作为“正面基准图”。

多角度生成:修改提示词中的视角参数(如侧面视角、背面视角、45度侧脸),生成一套(建议8张)不同角度的定妆图,覆盖光影变化。

GPT-Image-2(Thinking模式)

功能:生成带特定文字(如招牌、书本内容)的特写镜头,锁定细节。

使用示例(提示词结构)[角色名]手持[道具],特写镜头,道具上文字清晰显示为‘[具体文字]’,[艺术风格]

实操案例

输入提示词:RUI手持直播间提示板,特写镜头,提示板上文字清晰显示为“限时5折!还剩10秒!”,背景虚化,3D Pixar风格

目的:验证模型能否精准渲染中文文案,同时锁定角色手部动作与道具特征。

2. 分镜制作

目标:高效生成带对话气泡的连贯分镜,减少后期修图与排版工作量。

GPT-Image-2(主力)

功能:生成带精准中文对话气泡的分镜图。

使用示例(提示词结构)镜头[编号]:[场景描述],[角色名]说:“[对话内容]”,对话气泡内文字为‘[对话内容]’,字体为宋体12号,无错别字,[镜头角度描述]

实操案例

输入提示词:镜头03:上海外滩夜景街道,RUI兴奋地举着“全场8折!”的招牌,对话气泡内文字‘姐妹们快来看!’,字体为宋体12号,无错别字,中景镜头,3D Pixar风格

输出:直接生成一张包含角色、场景、文字气泡的完整分镜图。

Midjourney V7(辅助)

功能:生成复杂或风格化背景,弥补GPT-Image-2在环境细节上的不足。

使用示例(提示词结构)[场景描述],[艺术风格],[光影参数],[构图参数] –ar [宽高比] –v 7

实操案例

输入提示词:赛博朋克风格的未来城市雨夜,霓虹灯光反射在湿漉漉的街道上,景深效果,广角镜头 –ar 16:9 –v 7

后期:将生成的背景图导入PS或视频编辑软件,与GPT-Image-2生成的角色分镜进行合成。

3. 动态化与镜头扩展

目标:将静态分镜转化为动态视频,补充镜头语言与特效。

可灵AI原生4K模型

功能:生成高画质、角色一致的动作片段。

使用示例(操作流程)

1..1.输入:上传GPT-Image-2生成的分镜图(如RUI举招牌的静态图)。

1..2.选择模式:图生视频,分辨率4K。

1..3.提示词(动作指令):RUI微笑着向左挥手,招牌轻微晃动,背景人群缓慢移动,时长5秒。

1..4.关键设置:勾选“角色一致性锁定”,确保生成的视频中RUI的面部特征与服装不变形。

万相Wan 2.7

功能:批量生成低成本过场动画。

使用示例(提示词结构)[场景A]缓慢过渡到[场景B],运镜方式[推/拉/摇],时长[秒数]

实操案例

输入提示词:从繁华的上海外滩街道(镜头03场景)缓慢拉远并上升,过渡到黄浦江全景,运镜方式为“拉”,时长3秒

Seedance 2.0

功能:补充物理交互特效。

使用示例(操作流程)

1..1.输入:选择视频中需要添加特效的片段(如RUI的头发)。

1..2.选择特效:风力模拟 -> 微风。

1..3.输出:生成头发随风轻微飘动的动态蒙版,叠加至主视频轨道。

4. 后期整合与输出

目标:通过多维度调节与批量处理,完成最终成片。

多维相机调节系统

功能:生成分镜的多角度视图,完善镜头语言。

使用示例(参数调节)

输入:静态分镜图(俯拍视角)。

调节参数:旋转角度:+15度,焦距:50mm -> 35mm(模拟广角效果)。

输出:生成一张带有仰拍效果的动态分镜,增强视觉冲击力。

资产批量提取工具

功能:自动归类角色、场景、道具资产,跨集复用。

使用示例(操作命令)

指令:提取项目“都市恋爱季1”中所有含“RUI”的图像资产

输出:系统自动从历史生成的素材库中筛选出RUI的所有定妆图与分镜图,打包供第2季制作调用。

5. 成本与效率优化:模型分层调用策略

原则:高成本模型仅用于核心镜头,普通镜头用低成本模型。

镜头类型

推荐工具

成本系数

示例场景

核心镜头

可灵AI 4K

主角特写对话、关键剧情转折

过场镜头

万相Wan 2.7

地点转换、时间流逝、环境展示

背景素材

Midjourney V7

风景、建筑、非角色相关元素

实操案例

制作一个10秒的主角对话场景

0-5秒(主角特写):使用可灵AI 4K生成,确保面部表情细腻、口型与台词匹配。

5-8秒(镜头拉远展示环境):使用万相Wan 2.7生成背景动态,叠加主角静态图层。

8-10秒(转场至下一场景):使用万相Wan 2.7生成“镜头模糊+移动”特效。