AI漫剧制作全流程:工具详细使用示例
1. 角色资产库构建
目标:生成标准化、可复用的角色三视图与定妆图,确保后续制作中角色不“崩坏”。
•TGI2 图像生成模型
◦功能:生成角色标准三视图(正/侧/背)及多角度定妆图。
◦使用示例(提示词结构):[主体描述], 全身像, 白色背景, 3D Pixar风格, 高清8K –niji 5 –style expressive
◦实操案例:
▪输入提示词:RUI, 28岁亚裔女性, 齐肩黑色波波头, 穿米色风衣配牛仔裤, 鼻梁右侧有小痣, 全身像, 正面视角, 白色背景, 3D Pixar风格, 高清8K
▪操作:生成后,挑选最符合预期的图像作为“正面基准图”。
▪多角度生成:修改提示词中的视角参数(如侧面视角、背面视角、45度侧脸),生成一套(建议8张)不同角度的定妆图,覆盖光影变化。
•GPT-Image-2(Thinking模式)
◦功能:生成带特定文字(如招牌、书本内容)的特写镜头,锁定细节。
◦使用示例(提示词结构):[角色名]手持[道具],特写镜头,道具上文字清晰显示为‘[具体文字]’,[艺术风格]
◦实操案例:
▪输入提示词:RUI手持直播间提示板,特写镜头,提示板上文字清晰显示为“限时5折!还剩10秒!”,背景虚化,3D Pixar风格
▪目的:验证模型能否精准渲染中文文案,同时锁定角色手部动作与道具特征。
2. 分镜制作
目标:高效生成带对话气泡的连贯分镜,减少后期修图与排版工作量。
•GPT-Image-2(主力)
◦功能:生成带精准中文对话气泡的分镜图。
◦使用示例(提示词结构):镜头[编号]:[场景描述],[角色名]说:“[对话内容]”,对话气泡内文字为‘[对话内容]’,字体为宋体12号,无错别字,[镜头角度描述]
◦实操案例:
▪输入提示词:镜头03:上海外滩夜景街道,RUI兴奋地举着“全场8折!”的招牌,对话气泡内文字‘姐妹们快来看!’,字体为宋体12号,无错别字,中景镜头,3D Pixar风格
▪输出:直接生成一张包含角色、场景、文字气泡的完整分镜图。
•Midjourney V7(辅助)
◦功能:生成复杂或风格化背景,弥补GPT-Image-2在环境细节上的不足。
◦使用示例(提示词结构):[场景描述],[艺术风格],[光影参数],[构图参数] –ar [宽高比] –v 7
◦实操案例:
▪输入提示词:赛博朋克风格的未来城市雨夜,霓虹灯光反射在湿漉漉的街道上,景深效果,广角镜头 –ar 16:9 –v 7
▪后期:将生成的背景图导入PS或视频编辑软件,与GPT-Image-2生成的角色分镜进行合成。
3. 动态化与镜头扩展
目标:将静态分镜转化为动态视频,补充镜头语言与特效。
•可灵AI原生4K模型
◦功能:生成高画质、角色一致的动作片段。
◦使用示例(操作流程):
1..1.输入:上传GPT-Image-2生成的分镜图(如RUI举招牌的静态图)。
1..2.选择模式:图生视频,分辨率4K。
1..3.提示词(动作指令):RUI微笑着向左挥手,招牌轻微晃动,背景人群缓慢移动,时长5秒。
1..4.关键设置:勾选“角色一致性锁定”,确保生成的视频中RUI的面部特征与服装不变形。
•万相Wan 2.7
◦功能:批量生成低成本过场动画。
◦使用示例(提示词结构):[场景A]缓慢过渡到[场景B],运镜方式[推/拉/摇],时长[秒数]
◦实操案例:
▪输入提示词:从繁华的上海外滩街道(镜头03场景)缓慢拉远并上升,过渡到黄浦江全景,运镜方式为“拉”,时长3秒
•Seedance 2.0
◦功能:补充物理交互特效。
◦使用示例(操作流程):
1..1.输入:选择视频中需要添加特效的片段(如RUI的头发)。
1..2.选择特效:风力模拟 -> 微风。
1..3.输出:生成头发随风轻微飘动的动态蒙版,叠加至主视频轨道。
4. 后期整合与输出
目标:通过多维度调节与批量处理,完成最终成片。
•多维相机调节系统
◦功能:生成分镜的多角度视图,完善镜头语言。
◦使用示例(参数调节):
▪输入:静态分镜图(俯拍视角)。
▪调节参数:旋转角度:+15度,焦距:50mm -> 35mm(模拟广角效果)。
▪输出:生成一张带有仰拍效果的动态分镜,增强视觉冲击力。
•资产批量提取工具
◦功能:自动归类角色、场景、道具资产,跨集复用。
◦使用示例(操作命令):
▪指令:提取项目“都市恋爱季1”中所有含“RUI”的图像资产
▪输出:系统自动从历史生成的素材库中筛选出RUI的所有定妆图与分镜图,打包供第2季制作调用。
5. 成本与效率优化:模型分层调用策略
原则:高成本模型仅用于核心镜头,普通镜头用低成本模型。
|
镜头类型 |
推荐工具 |
成本系数 |
示例场景 |
|
核心镜头 |
可灵AI 4K |
高 |
主角特写对话、关键剧情转折 |
|
过场镜头 |
万相Wan 2.7 |
低 |
地点转换、时间流逝、环境展示 |
|
背景素材 |
Midjourney V7 |
中 |
风景、建筑、非角色相关元素 |
实操案例:
•制作一个10秒的主角对话场景:
0-5秒(主角特写):使用可灵AI 4K生成,确保面部表情细腻、口型与台词匹配。
5-8秒(镜头拉远展示环境):使用万相Wan 2.7生成背景动态,叠加主角静态图层。
8-10秒(转场至下一场景):使用万相Wan 2.7生成“镜头模糊+移动”特效。
夜雨聆风