🎬 AI实操声明:本文为AI视频制作干货教程。文中涉及的视频案例、分镜脚本及部分画面素材,均由作者借助AI工具实机生成。核心制作思路为纯人工原创梳理,旨在授人以渔。点击下方关注我,持续学习!
经常有人问:“阿苏,你的AI视频人物或是橘猫等角色特征总是固定的,为什么我的人物或是橘猫上一秒还是好好的,下一秒风格大变?”
这的确是做AI创意视频一个难处理的地方——角色前后一致性。
今天通过“橘猫咖啡店长”的AI创意视频展开简单说一下,从定妆照到分镜,全程只用豆包(即梦也可以),手机就能操作,免费积分足够跑通做完视频。
下面是从0到1的抄作业指南。
视频效果:
上面这条视频,由3个镜头组成,时长30秒(可以根据画面调整时速),总耗时不超过30分钟。没有拍摄,没有建模,全靠提示词生成。
操作步骤:
🛠️ 准备工作清单:
工具:豆包(免费)+ 即梦(每日签到送积分,足够个人使用)
耗时:熟练后30分钟以内/条
核心难点:如何让橘猫在不同的镜头里边保持一致(下文重点解决)
一、生成图片
很多新朋友喜欢一上手就直接“文生视频”,这样出来的效果并不理想,必须先有一张“标准证件照”作为贯穿整个视频的基准参考。
我先让豆包充当我的“美术指导”,帮我把脑海里的橘猫具体化。
打开豆包对话框发送以下内容:我正在制作一支AI视频,主角是拟人化的橘猫咖啡店长。请帮我写一个详细的Midjourney提示词,描述它的外貌特征,要求细节丰富,以便我在即梦中固定角色形象。具体要求:
1. 主角:胖橘猫,拟人化站立,戴黑色圆框眼镜,系深绿色围裙,表情温和呆萌。
2. 风格:皮克斯3D渲染风格,C4D质感,8K分辨率,光线追踪,柔和工作室灯光。
3. 背景:干净的木质吧台,暖色调。
4. 请输出英文提示词,并附带中文翻译对照。

得到两组生成橘猫图片的提示词,复制提示词生成图片作为视频主角。

以下提示词,可直接复制生成图片:
Midjourney 主提示词(英文 + 中文对照,分完整版+精简版,适配即梦固定角色、MJ 出图)
精简版(适合反复迭代、固定角色,参数轻量化)
English Prompt
Anthropomorphic fat orange cat, standing pose, black round glasses, dark green apron, gentle cute look, Pixar 3D, C4D render, 8K, ray tracing, soft warm studio light, wooden coffee bar, warm color palette, fluffy fur, high detail --ar 9:16 --v 6.0
中文翻译
拟人胖橘猫,直立站姿,黑色圆框眼镜,深绿色围裙,神态温和软萌,皮克斯 3D 风格,C4D 渲染,8K 画质,光线追踪,柔和暖调工作室灯光,木质咖啡吧台背景,暖色系,毛发蓬松,细节丰富,画面比例 9:16,MJ6.0 版本
负面提示词(规避变形、崩坏,必加,稳定角色形象)
Negative Prompt(英文)
blurry, distorted face, deformed glasses, extra limbs, ugly, messy background, low resolution, cartoon sketch, 2d, flat, human face, text, watermark, mutated, disfigured
中文翻译
模糊、脸部扭曲、眼镜变形、多余肢体、丑陋、杂乱背景、低分辨率、手绘草图、二维平面、人脸、文字、水印、形象畸变、五官崩坏
从生成的图片中挑一张作为主角,如果不满意就重来,我觉得下边第一张就挺好!
避坑指南:一定要选正面平视的图。侧脸、遮挡、模糊的图,后面不好操作。

橘猫咖啡店长:

二、生成脚本
继续在豆包对话框输入:基于刚才的橘猫店长设定,帮我写一个3个镜头的短视频脚本。要求:
1. 镜头1:橘猫站在吧台后,抬头看向顾客(中景)。
2. 镜头2:橘猫低头专注地拉花(特写手部/爪子)。
3. 镜头3:橘猫端着咖啡递给镜头,微笑眨眼(近景)。
请为每个镜头写出即梦专用的视频生成提示词(中文即可,包含动作描述)。
小技巧:让豆包输出“即梦专用”的中文提示词,比我们自己瞎琢磨的效率更高,而且生成结果的语义更适合国内模型。

可生成视频的部份脚本内容(完整脚本字数过多,需要的话可拉至文末自行获取):
镜头 1【0-10s|进店点单 + 快速买单|中景推近特写】
剧情动线:客人推门进店→橘猫立刻抬头迎客→对口播点单→低头快速收银买单,完成前期全部交互流程。
运镜细节:起始中景定格完整吧台场景,2 秒匀速向前推镜,从全身推进至脸部 + 手部上半身,结尾定格收银特写,节奏递进抓眼。
表情 & 动作细节(高密度细节)
门店风铃轻响瞬间,胖橘耳朵瞬间立起,慵懒状态立刻切换营业状态
抬头睁眼,眼镜轻微滑落鼻尖,下意识轻轻抬爪推眼镜,呆萌氛围感拉满
坐姿转正、腰背挺直,爪爪规整搭在吧台边缘,神态温柔又敬业
倾听点单时微微歪头、轻眨圆眼,认真倾听客人需求
确认订单后轻轻点头,尾巴小幅温柔晃动,尽显乖巧
迅速低头抬爪操作收银机,动作干脆利落,毫无拖沓
对口轻台词(温柔软萌低音)
“欢迎光临~请问需要什么饮品?”
“好的,招牌拿铁,扫码就可以啦~”
画面氛围:暖光落在橘猫橘色绒毛上,自带柔光质感,吧台整洁干净,整体治愈又灵动,开局快速带入剧情。
......
三、生成视频
打开豆包网址:
选择左侧“AI创作”,下方的“视频生成”,输入脚本内容,选择比例,发送,然后等待视频生成后保存。

单个视频效果:
四、剪映剪辑成片
画面:三段视频素材,加上“轻微放大”的关键帧,模拟运镜。
配音:剪映「文本朗读」选“解说小帅”或“温柔女声”,念一句:“您的咖啡好了。”
音效:重点! 加上“喵一声”、“咖啡机蒸汽声”、“杯子轻放声”。氛围感瞬间拉满。
BGM:选一首轻快的钢琴曲,音量调低至15%。

互动时间:为了方便大家抄作业,我把这支视频用到的全套Prompt模板(豆包+即梦)整理成了TXT文档。
领取方式:关注公众号,后台回复关键词 「橘猫」 ,直接拿走。
下期投喂:你最想看下一篇做什么拟人动物?评论区扣数字:
1、🐶 哈士奇拆家监控
2、🐼 熊猫吃播
3、🐰 柯基交警
分享实用的实操案例,如果你想更深入的持续学习,点赞、分享、关注不迷路,实用的话设个星标⭐第一时间收到推送。谢谢大家!

夜雨聆风