今天继续分享IP影视课程笔记,
愿意认真看的同学一定会有收获,
这可是全球TOP50的AI视频艺术家大佬们的课程精华呢!
上节课笔记链接:AI视频(IP影视课程)之视听语言知识点
👑第五课:图片与视频生成
一、课程主要内容及重点分析:
课程主题:图片与视频生成——从剧本到成片的全链路实操
主讲人:大鹏老师
核心观点:AI时代,我们都变成了评委——不用会干,但要会改、会分好坏。
一、短剧工作流程的演变
1. 传统分镜模式(2025年)
- 流程:点子/小说/Game点 → 扩展成剧本(编剧) → 分镜脚本(导演) → 定艺术风格、人物、场景、道具(艺术总监) → 生成主分镜图与辅助分镜图(生图师) → 视频生成 → 剪辑 → 配音
- 岗位特点:生图师是“人上人”,月薪一万多;编剧、导演、剪辑都是重要岗位
- 代表技术:ComfyUI 等,需要大量人工控制
2. 多参模式(2026年第一季度)
- 特点:导演与艺术总监一起定风格,生成故事板后直接生视频,减少了分镜环节
- 岗位变化:生图师岗位被弱化,其工作被导演或生视频环节替代
- 核心概念:多参——参考多个人物、场景、道具同时生成
3. 123模式(2026年第二季度)
- 极端情况下点三下鼠标即可完成:
① 剧本老师输入剧本
② 导演生成分镜脚本(AI写,人改)
③ 视频生成并拼接
- 岗位职能转变:编剧、导演等岗位主要对 AI 生成内容进行修改和完善,需具备审美和判断能力
- 重要提醒:如果 AI 出的东西你全都没改 → 说明你水平不如 AI → 容易被淘汰
4. 核心概念补充:Game点
- 定义:荒诞规则点,短剧的核心点,可反复使用、可升级、贯穿全剧
- 例子:穿越回到小时候弥补妈妈的遗憾(《你好,李焕英》)、穿越到以前改变命运(《夏洛特烦恼》)
二、模型选择
1. 大语言模型(LLM)
- 用途:写剧本、改剧本、找思路、写提示词
- 常见模型:
- 国外:GPT-5.5、Claude(最贵模型 Claude 4.7)、Gemini
- 国内:豆包、DeepSeek、Kimi(豆包情绪给得好,适合聊天)
2. 图片模型
- 当前最火:image-2
- 与之接近:Nanobanana Pro、Nanobanana 2(非人物画面的质感可能稍好)
- 再差一档:即梦的模型
- midjourney:现主要用于找思路,很少直接生图
- 提示:实际应用中多尝试,个人工作流不同
3. 视频模型
- 目前全球最好的视频模型是国内的 seedance2.0,价格较贵,但对专业人士有价值,可形成护城河
- 观点:如果模型价格再便宜10倍,很多从业者会没饭吃——贵是一种护城河
三、工具实操:Luxreal 平台
https://www.luxreal.com/create-video
1. 核心功能与操作流程
① 剧本准备
- 上传剧本(支持最多10万字,现可支持更大)
- 可参考平台“示例剧本”了解结构
- 不会写可用 LLM 生成
② 上传与拆分
- 上传剧本后,平台自动拆分为叙事单元(同一批人在同一场地完成的一整件事)
- 可手动调整时长、合并/拆分叙事单元
- 支持历史版本回溯
③ 资产生成(目前免费)
- 可批量生成角色、场景、道具图
- 支持模型:LUX image-2、LUX banana、banana 2、 seedream 5.0、mj V7等
- 三视图标准:正、侧、背 + 面部特写(面部特写越好,一致性越强)
- 一个角色可生成多种状态图(如常态服、泳装、受伤等),用于不同场景
- 可添加音色(提前统一角色声音)
④ 智能镜头库(关键功能)
- 核心原理:把长视频(如51秒)先压缩成一个短视频(如5-7秒),从短视频中提取关键帧,分配给后续多个视频生成任务,保证人物、场景、站位的一致性
- 操作:点击“规划视频任务/多功能Pro”,生成一个极短的关键帧视频,然后抽帧,将抽出的帧作为后续分镜的参考图
- 该功能约消耗200积分(平台方表示会尽量压到200以内)
- 重要性:以小博大——花一点积分生成关键帧视频,节省后续大量抽卡成本
⑤ 3D 片场(230积分)
- 可将图片转换为可编辑的3D场景
- 在3D场景中自由添加人物(可调位置、大小、角度)、调整摄像机机位(仰/俯/平视、过肩、正反打等)
- 截图后可作为分镜图,再结合人物、场景图用多参方式生成新图
- 解决了“同一场景多机位、人物站位不一致”的痛点
- 平台还提供公库3D场地模板(横店实景等),免费使用
⑥ 视频生成
- 建议练习时用 480P 低分辨率(省积分)
- 发自媒体用 720P 足够(平台会压缩,1080P较贵)
- 生成时可选择“智能镜头”(AI自动规划分镜)或关闭后自己写详细提示词
- 每个叙事单元内可垫入:人物图、场景图、道具图、关键分镜图 → 多参生成视频
- 提示词应包含:景别、主体运动、情绪基调、环境光线、镜头运动、时长
⑦ 预览与导出
- 可预览成片,查看各节点视频
- 有问题可回过来调整
- 支持导出视频或工程文件进入剪辑环节
2. 重要操作建议
- 不要浪费免费积分:所有提示词能改就改,体现自己的价值
- 分镜设计原则:一个分镜尽量完成一个动作和一种情绪,避免过多动作和情绪导致混乱
- 时长把控:根据对白长度调整分镜时长,太短会导致语速过快
- 前期质量决定后期:人物图、场景图的质量直接影响最终片子质量——越前期的工作越重要
四、创作要点总结
1. 剧本创作
- 开篇前几秒要抛出冲突或悬念,抓住观众注意力
- 剧情紧凑、反转、人物动机明确、台词合适
- 删除不必要的情节和对白(删除后故事依然成立即可删)
2. 分镜设计
- 一个分镜一个动作一种情绪
- 分镜提示词应包含:景别、主体运动、情绪基调、环境光线、镜头运动、时长
- 可添加反向提示词(如“不生成字幕”“不要穿模”)
3. 节奏把控
- 导演的核心能力是节奏
- 根据对白长度调整分镜时长,避免语速过快或节奏拖沓
4. 灯光与色彩
- 可在提示词中指定光线类型(硬光/软光)、方向、色温
- 经典三点布光(主光+辅光+背光)可写入提示词
五、AI时代的核心竞争力
- 审美:能分清楚好赖
- 会改:不用从零写,但会调整、优化
- 提示词能力:把画面需求翻译成AI能懂的语言
- 节奏感:导演对视频节奏的把控
- 学习能力:传统手艺(主分镜/辅助分镜、轴线、景别等)仍然有用,理解底层逻辑才能用好新工具
六、附加信息:轴线与越轴(简要回顾)
- 轴线:两个人物之间的隐形参考线,摄影机应保持在同一侧
- 不越轴:让剧情平缓过渡,符合正常视觉习惯
- 越轴:会产生“跳跃感”,可用于表现混乱、紧张的心理状态
- 入门阶段建议不越轴,理解规则后再有意识使用
本课精华观点:
AI时代,没有人拦着你进步,但也没有人能够替你进步。你拿的笔跟别人拿的笔一样,你拿的纸跟别人拿的纸一样。免费送了你这么多,怎么把这些东西内化成自己的能力?这是关键
二、本课作业:

三、我的作业(《阿满》参考图片资产+部分片段视频)
参考图片资产:

《阿满》的2分钟+视频粗剪
❤️本课心得体会
视频做出来了。两分多钟,不长,但导出的时候我心里挺踏实的。
做视频的过程挺纠结的,我真的很想几秒一个钩子,但是阿满的故事就是这么温情,怎么办啊!!!
阿满这个角色,从第一节课的作业里长出来,到第二课用八步法写出他的故事,再到第三课给他做人设、世界观,第四课写分镜……一路走过来,他对我来说已经不是一个“作业角色”了。他是我脑子里的一个人,一个蹲在湖边看小鹿、被小动物围着也不去伤害它们的、温柔的巨兽。
所以到了第五课,要让他真的“动起来”,我特别怕——怕出来的东西不是他,怕他变味了。
过程确实挺折腾的。免费额度有限,生成的东西经常不是我想的样子。有时候画面对了、情绪不对;有时候情绪对了、节奏又不对。我一遍遍改提示词、一遍遍重来,心里其实挺着急的。但我告诉自己:阿满都等了我这么久了,我不能随便交个东西就完了。
后来我慢慢找到了感觉。不是技术上的突破,是我终于放下了“要做得好看”这个念头,回到了最初为什么喜欢阿满的那个原点——他就是一只被世界推开、却依然温柔对待每一个小生命的巨兽。他遇到取经队伍的时候,不是去打,是去装凶,求人打自己,其实他一点都没有伤害别人……我也不知道该怎么说,就是命运的相遇吧。
导出之后我看了好几遍。不完美,很多地方还能更好。但他是阿满。他从我的文档里走出来,动了,活了。
这份作业让我最大的感受是:创作一个人,就像交一个朋友。你得花时间,得用心,得接受他不完美,但你会为他骄傲。
感谢阿满,也感谢那个没有放弃的自己。
夜雨聆风