AI视频(IP影视课程)之图片与视频生成

今天继续分享IP影视课程笔记，

愿意认真看的同学一定会有收获，

这可是全球TOP50的AI视频艺术家大佬们的课程精华呢！

上节课笔记链接：AI视频（IP影视课程）之视听语言知识点

👑第五课：图片与视频生成

一、课程主要内容及重点分析：

课程主题：图片与视频生成——从剧本到成片的全链路实操

主讲人：大鹏老师

核心观点：AI时代，我们都变成了评委——不用会干，但要会改、会分好坏。

一、短剧工作流程的演变

1. 传统分镜模式（2025年）

流程：点子/小说/Game点 → 扩展成剧本（编剧） → 分镜脚本（导演） → 定艺术风格、人物、场景、道具（艺术总监） → 生成主分镜图与辅助分镜图（生图师） → 视频生成 → 剪辑 → 配音
岗位特点：生图师是“人上人”，月薪一万多；编剧、导演、剪辑都是重要岗位
代表技术：ComfyUI 等，需要大量人工控制

2. 多参模式（2026年第一季度）

特点：导演与艺术总监一起定风格，生成故事板后直接生视频，减少了分镜环节
岗位变化：生图师岗位被弱化，其工作被导演或生视频环节替代
核心概念：多参——参考多个人物、场景、道具同时生成

3. 123模式（2026年第二季度）

极端情况下点三下鼠标即可完成：

① 剧本老师输入剧本

② 导演生成分镜脚本（AI写，人改）

③ 视频生成并拼接

岗位职能转变：编剧、导演等岗位主要对 AI 生成内容进行修改和完善，需具备审美和判断能力
重要提醒：如果 AI 出的东西你全都没改 → 说明你水平不如 AI → 容易被淘汰

4. 核心概念补充：Game点

定义：荒诞规则点，短剧的核心点，可反复使用、可升级、贯穿全剧
例子：穿越回到小时候弥补妈妈的遗憾（《你好，李焕英》）、穿越到以前改变命运（《夏洛特烦恼》）

二、模型选择

1. 大语言模型（LLM）

用途：写剧本、改剧本、找思路、写提示词
常见模型：

国外：GPT-5.5、Claude（最贵模型 Claude 4.7）、Gemini
国内：豆包、DeepSeek、Kimi（豆包情绪给得好，适合聊天）

2. 图片模型

当前最火：image-2
与之接近：Nanobanana Pro、Nanobanana 2（非人物画面的质感可能稍好）
再差一档：即梦的模型
midjourney：现主要用于找思路，很少直接生图
提示：实际应用中多尝试，个人工作流不同

3. 视频模型

目前全球最好的视频模型是国内的 seedance2.0，价格较贵，但对专业人士有价值，可形成护城河
观点：如果模型价格再便宜10倍，很多从业者会没饭吃——贵是一种护城河

三、工具实操：Luxreal 平台

https://www.luxreal.com/create-video

1. 核心功能与操作流程

① 剧本准备

上传剧本（支持最多10万字，现可支持更大）
可参考平台“示例剧本”了解结构
不会写可用 LLM 生成

② 上传与拆分

上传剧本后，平台自动拆分为叙事单元（同一批人在同一场地完成的一整件事）
可手动调整时长、合并/拆分叙事单元
支持历史版本回溯

③ 资产生成（目前免费）

可批量生成角色、场景、道具图
支持模型：LUX image-2、LUX banana、banana 2、 seedream 5.0、mj V7等
三视图标准：正、侧、背 + 面部特写（面部特写越好，一致性越强）
一个角色可生成多种状态图（如常态服、泳装、受伤等），用于不同场景
可添加音色（提前统一角色声音）

④ 智能镜头库（关键功能）

核心原理：把长视频（如51秒）先压缩成一个短视频（如5-7秒），从短视频中提取关键帧，分配给后续多个视频生成任务，保证人物、场景、站位的一致性
操作：点击“规划视频任务/多功能Pro”，生成一个极短的关键帧视频，然后抽帧，将抽出的帧作为后续分镜的参考图
该功能约消耗200积分（平台方表示会尽量压到200以内）
重要性：以小博大——花一点积分生成关键帧视频，节省后续大量抽卡成本

⑤ 3D 片场（230积分）

可将图片转换为可编辑的3D场景
在3D场景中自由添加人物（可调位置、大小、角度）、调整摄像机机位（仰/俯/平视、过肩、正反打等）
截图后可作为分镜图，再结合人物、场景图用多参方式生成新图
解决了“同一场景多机位、人物站位不一致”的痛点
平台还提供公库3D场地模板（横店实景等），免费使用

⑥ 视频生成

建议练习时用 480P 低分辨率（省积分）
发自媒体用 720P 足够（平台会压缩，1080P较贵）
生成时可选择“智能镜头”（AI自动规划分镜）或关闭后自己写详细提示词
每个叙事单元内可垫入：人物图、场景图、道具图、关键分镜图 → 多参生成视频
提示词应包含：景别、主体运动、情绪基调、环境光线、镜头运动、时长

⑦ 预览与导出

可预览成片，查看各节点视频
有问题可回过来调整
支持导出视频或工程文件进入剪辑环节

2. 重要操作建议

不要浪费免费积分：所有提示词能改就改，体现自己的价值
分镜设计原则：一个分镜尽量完成一个动作和一种情绪，避免过多动作和情绪导致混乱
时长把控：根据对白长度调整分镜时长，太短会导致语速过快
前期质量决定后期：人物图、场景图的质量直接影响最终片子质量——越前期的工作越重要

四、创作要点总结

1. 剧本创作

开篇前几秒要抛出冲突或悬念，抓住观众注意力
剧情紧凑、反转、人物动机明确、台词合适
删除不必要的情节和对白（删除后故事依然成立即可删）

2. 分镜设计

一个分镜一个动作一种情绪
分镜提示词应包含：景别、主体运动、情绪基调、环境光线、镜头运动、时长
可添加反向提示词（如“不生成字幕”“不要穿模”）

3. 节奏把控

导演的核心能力是节奏
根据对白长度调整分镜时长，避免语速过快或节奏拖沓

4. 灯光与色彩

可在提示词中指定光线类型（硬光/软光）、方向、色温
经典三点布光（主光+辅光+背光）可写入提示词

五、AI时代的核心竞争力

审美：能分清楚好赖
会改：不用从零写，但会调整、优化
提示词能力：把画面需求翻译成AI能懂的语言
节奏感：导演对视频节奏的把控
学习能力：传统手艺（主分镜/辅助分镜、轴线、景别等）仍然有用，理解底层逻辑才能用好新工具

六、附加信息：轴线与越轴（简要回顾）

轴线：两个人物之间的隐形参考线，摄影机应保持在同一侧
不越轴：让剧情平缓过渡，符合正常视觉习惯
越轴：会产生“跳跃感”，可用于表现混乱、紧张的心理状态
入门阶段建议不越轴，理解规则后再有意识使用

本课精华观点：

AI时代，没有人拦着你进步，但也没有人能够替你进步。你拿的笔跟别人拿的笔一样，你拿的纸跟别人拿的纸一样。免费送了你这么多，怎么把这些东西内化成自己的能力？这是关键

二、本课作业：

三、我的作业（《阿满》参考图片资产+部分片段视频）

参考图片资产：

《阿满》的2分钟+视频粗剪

已关注

关注

重播分享赞

视频详情

❤️本课心得体会

💖

视频做出来了。两分多钟，不长，但导出的时候我心里挺踏实的。

做视频的过程挺纠结的，我真的很想几秒一个钩子，但是阿满的故事就是这么温情，怎么办啊！！！

阿满这个角色，从第一节课的作业里长出来，到第二课用八步法写出他的故事，再到第三课给他做人设、世界观，第四课写分镜……一路走过来，他对我来说已经不是一个“作业角色”了。他是我脑子里的一个人，一个蹲在湖边看小鹿、被小动物围着也不去伤害它们的、温柔的巨兽。

所以到了第五课，要让他真的“动起来”，我特别怕——怕出来的东西不是他，怕他变味了。

过程确实挺折腾的。免费额度有限，生成的东西经常不是我想的样子。有时候画面对了、情绪不对；有时候情绪对了、节奏又不对。我一遍遍改提示词、一遍遍重来，心里其实挺着急的。但我告诉自己：阿满都等了我这么久了，我不能随便交个东西就完了。

后来我慢慢找到了感觉。不是技术上的突破，是我终于放下了“要做得好看”这个念头，回到了最初为什么喜欢阿满的那个原点——他就是一只被世界推开、却依然温柔对待每一个小生命的巨兽。他遇到取经队伍的时候，不是去打，是去装凶，求人打自己，其实他一点都没有伤害别人……我也不知道该怎么说，就是命运的相遇吧。

导出之后我看了好几遍。不完美，很多地方还能更好。但他是阿满。他从我的文档里走出来，动了，活了。

这份作业让我最大的感受是：创作一个人，就像交一个朋友。你得花时间，得用心，得接受他不完美，但你会为他骄傲。

感谢阿满，也感谢那个没有放弃的自己。

下节课讲剪辑，敬请期待