普通电脑如何本地运行 AI 视频生成?
ComfyUI Desktop + LTX-2.3 图生视频完整小白教程。
最近,AI 视频生成模型更新很快。
以前很多人觉得,本地部署 AI 视频模型是程序员、开发者、显卡玩家才会做的事。普通用户最多就是用网页工具,上传图片、输入提示词,然后等待云端生成。
但现在情况已经不同。
一些本地 AI 工具逐渐开始图形化,模型也出现了更适合普通电脑尝试的版本。只要电脑配置不是太低,普通用户也可以在自己的电脑上尝试运行 AI 视频生成模型。
这篇文章不做夸张宣传,也不鼓励任何不合规用途。
本文只讲一件事:
如何用 ComfyUI Desktop 在本地电脑上运行 LTX-2.3 视频模型,生成一个简单的图生视频。
适合对象:
第一次接触 ComfyUI 的用户; 想尝试本地 AI 视频生成的人; 不想一开始写代码的人; 想知道模型文件到底放哪里的用户; 经常遇到“模型不显示”“缺少文件”“显存不足”的用户。
整套流程可以简单理解为:
下载 ComfyUI Desktop↓安装并启动↓下载 LTX-2.3 视频模型↓把模型放到正确文件夹↓打开 LTX-2.3 图生视频工作流↓上传图片↓输入提示词↓设置视频时长和分辨率↓点击运行↓查看输出视频
一、先说结论:本文用什么工具和模型?
这篇教程使用的是:
工具:ComfyUI Desktop模型:LTX-2.3推荐版本:LTX-2.3 FP8主要玩法:图生视频
1. ComfyUI Desktop 是什么?
ComfyUI Desktop 是 ComfyUI 的桌面版,可以像普通软件一样安装使用。官方文档说明,ComfyUI Desktop 支持快速安装、自动配置 Python 环境和依赖,也支持导入已有的 ComfyUI 设置、模型、工作流和文件。
可以这样理解:
ComfyUI Desktop 是一个本地 AI 生成工具。模型负责生成图片或视频,ComfyUI 负责把模型、提示词、图片、参数和输出流程串起来。
它不是一个简单的聊天软件,而是一个视觉 AI 工作台。
2. LTX-2.3 是什么?
LTX-2.3 是 Lightricks 推出的开源音频与视频生成模型,ComfyUI 官方教程中已经提供 LTX-2.3 的工作流示例,并说明它支持更好的细节、竖屏视频、音视频生成、图生视频和提示词理解等能力。
这篇教程主要讲它的一个基础用法:
上传一张图片↓让图片生成几秒钟的视频
也就是常说的 图生视频。
二、下载地址和文件清单
这部分很重要。
最容易卡在这里:不知道下载哪个工具,不知道下载哪个模型,不知道文件放哪里。
下面直接列清楚。
1. 下载 ComfyUI Desktop
工具名称:
ComfyUI Desktop
下载入口:
ComfyUI 官方下载页
官网提供本地安装入口,并说明 ComfyUI 可以在本地硬件上运行。
你可以在搜索引擎搜索:
ComfyUI Desktop download
或者:
ComfyUI official download
进入官方页面后,下载对应系统版本。
如果是 Windows,就下载 Windows 版本。如果是 macOS,就下载 Mac 版本。
2. 下载 LTX-2.3 FP8 主模型
推荐先下载这个版本:
ltx-2.3-22b-dev-fp8.safetensors
模型页面:
Lightricks/LTX-2.3-fp8
Hugging Face 页面说明,这是 LTX-2.3 的 FP8 版本,属于 LTX-2.3 模型的量化版本。
为什么推荐 FP8?
因为它比完整精度版本更适合普通用户尝试。
注意:这不代表任何电脑都能轻松运行。AI 视频生成仍然吃显卡、显存、内存和硬盘空间。只是相对完整版本来说,FP8 对普通用户更友好。
3. 下载文本编码器
还需要一个文本编码器:
gemma_3_12B_it_fp4_mixed.safetensors
它的作用是帮助模型理解提示词。
ComfyUI 官方 LTX-2.3 教程中列出了 gemma_3_12B_it_fp4_mixed 作为相关模型文件,并给出 LTX-2.3 工作流使用方式。
可以理解为:
主模型负责生成视频,文本编码器负责理解你写的提示词。
如果缺少文本编码器,工作流可能会报错。
4. 可选:蒸馏 LoRA
文件名:
ltx-2.3-22b-distilled-lora-384.safetensors
用途:
配合特定工作流优化或加速
这个不是第一步必须。
如果你只是第一次尝试图生视频,可以先不下载。等基础流程跑通以后,再研究 LoRA、加速、增强等内容。
5. 可选:放大模型
文件名类似:
ltx-2.3-spatial-upscaler-x2-1.0.safetensors
或者新版页面中对应的 spatial upscaler 文件。
用途:
视频放大、细节增强
这个也不是第一次必须。
第一次不要把所有东西都装上,否则报错时不好判断问题出在哪里。
三、电脑配置怎么判断?
本地 AI 视频生成比普通图片生成更吃配置。
影响最大的通常是:
显卡显存内存硬盘空间散热
简单判断:
不要一开始就追求“最高画质”。
正确思路是:
先跑通流程再提高分辨率再延长时间再加复杂动作再研究增强工作流
四、安装 ComfyUI Desktop
第一步:安装软件
下载 ComfyUI Desktop 后,按正常软件方式安装。
安装时注意一个问题:
不要随便放在空间很小的系统盘。
AI 模型文件很大。一个模型可能十几 GB、几十 GB。后期还会有缓存、插件、输出视频。
建议专门准备一个目录:
D:/AI/ComfyUI/
或者:
E:/AI/ComfyUI/
如果你是 Mac,可以放在:
~/Documents/ComfyUI/
或者外置固态硬盘里。
第二步:首次启动
第一次打开 ComfyUI Desktop,它可能会配置运行环境。
这个过程可能需要一些时间。
不要看到它下载依赖、安装环境,就以为卡住了。第一次安装时间较长属于正常情况。
第三步:选择语言
如果软件支持中文,可以选择中文。
建议用中文界面,方便看模板、错误提示和模型路径。
第四步:选择硬件模式
启动时可能会让你选择硬件配置。
常见选项包括:
NVIDIA 显卡AMD 显卡CPU 模式手动配置
如果你是 NVIDIA 显卡,优先选 NVIDIA。
如果没有独立显卡,可以选 CPU 模式。但 CPU 模式生成视频通常比较慢,只适合测试,不适合高频使用。
五、模型文件应该放在哪里?
这是整篇教程最关键的部分。
很多不是不会安装,而是把模型放错了。
ComfyUI 通常有一个 models 文件夹。
里面会有不同类别:
ComfyUI/└── models/ ├── checkpoints/ ├── text_encoders/ ├── loras/ ├── vae/ ├── clip/ ├── diffusion_models/ └── latent_upscale_models/
不同模型要放到不同位置。
1. 主模型放 checkpoints
把这个文件:
ltx-2.3-22b-dev-fp8.safetensors
放到:
ComfyUI/models/checkpoints/
完整路径示例:
ComfyUI/models/checkpoints/ltx-2.3-22b-dev-fp8.safetensors
2. 文本编码器放 text_encoders
把这个文件:
gemma_3_12B_it_fp4_mixed.safetensors
放到:
ComfyUI/models/text_encoders/
完整路径示例:
ComfyUI/models/text_encoders/gemma_3_12B_it_fp4_mixed.safetensors
3. LoRA 放 loras
如果你下载了:
ltx-2.3-22b-distilled-lora-384.safetensors
放到:
ComfyUI/models/loras/
4. 放大模型放 latent_upscale_models
如果你下载了空间放大模型,比如:
ltx-2.3-spatial-upscaler-x2-1.0.safetensors
放到:
ComfyUI/models/latent_upscale_models/
5. 放好后必须重启
模型文件放好以后,不要直接运行。
先重启 ComfyUI。
标准流程:
关闭 ComfyUI↓重新打开 ComfyUI↓进入工作流↓查看模型是否能选择
很多时候,模型不显示不是因为模型坏了,而是因为软件还没有重新扫描。
六、打开 LTX-2.3 工作流
不要自己搭节点。
直接用模板。
LTX 官方文档建议,在 ComfyUI 中点击 Templates,搜索 LTX-2.3,然后选择模板,推荐从 Text to Video 或 Image to Video 开始,并通过 Download all 下载所需模型。
操作路径可以写成:
打开 ComfyUI↓点击 Templates / 模板↓搜索 LTX-2.3↓选择 Image to Video / 图生视频↓按提示下载缺失文件↓重启 ComfyUI
如果没有 LTX-2.3 模板怎么办?
可以安装 LTXVideo 节点。
项目名称:
ComfyUI-LTXVideo
GitHub 项目说明中写明,它是用于扩展 ComfyUI 对 LTX-2 视频生成模型支持的自定义节点集合。
安装方法:
打开 ComfyUI↓点击 Manager↓选择 Install Custom Nodes↓搜索 LTXVideo↓安装↓重启 ComfyUI
如果你没有 Manager,需要先安装 ComfyUI Manager。不过如果你使用的是新版 ComfyUI Desktop,很多模板和依赖已经更容易处理。
七、第一次建议用图生视频
LTX-2.3 可以做文生视频,也可以做图生视频。
第一次建议用:
Image to Video / 图生视频
原因很简单:
文生视频完全靠提示词生成画面,随机性更强。
图生视频先给一张图片,AI 只需要让它动起来,画面更容易控制。
第一次测试不要追求复杂效果。
建议选择:
人物坐着产品摆拍桌面物体电脑场景风景图片简单室内画面
不要一开始就用:
多人画面复杂舞蹈快速动作打斗动作手部特写极复杂背景
这类画面更容易变形。
八、上传图片怎么选?
图片质量会直接影响生成效果。
建议选择:
主体清楚光线稳定背景干净人物不要太小不要严重模糊不要多人重叠不要强遮挡
比如你可以用:
一个人在桌前看电脑一个橘子放在笔记本电脑旁边一个机器人站在科技工作台前一个产品放在干净桌面上一个城市夜景画面
如果图片本身很乱,AI 生成视频时也容易乱。
九、提示词怎么写?
很多人第一次失败,是因为提示词写得太满。
第一次不要写复杂剧情。
建议公式:
主体 + 小动作 + 镜头运动 + 光线 + 风格
例如:
A person sitting at a desk, slightly turning the head, soft warm lighting, slow camera push in, realistic motion, cinematic style.
中文意思:
一个人坐在书桌前,轻微转头,柔和暖光,镜头缓慢推进,动作真实自然,电影感风格。
如果是产品画面:
An orange on a MacBook trackpad, subtle glow, futuristic digital scale interface, slow camera movement, minimalist workspace, soft lighting.
中文意思:
一个橘子放在 MacBook 触控板上,轻微发光,未来感电子秤界面,镜头缓慢移动,极简工作台,柔和光线。
如果是科技类素材:
A futuristic AI workstation, glowing data panels, laptop on the desk, slow camera movement, blue cyberpunk lighting, clean and realistic.
中文意思:
未来感 AI 工作台,发光的数据面板,桌面上有笔记本电脑,镜头缓慢移动,蓝色科技光线,干净真实。
十、第一次参数怎么设置?
视频生成最容易消耗资源的参数有:
分辨率视频时长帧数采样步数增强组件放大模型
第一次测试建议保守一点。
1. 视频时长
第一次建议:
3 秒到 5 秒
不要一上来就 10 秒、20 秒。
先确认流程能跑通。
2. 分辨率
如果你想做竖屏视频,可以先用:
720 × 1280
如果显存紧张,可以更低:
576 × 1024
或者:
512 × 768
如果做横屏演示,可以用:
1280 × 720
但如果显存不足,就先降低。
3. 动作幅度
第一次建议使用轻动作:
轻微转头眨眼微笑镜头推进光线变化头发轻微飘动背景轻微运动
不建议第一次就写:
快速跳舞奔跑激烈转身多人互动复杂手部动作大幅度肢体动作
十一、点击运行
检查以下内容:
图片是否上传主模型是否选对文本编码器是否加载提示词是否填写分辨率是否合理视频时长是否太长
然后点击运行。
运行过程中不要反复点击,不要频繁改参数。
如果软件显示正在处理,就等待完成。
十二、视频生成后保存在哪里?
不同 ComfyUI 版本路径可能略有不同,但一般在输出目录。
常见位置:
ComfyUI/output/
或者:
ComfyUI/outputs/
也可能在:
ComfyUI/output/video/
你可以在 ComfyUI 界面里找“打开输出目录”。
如果找不到,就在 ComfyUI 安装目录里搜索:
output
生成的视频通常是:
.mp4.webm.mov
十三、常见问题排查
问题 1:模型下载了,但 ComfyUI 里不显示
检查:
是否放到 checkpoints 文件夹是否重启 ComfyUI文件是否下载完整文件后缀是否正确当前工作流是否支持这个模型
很多时候,问题不是模型坏了,而是路径不对。
问题 2:提示缺少 text encoder
检查是否下载了:
gemma_3_12B_it_fp4_mixed.safetensors
并确认放在:
ComfyUI/models/text_encoders/
问题 3:提示显存不足
解决方法:
降低分辨率缩短视频时长减少采样步数关闭放大模型不要使用额外增强组件换低显存工作流重启电脑后再试
显存不足时,不要硬跑。
先用低参数跑通,再逐步提高。
问题 4:生成速度太慢
可能原因:
显卡性能不足使用了 CPU 模式分辨率过高视频时间太长模型太大后台程序占用资源
解决方法:
关闭其他占显卡的软件降低分辨率缩短时长先测试 3 秒不要同时开多个生成任务
问题 5:人物变形、手部错误、画面不稳定
这是目前 AI 视频生成的常见问题。
可以这样改善:
输入图片更清晰动作幅度更小减少复杂手势缩短视频时间降低画面复杂度提示词写得更具体避免多人互动
不要期待第一次就生成稳定大片。
AI 视频生成现在仍然需要不断试参数。
问题 6:工作流里找不到 LTX-2.3
解决方法:
更新 ComfyUI进入 Templates 搜索 LTX-2.3如果没有,安装 ComfyUI-LTXVideo安装后重启重新打开模板
十四、第一次建议这样做
第一次不要贪多。
建议只做一个最简单的测试。
测试方案一:人物图生视频
准备一张人物坐在桌前的图片。
提示词:
A person sitting at a desk, slightly turning the head, soft warm lighting, slow camera push in, realistic motion, cinematic style.
参数:
时长:3-5 秒分辨率:576 × 1024 或 720 × 1280动作:轻微动作
测试方案二:产品图生视频
准备一张产品摆拍图。
提示词:
A product on a clean desk, subtle camera movement, soft lighting, realistic texture, minimalist workspace, cinematic style.
参数:
时长:3-5 秒分辨率:720 × 1280动作:镜头轻微推进
测试方案三:科技配图视频
准备一张 AI 工作台或电脑桌面图。
提示词:
A futuristic AI workspace with glowing data panels, laptop on the desk, slow camera movement, blue cyberpunk lighting, clean and realistic.
参数:
时长:3-5 秒分辨率:1280 × 720 或 720 × 1280动作:镜头缓慢移动
十五、合规使用提醒
本地 AI 视频生成只是创作工具,不代表可以随意使用。
建议遵守以下原则:
1. 不生成违法违规内容
不要生成涉及低俗、暴力血腥、诈骗引导、侵权仿冒、恶意攻击等内容。
2. 不滥用他人肖像
不要未经同意使用他人的照片、声音、身份特征生成视频。
尤其是:
公众人物身边熟人未成年人同事客户普通路人
更要谨慎。
3. 不制造虚假信息
AI 视频很容易被误认为真实内容。
如果内容明显经过 AI 生成,建议在发布时进行适当说明,避免误导他人。
本地部署不等于没有边界。
十六、为什么不建议追最大模型?
很多人一看到模型页面,就想下载最大的。
这个思路不一定对。
最大模型通常意味着:
下载时间更长硬盘占用更大显存压力更高报错概率更高运行速度更慢
第一目标不是“画质最好”,而是:
能打开能加载能运行能输出能排错
只有流程跑通了,后面才有优化空间。
如果第一步就卡死在大模型上,很容易浪费大量时间。
十七、本地 AI 视频生成的真实体验
客观说,本地 AI 视频生成现在已经比过去方便很多,但还远远不是“点一下就完美”。
你可能会遇到:
模型下载慢显存不够路径放错工作流报错节点缺失人物变形动作不自然输出时间长
这些都是正常情况。
不要把它理解成普通手机 App。
它更像一个半专业工具。
优点是自由度高,能本地运行,能调参数,能接入自己的工作流。
缺点是学习成本比在线工具高。
十八、学习路线
如果你是第一次接触,建议按下面的顺序来。
第一阶段:先会安装
目标:
安装 ComfyUI Desktop启动成功知道 models 文件夹在哪里
第二阶段:先会放模型
目标:
主模型放 checkpoints文本编码器放 text_encodersLoRA 放 loras放大模型放 latent_upscale_models
第三阶段:先会跑通图生视频
目标:
打开 LTX-2.3 图生视频模板上传图片填写简单提示词生成 3-5 秒视频找到输出文件
第四阶段:学会排错
目标:
模型不显示知道查路径缺少文件知道看报错显存不足知道降参数效果不好知道改提示词
第五阶段:再做内容生产
目标:
封面动态素材短视频背景素材产品展示视频AI 工具教程配图技术类视频演示
十九、完整操作清单
最后给一份检查表。
照着检查,能少踩很多坑。
□ 已下载 ComfyUI Desktop□ 已安装并成功启动□ 已确认电脑显卡和显存情况□ 已下载 ltx-2.3-22b-dev-fp8.safetensors□ 主模型已放入 ComfyUI/models/checkpoints/□ 已下载 gemma_3_12B_it_fp4_mixed.safetensors□ 文本编码器已放入 ComfyUI/models/text_encoders/□ 已重启 ComfyUI□ 已打开 Templates / 模板□ 已搜索 LTX-2.3□ 已选择 Image to Video / 图生视频□ 已上传测试图片□ 已输入简单提示词□ 视频时长设置为 3-5 秒□ 分辨率没有一开始拉太高□ 已点击运行□ 已在 output 目录找到生成视频
二十、结尾:先跑通,再优化
本地 AI 视频生成不是魔法。
它不是一句提示词就一定出大片,也不是所有电脑都能无压力运行。
但它确实给普通用户打开了一条新的路径:
不完全依赖云端平台,也可以在自己的电脑上尝试 AI 视频生成。
对来说,最重要的不是一开始追求多高画质,而是先把流程跑通。
先完成第一条闭环:
下载工具↓下载模型↓放对路径↓打开工作流↓上传图片↓生成视频
只要这条链路跑通了,后面的事情就清楚了。
你可以继续研究:
更好的提示词更高分辨率更长视频更稳定的人物动作更适合短视频平台的比例更适合封面素材更完整的本地 AI 工作流
AI 工具一直在变。
真正值得沉淀的,不是某一个模型名字,也不是某一个教程截图,而是你自己能掌握的那套方法:
知道工具叫什么知道模型在哪里下知道文件放哪里知道报错怎么看知道参数怎么降知道合规边界在哪里
这样,以后不管模型怎么更新,工具怎么变化,你都不会每次从零开始。
夜雨聆风