【工具】AI 全自动短视频生成流水线

【工具】AI 全自动短视频生成流水线 | Pixelle-Video

转载请注明出处：小锋学长生活大爆炸[xfxuezhagn.cn]

如果本文帮助到了你，欢迎[点赞、收藏、关注]哦~

做短视频这件事，真正麻烦的，从来不只是“剪辑”。而是从选题开始，到文案、配图、配音、配乐、模板、分镜，再到最后导出成片，整个链路里有太多琐碎步骤。很多人并不是不会做内容，而是被制作流程劝退了。

最近学长看到一个挺有意思的开源项目，叫 Pixelle-Video。它的目标非常直接，就是把“输入一个主题，自动生成一条完整视频”这件事，尽可能做成现实。只需输入一个主题，Pixelle-Video 就能自动完成：

• ✍️ 撰写视频文案
• 🎨 生成 AI 配图/视频
• 🗣️ 合成语音解说
• 🎵 添加背景音乐
• 🎬 一键合成视频

真正的零门槛、零剪辑经验，让视频创作成为一句话的事！该项目当前在 GitHub 上已经有 5.7k stars。

大家可以去Github上看演示视频，效果还是挺不错的：https://github.com/AIDC-AI/Pixelle-Video

技术路线

官方架构文档显示，Pixelle-Video 采用分层设计，主要分成Web 层、服务层和ComfyUI 层。Web 层使用 Streamlit，服务层负责核心业务逻辑，ComfyUI 层承担图像和 TTS 生成。

核心组件包括 PixelleVideoCore、LLM Service、Image Service、TTS Service 和 Video Generator。

技术栈则包括 Python、AsyncIO、Streamlit、OpenAI 兼容接口和 ComfyUI。

这种架构的好处，是前端体验和底层能力编排相对解耦。对普通用户来说，看到的是一个可操作的 Web UI。对开发者来说，背后其实是一个可以替换模型、替换工作流、扩展模板的系统。项目允许在预置工作流基础上进行自定义，也支持不同类型的媒体工作流与模板参数。

快速开始

Windows 一键整合包

无需安装 Python、uv 或 ffmpeg，一键开箱即用！

👉 下载一键整合包:https://github.com/AIDC-AI/Pixelle-Video/releases/latest

1. 下载最新的一键整合包并解压
2. 双击运行 start.bat 启动 Web 界面
3. 浏览器会自动打开 http://localhost:8501/
4. 在「⚙️ 系统配置」中配置 LLM API 和图像生成服务
5. 开始生成视频！

💡 提示: 整合包已包含所有依赖，无需手动安装任何环境。首次使用只需配置 API 密钥即可。

从源码安装

适合 macOS / Linux 用户或需要自定义的用户

前置环境依赖

在开始之前，需要先安装 Python 包管理器 uv 和视频处理工具 ffmpeg：

安装 uv

请访问 uv 官方文档查看适合你系统的安装方法：

uv 安装指南：https://docs.astral.sh/uv/getting-started/installation/

安装完成后，在终端中运行 uv --version 验证安装成功。

安装 ffmpeg

macOS

1
brew install ffmpeg

Ubuntu / Debian

1
2
sudo apt updatesudo apt install ffmpeg

Windows

• 下载地址：https://ffmpeg.org/download.html
• 下载后解压，将 bin 目录添加到系统环境变量 PATH 中

安装完成后，在终端中运行 ffmpeg -version 验证安装成功。

第一步：下载项目

1
2
git clone https://github.com/AIDC-AI/Pixelle-Video.gitcd Pixelle-Video

第二步：启动 Web 界面

使用 uv 运行（推荐，会自动安装依赖）

1
uv run streamlit run web/app.py

浏览器会自动打开http://localhost:8501/

第三步：在 Web 界面配置

首次使用时，展开「⚙️ 系统配置」面板，填写：

• LLM 配置: 选择 AI 模型（如通义千问、GPT 等）并填入 API Key
• 图像配置: 如需生成图片，配置 ComfyUI 地址或 RunningHub API Key

配置好后点击「保存配置」，就可以开始生成视频了！

最后

如果你最近正好在关注 AI 视频、内容自动化、ComfyUI 工作流编排，或者想找一个能从“主题”一路走到“成片”的开源项目，Pixelle-Video 确实值得放进收藏夹。它未必已经是最终答案，但它很像一个正在逼近真实生产场景的答案。至少从今天来看，这已经不是“AI 能不能做视频”的问题了，而是“我们能不能把视频制作，变成一条可复用的自动化流程”。