【工具】AI 全自动短视频生成流水线 | Pixelle-Video
转载请注明出处:小锋学长生活大爆炸[xfxuezhagn.cn]
如果本文帮助到了你,欢迎[点赞、收藏、关注]哦~
做短视频这件事,真正麻烦的,从来不只是“剪辑”。而是从选题开始,到文案、配图、配音、配乐、模板、分镜,再到最后导出成片,整个链路里有太多琐碎步骤。很多人并不是不会做内容,而是被制作流程劝退了。
最近学长看到一个挺有意思的开源项目,叫 Pixelle-Video。它的目标非常直接,就是把“输入一个主题,自动生成一条完整视频”这件事,尽可能做成现实。只需输入一个主题,Pixelle-Video 就能自动完成:
-
• ✍️ 撰写视频文案 -
• 🎨 生成 AI 配图/视频 -
• 🗣️ 合成语音解说 -
• 🎵 添加背景音乐 -
• 🎬 一键合成视频
真正的零门槛、零剪辑经验,让视频创作成为一句话的事!该项目当前在 GitHub 上已经有 5.7k stars。
大家可以去Github上看演示视频,效果还是挺不错的:https://github.com/AIDC-AI/Pixelle-Video




技术路线

官方架构文档显示,Pixelle-Video 采用分层设计,主要分成Web 层、服务层和ComfyUI 层。Web 层使用 Streamlit,服务层负责核心业务逻辑,ComfyUI 层承担图像和 TTS 生成。
核心组件包括 PixelleVideoCore、LLM Service、Image Service、TTS Service 和 Video Generator。
技术栈则包括 Python、AsyncIO、Streamlit、OpenAI 兼容接口和 ComfyUI。
这种架构的好处,是前端体验和底层能力编排相对解耦。对普通用户来说,看到的是一个可操作的 Web UI。对开发者来说,背后其实是一个可以替换模型、替换工作流、扩展模板的系统。项目允许在预置工作流基础上进行自定义,也支持不同类型的媒体工作流与模板参数。
快速开始
Windows 一键整合包
无需安装 Python、uv 或 ffmpeg,一键开箱即用!
👉 下载一键整合包:https://github.com/AIDC-AI/Pixelle-Video/releases/latest
-
1. 下载最新的一键整合包并解压 -
2. 双击运行 start.bat启动 Web 界面 -
3. 浏览器会自动打开 http://localhost:8501/ -
4. 在「⚙️ 系统配置」中配置 LLM API 和图像生成服务 -
5. 开始生成视频!
💡 提示: 整合包已包含所有依赖,无需手动安装任何环境。首次使用只需配置 API 密钥即可。
从源码安装
适合 macOS / Linux 用户或需要自定义的用户
前置环境依赖
在开始之前,需要先安装 Python 包管理器 uv 和视频处理工具 ffmpeg:
安装 uv
请访问 uv 官方文档查看适合你系统的安装方法:
uv 安装指南:https://docs.astral.sh/uv/getting-started/installation/
安装完成后,在终端中运行 uv --version 验证安装成功。
安装 ffmpeg
macOS
1 brew install ffmpeg
Ubuntu / Debian
1 2 sudo apt updatesudo apt install ffmpeg
Windows
-
• 下载地址:https://ffmpeg.org/download.html -
• 下载后解压,将 bin目录添加到系统环境变量 PATH 中
安装完成后,在终端中运行 ffmpeg -version 验证安装成功。
第一步:下载项目
1 2 git clone https://github.com/AIDC-AI/Pixelle-Video.gitcd Pixelle-Video
第二步:启动 Web 界面
使用 uv 运行(推荐,会自动安装依赖)
1 uv run streamlit run web/app.py
浏览器会自动打开http://localhost:8501/
第三步:在 Web 界面配置
首次使用时,展开「⚙️ 系统配置」面板,填写:
-
• LLM 配置: 选择 AI 模型(如通义千问、GPT 等)并填入 API Key -
• 图像配置: 如需生成图片,配置 ComfyUI 地址或 RunningHub API Key
配置好后点击「保存配置」,就可以开始生成视频了!
最后
如果你最近正好在关注 AI 视频、内容自动化、ComfyUI 工作流编排,或者想找一个能从“主题”一路走到“成片”的开源项目,Pixelle-Video 确实值得放进收藏夹。它未必已经是最终答案,但它很像一个正在逼近真实生产场景的答案。至少从今天来看,这已经不是“AI 能不能做视频”的问题了,而是“我们能不能把视频制作,变成一条可复用的自动化流程”。
夜雨聆风
