告别熬夜剪视频!这款免费 AI 工具一键生成影视解说成品-夜雨聆风

告别熬夜剪视频!这款免费 AI 工具一键生成影视解说成品

点击下方名片，关注更多开源项目

项目介绍

你是否曾经花费大量时间，反复看片、手动截取画面、逐字撰写解说词，再一段一段地剪辑拼接，最后还要对口型配音、压制字幕？

NarratoAI 把这一切流程，压缩成了几次点击。

这是一款完全开源、免费的 AI 影视解说工具，基于大语言模型（LLM）实现从「视频理解」到「文案撰写」再到「自动剪辑、配音、字幕」的全链路自动化。无论你是短视频博主、影视解说创作者，还是想批量生产内容的团队，NarratoAI 都能大幅提升你的创作效率。

项目亮点

全流程自动化，告别重复劳动从视频分析、脚本生成，到剪辑、配音、字幕，一套流程跑完，中途几乎不需要人工干预。

支持多种主流大模型兼容 Gemini、DeepSeek R1/V3、阿里 Qwen2-VL 等视觉语言大模型，可根据成本和效果自由切换，灵活接入 302.AI、硅基流动等平台。

逐帧视觉分析，理解力强支持纪录片逐帧分析，AI 能真正「看懂」视频内容，而不是随机裁剪堆砌，生成的解说词与画面高度匹配。

语音克隆与多 TTS 引擎内置 IndexTTS2 语音克隆能力，支持 Azure、腾讯云等多家 TTS 服务，声音效果媲美真人解说。

极低的使用成本接入硅基流动 API，剪辑一个 10 分钟的视频仅需约 0.1 元，适合高频量产场景。

部署门槛低支持 Docker 一键部署（Mac）和 Windows 整合包，开箱即用，无需折腾环境。

类别	技术 / 服务
前端界面	Streamlit
大语言模型	OpenAI 兼容接口（Gemini、DeepSeek、Qwen2-VL 等）
视频处理	FFmpeg
语音合成	Azure TTS、腾讯云 TTS、IndexTTS2（语音克隆）
部署方式	Docker Compose、本地 Python 环境
开发语言	Python 3.12+
配置格式	TOML