告别熬夜剪视频!这款免费 AI 工具一键生成影视解说成品

你是否曾经花费大量时间,反复看片、手动截取画面、逐字撰写解说词,再一段一段地剪辑拼接,最后还要对口型配音、压制字幕?
NarratoAI 把这一切流程,压缩成了几次点击。
这是一款完全开源、免费的 AI 影视解说工具,基于大语言模型(LLM)实现从「视频理解」到「文案撰写」再到「自动剪辑、配音、字幕」的全链路自动化。无论你是短视频博主、影视解说创作者,还是想批量生产内容的团队,NarratoAI 都能大幅提升你的创作效率。
项目亮点
全流程自动化,告别重复劳动从视频分析、脚本生成,到剪辑、配音、字幕,一套流程跑完,中途几乎不需要人工干预。
支持多种主流大模型兼容 Gemini、DeepSeek R1/V3、阿里 Qwen2-VL 等视觉语言大模型,可根据成本和效果自由切换,灵活接入 302.AI、硅基流动等平台。
逐帧视觉分析,理解力强支持纪录片逐帧分析,AI 能真正「看懂」视频内容,而不是随机裁剪堆砌,生成的解说词与画面高度匹配。
语音克隆与多 TTS 引擎内置 IndexTTS2 语音克隆能力,支持 Azure、腾讯云等多家 TTS 服务,声音效果媲美真人解说。
极低的使用成本接入硅基流动 API,剪辑一个 10 分钟的视频仅需约 0.1 元,适合高频量产场景。
部署门槛低支持 Docker 一键部署(Mac)和 Windows 整合包,开箱即用,无需折腾环境。
功能介绍
影视解说(纪录片/电影/剧集)
- 上传视频文件,填写剧情背景描述
- AI 逐帧分析画面,自动生成带时间戳的解说脚本(JSON 格式,可手动微调)
- 预览每个片段的画面与解说旁白,支持单段重新生成
- 一键裁剪视频、合成配音、压制字幕,输出成品
短剧解说与混剪
- 支持短剧一键解说,自动提炼剧情高潮
- 支持多段素材合并混剪,一键转录,一键清理缓存
灵活的音视频配置
- 视频比例:横屏 / 竖屏(抖音 9:16)自由选择
- 字幕:自定义字体、颜色、大小、描边、位置
- 音频:选择朗读声音(男/女/方言)、调节音量和语速、添加背景音乐
- 支持同时生成多个视频版本
AI 脚本智能生成
- 自动检测脚本语言,无需手动指定
- 支持导入自定义脚本文件,也可全自动生成
- 生成内容包含:画面描述、时间戳、解说旁白,结构清晰
技术栈
|
类别 |
技术 / 服务 |
|
前端界面 |
Streamlit |
|
大语言模型 |
OpenAI 兼容接口(Gemini、DeepSeek、Qwen2-VL 等) |
|
视频处理 |
FFmpeg |
|
语音合成 |
Azure TTS、腾讯云 TTS、IndexTTS2(语音克隆) |
|
部署方式 |
Docker Compose、本地 Python 环境 |
|
开发语言 |
Python 3.12+ |
|
配置格式 |
TOML |
UI 展示
主界面总览 — 视频脚本配置、视频设置、音频设置、字幕设置一屏呈现,清晰直观

基础设置 — 大模型供应商、API Key、模型名称一站配置

视频脚本配置 — 选择视频文件,填写剧情描述,点击一键生成脚本

AI 生成脚本预览 — 结构化 JSON 输出,包含时间戳、画面描述与解说旁白

视频审查 — 逐段预览视频画面与解说文案,支持单段重新生成

音频与字幕设置 — 自由配置朗读声音、音量、背景音乐及字幕样式

生成进度日志 — 实时展示剪辑参数与生成状态

视频生成完成 — 成品视频直接在页面内预览

广告人士勿扰!警惕私聊诈骗,请勿轻信不明信息。项目技术交流添加备注666



夜雨聆风