乐于分享
好东西不私藏

告别熬夜剪视频!这款免费 AI 工具一键生成影视解说成品

告别熬夜剪视频!这款免费 AI 工具一键生成影视解说成品

点击下方名片,关注更多开源项目

项目介绍

你是否曾经花费大量时间,反复看片、手动截取画面、逐字撰写解说词,再一段一段地剪辑拼接,最后还要对口型配音、压制字幕?

NarratoAI 把这一切流程,压缩成了几次点击。

这是一款完全开源、免费的 AI 影视解说工具,基于大语言模型(LLM)实现从「视频理解」到「文案撰写」再到「自动剪辑、配音、字幕」的全链路自动化。无论你是短视频博主、影视解说创作者,还是想批量生产内容的团队,NarratoAI 都能大幅提升你的创作效率。


项目亮点

全流程自动化,告别重复劳动从视频分析、脚本生成,到剪辑、配音、字幕,一套流程跑完,中途几乎不需要人工干预。

支持多种主流大模型兼容 Gemini、DeepSeek R1/V3、阿里 Qwen2-VL 等视觉语言大模型,可根据成本和效果自由切换,灵活接入 302.AI、硅基流动等平台。

逐帧视觉分析,理解力强支持纪录片逐帧分析,AI 能真正「看懂」视频内容,而不是随机裁剪堆砌,生成的解说词与画面高度匹配。

语音克隆与多 TTS 引擎内置 IndexTTS2 语音克隆能力,支持 Azure、腾讯云等多家 TTS 服务,声音效果媲美真人解说。

低的使用成本接入硅基流动 API,剪辑一个 10 分钟的视频仅需约 0.1 元,适合高频量产场景。

部署门槛低支持 Docker 一键部署(Mac)和 Windows 整合包,开箱即用,无需折腾环境。


功能介绍

影视解说(纪录片/电影/剧集)

  1. 上传视频文件,填写剧情背景描述
  2. AI 逐帧分析画面,自动生成带时间戳的解说脚本(JSON 格式,可手动微调)
  3. 预览每个片段的画面与解说旁白,支持单段重新生成
  4. 一键裁剪视频、合成配音、压制字幕,输出成品

短剧解说与混剪

  • 支持短剧一键解说,自动提炼剧情高潮
  • 支持多段素材合并混剪,一键转录,一键清理缓存

灵活的音视频配置

  • 视频比例:横屏 / 竖屏(抖音 9:16)自由选择
  • 字幕:自定义字体、颜色、大小、描边、位置
  • 音频:选择朗读声音(男/女/方言)、调节音量和语速、添加背景音乐
  • 支持同时生成多个视频版本

AI 脚本智能生成

  • 自动检测脚本语言,无需手动指定
  • 支持导入自定义脚本文件,也可全自动生成
  • 生成内容包含:画面描述、时间戳、解说旁白,结构清晰

技术栈

类别

技术 / 服务

前端界面

Streamlit

大语言模型

OpenAI 兼容接口(Gemini、DeepSeek、Qwen2-VL 等)

视频处理

FFmpeg

语音合成

Azure TTS、腾讯云 TTS、IndexTTS2(语音克隆)

部署方式

Docker Compose、本地 Python 环境

开发语言

Python 3.12+

配置格式

TOML


UI 展示

主界面总览 — 视频脚本配置、视频设置、音频设置、字幕设置一屏呈现,清晰直观

基础设置 — 大模型供应商、API Key、模型名称一站配置

视频脚本配置 — 选择视频文件,填写剧情描述,点击一键生成脚本

AI 生成脚本预览 — 结构化 JSON 输出,包含时间戳、画面描述与解说旁白

视频审查 — 逐段预览视频画面与解说文案,支持单段重新生成

音频与字幕设置 — 自由配置朗读声音、音量、背景音乐及字幕样式

生成进度日志 — 实时展示剪辑参数与生成状态

视频生成完成 — 成品视频直接在页面内预览


项目交流平台
我们致力于创建一个前沿的技术探索平台,欢迎工程师和AI应用开发者加入。同时,我们也鼓励大家分享自己项目的实践心得与技术洞察,互相学习,共同创新!
 广告人士勿扰!警惕私聊诈骗,请勿轻信不明信息
交流技术  项目推广 商务合作  项目开发
项目技术交流添加备注666
点击阅读原文跳转到项目地址