达芬奇开源 AI 字幕插件,一键生成 AI 驱动的本地字幕工具
剪视频最烦的就是上字幕,虽然达芬奇 (DaVinci Resolve) Studio 版自带了自动字幕,但那是付费功能,而且对中文支持有时也很迷。
GitHub 上这个 AutoSubs 是个本地跑的 AI 字幕生成工具,最近刚更新了 V3 版本,后端用 Rust 重写了。它既能独立运行,也能通过 Lua 脚本直接集成到达芬奇里,一键把字幕甩到时间轴上。
简单总结,AutoSubs 是一款面向视频创作者的开源桌面应用程序,能够在本地设备上即时生成高质量的 AI 字幕。它既可以作为独立工具使用,也可以与 DaVinci Resolve(达芬奇剪辑软件)深度集成,为视频制作流程提供高效的字幕解决方案。

1. 核心功能
-
多语言转录:基于 OpenAI Whisper 模型,支持多语言转录。
-
说话人识别 (Diarization):利用 Pyannote 技术,自动区分不同说话人并分配颜色标签(做访谈类视频刚需)。
-
翻译功能:目前支持转录后翻译成英语(更多语言还在画饼中)。
-
隐私与本地化:所有模型都在本地跑,不走云端 API,不用担心素材泄露。
2. V3 版本技术细节
这次 V3 更新比较大,主要是解决了以前 Electron 版本资源占用高的问题:
-
性能提升:后端换成了 Rust,闲置内存占用降低了约 3 倍,说话人识别速度也变快了。
-
时间轴精准度:针对 可变帧率 (VFR) 和 丢帧 (Drop-frame) 的素材做了专门优化,字幕对位更准。
-
编辑器增强:
-
支持 多行字幕 编辑。
-
内置可调整大小的桌面预览器。
-
高级样式:支持每个说话人独立轨道,可自定义填充、描边和边框样式。
-
模型管理:支持多模型选择,带状态徽章,支持一键删除模型释放空间。

3. 两种工作模式
-
A. 独立模式 (Standalone Mode):
-
不需要装达芬奇也能用。
-
直接拖入音视频 -> 选模型/语言 -> 转录 -> 导出文件或复制文本。
-
B. DaVinci Resolve 模式 (集成):
-
通过达芬奇的
Workspace -> Scripts -> AutoSubs启动。 -
工作流:在脚本里选时间轴 -> 转录 -> 编辑 -> 点击按钮直接把带样式的字幕回写到达芬奇时间轴上。
4. 技术栈
-
技术构成:这是一个 Tauri 应用,代码分布大概是:TypeScript (54.1%), Rust (24.7%), Lua (16.2%) (Lua 主要用于跟达芬奇交互)。
-
平台支持:
-
Windows & macOS:提供一键安装包(macOS 支持 Apple Silicon 和 Intel)。
-
Linux:提供
.deb包。 -
目前下载量已经突破 10 万次。
5. 注意事项
-
达芬奇版本限制 :不支持 Mac App Store 版本的 DaVinci Resolve。因为沙盒机制限制,App Store 版无法加载外部 Lua 脚本。如果你是 App Store 下的,必须去官网重新下个免费版或 Studio 版才能用。
-
硬件门槛:虽然用 Rust 优化了,但跑 Whisper 和 Pyannote 依然是吃算力的。如果你的显卡显存太小 (VRAM < 4GB),跑大模型可能会报错或者巨慢。
-
模型下载:初次运行需要下载 AI 模型(Whisper 模型动辄几个 G),国内网络环境可能需要挂梯子或者自己折腾镜像,否则进度条会卡死。
总结
对于不想买达芬奇 Studio 版,又想拥有高质量自动字幕(尤其是需要区分说话人)的用户,AutoSubs 是目前开源界体验比较好的选择。V3 用 Rust 重构后,稳定性比以前那个 Python/Electron 混搭的版本强多了。
项目地址:
https://github.com/tmoroney/auto-subs
夜雨聆风
