乐于分享
好东西不私藏

达芬奇开源 AI 字幕插件,一键生成 AI 驱动的本地字幕工具

达芬奇开源 AI 字幕插件,一键生成 AI 驱动的本地字幕工具

剪视频最烦的就是上字幕,虽然达芬奇 (DaVinci Resolve) Studio 版自带了自动字幕,但那是付费功能,而且对中文支持有时也很迷。

GitHub 上这个 AutoSubs 是个本地跑的 AI 字幕生成工具,最近刚更新了 V3 版本,后端用 Rust 重写了。它既能独立运行,也能通过 Lua 脚本直接集成到达芬奇里,一键把字幕甩到时间轴上。

简单总结,AutoSubs 是一款面向视频创作者的开源桌面应用程序,能够在本地设备上即时生成高质量的 AI 字幕。它既可以作为独立工具使用,也可以与 DaVinci Resolve(达芬奇剪辑软件)深度集成,为视频制作流程提供高效的字幕解决方案。

1. 核心功能
  • 多语言转录:基于 OpenAI Whisper 模型,支持多语言转录。

  • 说话人识别 (Diarization):利用 Pyannote 技术,自动区分不同说话人并分配颜色标签(做访谈类视频刚需)。

  • 翻译功能:目前支持转录后翻译成英语(更多语言还在画饼中)。

  • 隐私与本地化:所有模型都在本地跑,不走云端 API,不用担心素材泄露。

2. V3 版本技术细节

这次 V3 更新比较大,主要是解决了以前 Electron 版本资源占用高的问题:

  • 性能提升:后端换成了 Rust,闲置内存占用降低了约 3 倍,说话人识别速度也变快了。

  • 时间轴精准度:针对 可变帧率 (VFR) 和 丢帧 (Drop-frame) 的素材做了专门优化,字幕对位更准。

  • 编辑器增强

    • 支持 多行字幕 编辑。

    • 内置可调整大小的桌面预览器。

    • 高级样式:支持每个说话人独立轨道,可自定义填充、描边和边框样式。

  • 模型管理:支持多模型选择,带状态徽章,支持一键删除模型释放空间。

3. 两种工作模式
  • A. 独立模式 (Standalone Mode)

    • 不需要装达芬奇也能用。

    • 直接拖入音视频 -> 选模型/语言 -> 转录 -> 导出文件或复制文本。

  • B. DaVinci Resolve 模式 (集成)

    • 通过达芬奇的 Workspace -> Scripts -> AutoSubs 启动。

    • 工作流:在脚本里选时间轴 -> 转录 -> 编辑 -> 点击按钮直接把带样式的字幕回写到达芬奇时间轴上。

4. 技术栈
  • 技术构成:这是一个 Tauri 应用,代码分布大概是:TypeScript (54.1%)Rust (24.7%)Lua (16.2%) (Lua 主要用于跟达芬奇交互)。

  • 平台支持

    • Windows & macOS:提供一键安装包(macOS 支持 Apple Silicon 和 Intel)。

    • Linux:提供 .deb 包。

    • 目前下载量已经突破 10 万次

5. 注意事项
  • 达芬奇版本限制 不支持 Mac App Store 版本的 DaVinci Resolve。因为沙盒机制限制,App Store 版无法加载外部 Lua 脚本。如果你是 App Store 下的,必须去官网重新下个免费版或 Studio 版才能用。

  • 硬件门槛:虽然用 Rust 优化了,但跑 Whisper 和 Pyannote 依然是吃算力的。如果你的显卡显存太小 (VRAM < 4GB),跑大模型可能会报错或者巨慢。

  • 模型下载:初次运行需要下载 AI 模型(Whisper 模型动辄几个 G),国内网络环境可能需要挂梯子或者自己折腾镜像,否则进度条会卡死。

总结

对于不想买达芬奇 Studio 版,又想拥有高质量自动字幕(尤其是需要区分说话人)的用户,AutoSubs 是目前开源界体验比较好的选择。V3 用 Rust 重构后,稳定性比以前那个 Python/Electron 混搭的版本强多了。

项目地址:

https://github.com/tmoroney/auto-subs

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 达芬奇开源 AI 字幕插件,一键生成 AI 驱动的本地字幕工具

评论 抢沙发

6 + 7 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮