乐于分享
好东西不私藏

10万+下载量爆火!这个开源字幕神器让达芬奇用户彻底告别手动打字

10万+下载量爆火!这个开源字幕神器让达芬奇用户彻底告别手动打字


刷短视频的时候,你有没有遇到过那种没字幕的视频?尤其在地铁上,手机静音,视频里人叽里呱啦说半天,没字幕直接划走,内容再好也白搭。

做视频的都知道,加字幕这事儿最磨人。剪映自动识别?得开会员。自己手动敲?一句话一句话对时间轴,遇到访谈节目里几个人同时说话,简直想砸键盘。

今天给你安利个AutoSubs,这玩意儿在 GitHub 上已经火了好一阵子,下载量早就破了十万。关键是完全免费本地跑,视频不用上传到什么奇奇怪怪的服务器,隐私安全感拉满。

AutoSubs界面预览

这玩意儿到底能干啥

说白了就是一键生成字幕,但比你想的要聪明得多。

它底层用的是 OpenAI 的 Whisper 模型,识别准确度在开源界算是顶流水平。不光能把语音转成文字,还能自动识别不同的人在说话,给每个人的字幕标上不同的颜色。做播客、访谈、对话类视频的朋友,这个功能真的能救命,再也不用手动标”主持人”、”嘉宾A”了。

而且它支持50多种语言,中文、英文、日文啥的都不在话下。转录完还能直接翻译成英文,虽然暂时只支持英译,但做双语字幕的半条命已经保住了。

安装这事儿,比你想的简单

别被”开源”俩字吓到,作者把安装包都给你整好了,一键安装,跟装微信差不多。

Windows 和 macOS 用户:直接去 GitHub 项目主页,README 文件里有蓝色的大按钮,点一下就能下载安装包。macOS 不管是 Intel 还是 Apple Silicon 的芯片,都有对应的版本,别下错了就行。

Linux 用户:稍微麻烦一丢丢,得用命令行。打开终端,复制粘贴这几行:

wget https://github.com/tmoroney/auto-subs/releases/latest/download/AutoSubs-linux-x86_64.deb
sudo apt install ./AutoSubs-linux-x86_64.deb
sudo dpkg -i AutoSubs-linux-x86_64.deb && sudo apt -f install

搞定之后,你就能在应用列表里找到它。

特别提醒一句:如果你要在 DaVinci Resolve 里面用,千万别装 Mac App Store 版本的那个达芬奇。因为苹果沙盒机制的限制,App Store 版没法加载外部的 Lua 脚本。你得去 Blackmagic 官网下个免费版或者 Studio 版才行,这点坑了不少人。

两种用法,看你怎么顺手

AutoSubs 给了两条路,都挺丝滑。

独立模式:把视频或者音频文件直接拖进软件,选一下语言,点”开始转录”,等几分钟就完事了。转录完还能在软件里直接编辑字幕,调整好之后再导出 SRT 文件,随便你扔到哪个剪辑软件里用。

达芬奇插件模式:这个更爽。打开 DaVinci Resolve,顶部菜单栏选 Workspace → Scripts → AutoSubs,界面就蹦出来了。它会自动识别你时间线上的音频轨道,选好轨道点开始,字幕生成之后直接就能一键发送到时间线,连导入都省了。

而且啊,在达芬奇里用的时候,你可以先做一个 Text+ 的字幕模板,调好字体、颜色、描边,扔 media pool 里。AutoSubs 生成字幕的时候会自动套用这个模板,生成的字幕直接就是你想要的样式,不用一个个手动调。

实际用起来咋样

先说优点。转录速度挺快,V3 版本用 Rust 重写了后端,内存占用比老版本低了差不多三倍。一般 10 分钟的视频,MacBook Pro 上两三分钟就能跑完。

说话人分离这个功能,准确率还挺惊喜。两个人对话的场景,基本都能正确区分,还会自动给不同人分配颜色。你可以在设置里给每个说话人单独调整字幕样式,比如主持人用白色,嘉宾用黄色,层次感一下就出来了。

它内置的字幕编辑器也挺好使,每句话的时间点都标得清清楚楚,错了直接点进去改,支持多行显示。要是音频质量还行,基本不用怎么校对就能直接用。

当然也有槽点。翻译功能确实比较鸡肋,目前只能翻译成英文,选择余地太小。还有就是第一次用的时候得下载 AI 模型,Whisper 模型动辄几个 G,如果你网络环境一般,进度条可能会卡一会儿,耐心等等就好。

硬件方面,虽然优化过了,但跑这种 AI 模型还是要吃显存的。如果你电脑显卡比较老,VRAM 不到 4G,建议选小一点的模型,不然可能会慢到怀疑人生。

值得试试不

如果你跟我一样,经常做访谈、播客或者课程视频,最头疼的就是区分谁在说话,那 AutoSubs 真的值得一试。它把最麻烦的那一步自动化了,而且完全本地运行,不用担心什么隐私泄露的问题。

其实市面上类似的工具不少,但要么收费,要么得联网上传视频。AutoSubs 这种开源、免费、本地跑、还能和达芬奇深度集成的,确实算得上宝藏。

作者 Tom Moroney 是个刚毕业没多久的程序员,这项目现在已经拿了 1000 多 star,维护得还挺勤快。最近版本更新到 V3 之后,稳定性比以前那个 Python 混搭 Electron 的老版本强太多了。

GitHub 地址:

https://github.com/tmoroney/auto-subs

有空去下个试试,反正不要钱,万一顺手了呢。

专注分享 GitHub知识,分享AI 资讯和AI搞米经验,分享AI Agent使用经验

领取完整版OpenClaw资料的小伙伴,点赞+在看,扫码加我VX,备注“github