我做了一个一键B站视频转字幕工具
B站大部分视频没有字幕,想把视频内容整理成笔记只能手打,效率太低。我需要一个可控、本地部署、长期可用的工作流。
GitHub: https://github.com/ylylyl123/bilibili-video-to-text
先说结论
我做了个本地可运行的工具:

粘贴B站链接 → 自动提取音频 → Whisper转写 → 导出字幕文件
整个过程在你的Mac或电脑上跑,不需要任何API密钥,不需要联网也能转写本地视频。
一次配置好,就能一直用下去。
它能做什么
这个工具帮你完成一件很具体的事:
把视频变成可编辑的文本。
具体支持:
-
B站视频链接,直接粘贴就开始转写 -
本地音频/视频文件,直接拖进去就能用 -
输出三种格式:SRT、VTT、TXT -
页面内直接复制字幕文本
转写用的是本地 Whisper 模型,数据不会离开你的电脑。
怎么实现的
技术链路其实很简洁,四步:
-
视频 → 音频:用 yt-dlp + ffmpeg 提取音轨 -
音频 → 文字:用 faster-whisper 本地离线转写 -
文字 → 字幕:输出 SRT / VTT / TXT 三种格式 -
字幕 → 知识库:直接喂给 Agent 做结构化整理,写入 Obsidian
关键点:全程本地运行,不需要任何API密钥。
Whisper base 模型对中文的转写效果已经足够好,日常使用完全没问题。
两种使用方式
方式一:B站链接输入
打开网页,粘贴视频URL,点击开始。
稍等几分钟,转写完成后,页面上会直接显示字幕结果。
你可以直接复制,也可以下载成文件。
方式二:本地文件上传
手机录的音视频、下载的教学视频、播客音频……
直接拖进页面,就能开始转写。
不需要上传到任何服务器,就在你本地处理。
用它来做什么
我自己主要用来:
-
把B站的技术教程转成文字,喂给 AI 做摘要和结构化 -
把行业分享视频转成笔记,沉淀到 Obsidian 知识库 -
把播客音频转成文字,方便后续写作引用
本质上,它解决的是”让视频内容流动起来”这个问题。
适合谁用
-
经常在B站刷学习视频、技术教程的人 -
需要把视频内容转成文字写文章、做整理的人 -
想建立个人知识库,将视频内容结构化的人 -
对本地部署工具感兴趣,愿意折腾一下的人
如果你只是想简单体验一下,我可以帮你部署。
技术门槛
说在前面:这个工具目前需要本地部署,需要一点动手能力。
你需要:
-
一台 Mac 或 Linux 电脑(Windows 也可以,步骤稍有不同) -
安装 Node.js、Python、ffmpeg、yt-dlp -
按照 README 里的步骤配置一下
大概 10-15 分钟能跑起来。
如果你愿意折腾,我来提供指引。
写在最后
做这个工具的初衷很简单:
让信息流动起来,而不是卡在某个视频里。
视频是很好的学习载体,但如果只能看不能用,那它的价值就大打折扣。
如果你也有类似的需求,欢迎来聊聊。
也许我可以帮你部署,也许我们可以一起做点更有意思的东西。
夜雨聆风