
自动识别字幕 自动翻译 自动配音 自动合成视频 支持本地部署 支持自动化工作流
Video│├─ ffmpeg ─────────────────────► Extract audio (16 kHz WAV)│├─ Whisper Large v3 ────────────► Word-level timestamps → sentence segments│├─ LLM (DeepSeek V4 Pro by default) ──► Translate each segment, respecting style profile│├─ TTS (Cartesia Sonic 3 by default) ─► Synthesize dubbed audio per segment│└─ ffmpeg ─────────────────────► Speed-align video to dubbed audio,concat with freeze-frame fallback,single-pass AAC encode the audio track,write output mp4 + optional SRT
现在很多人做视频,其实已经不是“剪视频”了。而是: 把海外内容搬到中文平台比如:
YouTube 科技频道 国外 AI 教程 TED 演讲 苹果发布会 OpenAI Demo
以前:人工翻译 + 人工配音 = 巨耗时间。现在:Violin 直接自动完成。
把中文视频做成海外版本,这个需求今年突然暴涨。尤其是:
TikTok YouTube Shorts Instagram Reels
很多国内视频创作者开始做:
英文版 日文版 韩文版 西班牙语版
AI 翻译工具一下子成了刚需。
做 AI 自动化视频工厂这个才是重点。现在很多团队已经开始:下载视频,自动提取字幕,自动翻译,AI 配音,自动生成多语言版本,批量发布,完全不用人工。这也是为什么最近“AI 视频矩阵”突然爆火。
你可以完全离线生产视频。等多个模块接入。官方项目已经支持:
Faster-Whisper Gemini OpenAI DeepL GPT-SoVITS EdgeTTS
本地运行
需要Python 3.10+和ffmpeg已添加到 PATH 环境变量中。
curl -LsSf https://astral.sh/uv/install.sh | sh # install uv if you don't have ituv tool install violin # recommended — faster, isolated# or: pip install violin # if you'd rather install into your current Python envexport TOGETHER_API_KEY=... # get one at https://api.together.ai (add to ~/.zshrc to persist)
三种使用方法:
1. CLI — 翻译单个文件:
violin lecture.mp4 lecture_zh.mp4 --language Chinese2. Web 应用— 完整的 REST API + 浏览器 UI:
violin-api# → http://127.0.0.1:8000 (browser UI)# → http://127.0.0.1:8000/docs (interactive API docs)
3. Claude Code 技能——可从任何 Claude Code 会话中调用:
violin --install-skill # one-time: copies the skill into ~/.claude/skills/claude> please use the violin skill to translate path/to/video.mp4 into Chinese
项目地址
官方网站: https://www.violin-ai.com/
GitHub: https://github.com/shang-zhu/violin

夜雨聆风