
GitHub 今日之星 | 2026年06月05日
KrillinAI:AI 视频翻译与配音工具
Go / GPL-3.0 / ⭐10,213
今日推荐
你是不是也在 B 站上看过一些海外博主的视频,被翻译成中文,配音自然、字幕精准,看起来就像国内博主做的?这种"视频跨语言"的能力在过去需要专业团队花几天时间完成。KrillinAI 把这个流程压缩到了一键完成——下载视频、识别语音、翻译、配音、加字幕、重新合成,全部自动化。100+ 语言支持,专为 YouTube、TikTok、B 站、抖音、小红书等平台优化。
创建者的初衷
KrillinAI 团队发现,视频语言障碍是内容创作者最大的痛点之一——好的海外内容想引入国内,或者国内内容想出海,翻译+配音+字幕的流程极其繁琐,通常要动用翻译人员、配音演员、后期剪辑三个人。他们想做一套全自动管线,让创作者只需一键操作,就能把视频转换成另一种语言,且保持自然流畅的观看体验。项目上线后迅速走红,目前 10,213 星,是 AI 视频翻译领域最受欢迎的开源项目。
核心功能

全链路自动化:下载视频(支持 yt-dlp 或本地文件上传)→ 语音识别(基于 Whisper 高精度)→ 智能字幕分割 → 专业翻译(LLM 驱动,保持语义自然)→ TTS 语音克隆配音 → 视频合成 → 封面生成。整条链路由 CLI 分阶段驱动,每个阶段输出结构化结果。
100+ 语言支持:覆盖几乎所有主流语言。LLM 驱动的翻译具有上下文感知能力,不是逐词翻译,而是理解语境后生成自然地道的译文,专业术语也可以一键替换。
语音克隆:提供基于 CosyVoice 的精选音色,也支持自定义声音克隆。配音效果接近真人,语调和节奏与原视频匹配。
Agent 友好:这是 KrillinAI 最独特的设计。每个能力阶段(下载、转录、翻译、配音)都可以通过 CLI 单独调用,AI Agent 可以按需编排单阶段或多阶段工作流。项目还提供了 skills/ 目录,每个阶段都有现成的 Skill 供 Claude Code、Cursor 等 AI 工具直接调用。
多平台适配:支持横屏和竖屏视频,自动处理字幕布局,输出适配各平台的格式。B 站、抖音、小红书、视频号、快手、YouTube、TikTok 全兼容。
安装部署
跨平台支持(Windows/Linux/macOS),提供桌面客户端、服务器模式和 CLI 三种使用方式。一键启动包下载即用,CLI 模式适合集成到自动化管线中。
git clone https://github.com/krillinai/KrillinAI.gitcd KrillinAI# 根据文档配置后启动
如果需要深度定制,项目完整开源,可以自行修改管线中的任意环节。
同类项目对比
VideoTrans(原 video-subtitle-master)是知名度很高的开源视频翻译工具,但主要聚焦字幕翻译,配音功能有限。RTranslator 更偏向实时语音翻译。Dub.ai 等商业方案的定价偏高(约 $10-30/月)。KrillinAI 的差异化在于:它覆盖了从下载到合成的全流程,支持语音克隆,而且 Agent 友好的接口设计让它不仅能服务于人类用户,还能被 AI Agent 自动化调用。开发语言选 Go 也让它在并发处理和性能上优于 Python 实现的同类工具。
可能带来的影响
视频内容的跨语言传播正在成为刚需——国内创作者想出海,海外创作者想进入中国市场,企业培训视频需要多语言版本。KrillinAI 让这个过程从"雇人做"变成了"一键做"。Agent 支持的设计更是打开了新的可能:想象一下,你只要给 Agent 一个视频链接和一句"翻译成日语",它就能自动完成下载、翻译、配音、合成、发布的全流程。这才是真正的内容生产自动化。
项目数据一览
- 开发语言:Go- 许可证:GPL-3.0- 当前 Stars:10,213- Forks:954- 创建时间:2024-12-17- 最近更新:2026-05-31- 官网:klic.studio- 适用平台:Windows / Linux / macOS
"语言不应该成为内容流通的壁垒。"——佚名
想搬运海外视频到国内,或者把自己的内容推向海外?KrillinAI 一键搞定翻译、配音、字幕,CLI 和 Agent 都能用。
—— 二万
夜雨聆风