一款开源、全离线部署的AI数字人创建工具
Duix.Avatar是一款开源、全离线部署的AI数字人创建工具,用户仅需提供10-15秒的个人视频即可本地化克隆自身形象与声音,生成高度拟真的口播视频,全程数据不上传云端,彻底解决隐私安全问题。其核心价值在于以极低成本(免费)替代传统商业数字人服务,硬件门槛显著降低(最低支持RTX 3060显卡),适合个人创作者、教育者及中小企业快速实现数字人内容生产。
一、核心功能与技术特点
1. 全离线本地化部署
所有数据处理(形象克隆、语音合成、视频生成)均在用户本地设备完成,无需联网或依赖云端服务,避免生物特征数据泄露风险。
采用Docker容器化技术封装三大核心服务:
ASR语音识别:基于FunASR实现本地语音转文本。
TTS语音合成:通过Fish-Speech技术克隆用户声纹,支持调节语速、情感等参数。
视频渲染引擎:精准同步口型与语音,口型匹配精度达98.2%,表情自然度超95%。
2. 低门槛高效创作
极简操作流程:上传10-15秒视频 → 输入文本/音频 → 一键生成数字人视频,全流程12分钟内完成(传统方案需45分钟以上)。
多语言支持:覆盖中、英、日、韩、法、德、阿拉伯语等8种语言,满足国际化需求。
硬件适配优化:最低仅需RTX 3060(8G显存)、32G内存,远低于行业平均要求(24G显存/64G内存)。




👍 有用就点赞+收藏+转发 三连支持
夜雨聆风