一款开源、全离线部署的AI数字人创建工具-夜雨聆风

一款开源、全离线部署的AI数字人创建工具

Duix.Avatar是一款开源、全离线部署的AI数字人创建工具，用户仅需提供10-15秒的个人视频即可本地化克隆自身形象与声音，生成高度拟真的口播视频，全程数据不上传云端，彻底解决隐私安全问题。其核心价值在于以极低成本（免费）替代传统商业数字人服务，硬件门槛显著降低（最低支持RTX 3060显卡），适合个人创作者、教育者及中小企业快速实现数字人内容生产。

一、核心功能与技术特点

1. 全离线本地化部署

所有数据处理（形象克隆、语音合成、视频生成）均在用户本地设备完成，无需联网或依赖云端服务，避免生物特征数据泄露风险。

采用Docker容器化技术封装三大核心服务：

ASR语音识别：基于FunASR实现本地语音转文本。

TTS语音合成：通过Fish-Speech技术克隆用户声纹，支持调节语速、情感等参数。

视频渲染引擎：精准同步口型与语音，口型匹配精度达98.2%，表情自然度超95%。

2. 低门槛高效创作

极简操作流程：上传10-15秒视频 → 输入文本/音频 → 一键生成数字人视频，全流程12分钟内完成（传统方案需45分钟以上）。

多语言支持：覆盖中、英、日、韩、法、德、阿拉伯语等8种语言，满足国际化需求。

硬件适配优化：最低仅需RTX 3060（8G显存）、32G内存，远低于行业平均要求（24G显存/64G内存）。