VoxCPM TTS声音克隆安装-图文教程

▍PART comfyUI教程合集

▍PART 流程简要

安装插件并导入工作流：在ComfyUI管理器中搜索 VoxCPM TTS 并安装。进入 \custom_nodes\ComfyUI-VoxCPM\example_workflows\，将 VoxCPM-example.json 拖入界面，立即 Ctrl+S 保存。
下载模型文件：从国内镜像 https://hf-mirror.com/openbmb/VoxCPM2/tree/main 下载 VoxCPM2 全部文件。放入 \models\TTS\VoxCPM\VoxCPM2（没有则手动新建）-。首次使用节点时会自动下载模型，自动下载失败才手动操作。
配置工作流节点：加载音频处选中你的录音（约10秒），VoxCPM Voice Cloning 的 model 选 VoxCPM2，lora_name 先选 none，transcript 处填充音频的内容以辅助模型对齐-。text 处输入想要克隆生成说的文本。保存音频节点默认每次运行自动保存到 \output\audio。
运行并验证：点击 Queue Prompt 运行，听一下效果。成功克隆后，你就能为后续的 视频截取 ➔ 人声分离 ➔ 声音克隆 高阶操作打下基础啦！

▍PART 正文

插件里面搜VoxCPM TTS 安装

把他里面的示例拖进来工作流在comfyui这个路径\custom_nodes\ComfyUI-VoxCPM\example_workflows\VoxCPM-example.json
保存下
你会看到他这个位置要选模型的

版本	参数规模	显存占用	关键信息
VoxCPM2	2 Billion (20亿)	约 8 GB--	这是最新的版本，采用无分词器架构，8GB显存即可运行
VoxCPM-1.5	1.5 Billion (15亿)	约 1.6 GB-	有信息提及，`显存<12GB` 时可使用该版本。
VoxCPM-0.5B	0.5 Billion (5亿)	约 1 GB	这是最轻量的版本，甚至可以在CPU或树莓派等边缘设备上运行-。