乐于分享
好东西不私藏

开源免费AI人声生成工具SoulX-Singer如何部署使用?

开源免费AI人声生成工具SoulX-Singer如何部署使用?

上和弦

上和弦匠心设计全新校区

Audio Matrix

本文作者:辰谙

国产免费开源的AI人声合成模型SoulX-Singer的发布,让我们的AI歌手的制作变得更加快速而便捷。

01

 SoulX-Singer的突破

在此前的AI歌声合成技术中,如果要让AI模仿某个人的声音唱歌,比如之前火爆全网的AI孙燕姿等,往往需要收集该歌手大量的干净歌声数据进行专门的模型训练,动辄几个甚至十几个小时的训练耗时又耗力。

针对这一点,SoulX-Singer可以说做出了很大的突破。使用SoulX-Singer,我们只需要提供一段极短的全新目标音色音频,SoulX-Singer就能直接用该音色唱出全新的歌曲,且保持相似度和自然度。

目前,SoulX-Singer已经原生支持普通话、英语和粤语三种语言。

在生成控制上,SoulX-Singer则支持基于MIDI和歌词来生成歌声,以及参考音频旋律来复刻原唱这两种模式。

02

SoulX-Singer的部署和使用

SoulX-Singer的部署主要依赖于Python与PyTorch生态。目前我们可以采用官方代码库的命令行部署和整合包部署。无论采用哪种部署方式,都建议在配备NVIDIA GPU的Linux或Windows环境下进行操作。

以国内大神刘悦发布的整合包的部署为例,下载之后我们会得到以下的文件,其中有一个名为“开始.bat”的文件,我们双击启动:

之后就会进入这款工具的WebUI:

界面中有几个比较重要的区域,首先是歌词语种选项。我们根据实际情况进行选择即可,默认是普通话:

然后是人声分离选项,如果我们上传的音频是带有伴奏的音频,这里就需要勾选上:

接着是Prompt音频区域,这个区域是供我们上传目标音色的:

比如说,如果我们想用某个歌手的音色来翻唱某一首歌曲,在这里就可以上传目标歌手的歌声音频,如果我们想要制作自己声音的AI歌手,在这里则可以上传一段自己唱歌的录音。

这个上传之后,我们还需要在Target音频栏上传我们需要翻唱的原始音频,想要翻唱哪首歌曲就上传哪首歌曲:

上传完毕之后,参考音频文本框和目标音频文本框中会解析出我们上传的音频中说或唱的文字内容,如果有错误我们也可以手动修改。

然后,我们需要选择控制类型。前面提到过,SoulX-Singer则支持基于MIDI和歌词来生成歌声,以及参考音频旋律来复刻原唱这两种模式,其中”score“对应前一种,”melody“对应后一种:

由于我们刚才已经上传了目标音频,这里我们选择”melody“即可。如果需要更细致地控制输出的人声,我们就可以选择”score“模式,然后上传对应的MIDI文件。

最后,我们点击”开始生成“:

根据显卡性能的不同,生成所需的时间也有所不同,部分高性能的显卡的生成时间只有数秒。

03

工具获取

SoulX-Singer在GitHub上的项目地址如下:

https://soul-ailab.github.io/soulx-singer/

国内大神刘悦发布的整合包的下载地址如下:

https://pan.quark.cn/s/eecc29900be5

对于新手来说,推荐使用整合包,以免去一些额外的学习成本。

– END –

作者往期文章(向上滑动阅览)

音乐文化音乐审美音乐教育音乐学习五线谱民族记谱法和声卡农古典音乐交响乐爵士乐摇滚乐队噪音音乐夜曲指弹民乐|强力集团钞票上的音乐家(上)钞票上的音乐家(下)中国摇滚不插电电子音乐Lo-Fi音乐 | 8bit音乐|音乐评论ASMR阿卡贝拉|City Pop蒸汽波R&BFunk灵魂乐Future Bass雷鬼黑胶唱片

音乐理论国际标准音十二平均律五度相生律/纯律中国古代律制二十四大小调中古调式大小调转调固定唱名法/首调唱名法和弦标记转位和弦中国民族调式日本民族调式三分损益法/五度相生律通奏低音平行五度/平行八度三全音谱号|五度圈人声音域|王道进行Leading Bass和声进行 | 三种小调 | 旋律大调/和声大调 | 复合和弦 | 负面和声 | Alt音阶Swing“So What”增六和弦那不勒斯六和弦六声音阶 | 终止式 | 超级玛丽终止式调式互换调式音乐切分节奏单对双的节奏延伸音 | “Back Door”和声进行 | Slash Chord |刹车和弦|“Lady Bird”和声进行 | 半音趋近变化Rhythm Changes多利亚调式利底亚调式

乐器及演奏管弦乐团配器乐器音域管风琴钢琴键盘类古琴木吉他电吉他电吉他效果器指弹吉他CAGED System3NPS贝斯贝斯Slap技巧手风琴特雷门中提琴低音提琴单簧管/双簧管三角铁架子鼓定音鼓唢呐移调乐器|钢琴伴奏织体|提琴揉弦T1213121大横按钢琴踏板Ⅰ钢琴踏板Ⅱ萨克斯风打击乐器

现代音乐混音/母带母带百万调音师MIDI|音频格式DJ声音设计作曲/写歌旋律创作流行音乐的曲式结构作曲/编曲传统和声/流行和声人声和声虚拟歌手杜比音效记录旋律听力翻唱/改编相位抵消相位问题的解决方案模拟信号/数字信号人耳的声源定位 |立体声录音|虚拟低频谢帕德音调Hi-Res削波不同颜色的噪声混叠等响曲线掩蔽效应硬削波/软削波AI作曲谐波失真|过载/失真/法兹|吉他类乐器的录音 |钢琴类乐器的录音|架子鼓的录音|录音的响度电平控制|多普勒效应家庭录音室的工作台方位设置低频陷阱/驻波问题抖动MIDI 2.0立体声兼容单声道dBFS和LKFS/LUFS自动化处理家庭录音室的噪声响度提升减法合成/加法合成粒子合成波表合成MIDI钢琴人性化设置噪音在音乐制作中的应用编曲时要不要加效果器音乐app对音乐文件的处理编曲师需不需要懂混音现代音乐制作VS传统和声规则免费制作AI歌手半开麦/假唱

音乐设备声卡动圈麦克风/电容麦克风麦克风的指向性|动圈耳机/动铁耳机监听耳机808鼓监听音箱倒相孔啸叫家庭录音室MIDI设备电子键盘二分频/三分频大三芯/卡侬头/大二芯/莲花头调音台的接口调音台的旋钮和按钮调音台的类型监听扬声器的类型音量推子|话筒放大器通道条磁带模拟不同阻抗的耳机耳放声卡和调音台的取舍无源音箱/有源音箱平衡/非平衡数字麦克风/模拟麦克风数字音频时钟低音炮推子前/推子后

音乐软件建模钢琴Pianoteq 9L系列限制器DAWprojectPro Tool更新Suno传统DAW和AIFabfilter Pro-MB的向上压缩解决立体声声相问题的工具Cubase 15解决CSS弦乐的延迟Ozone 12的母带实时拆分技术Valhalla FutureVerbGemini 3iZotope Insight 2UAD插件RipX DAW 8VoviousWaves Curves ResolveFabFilter Pro-C3OTTPolarity-MDFuture MBDynAssistStacks Audio插件AI音频分离工具ACE-Step 1.5

音乐制作音频分析耳机混音导出分轨混响混响效果器卷积混响/IR混响效果器的类型弹簧混响抽吸效果滤波器EQ/动态EQ/多段压缩EQ效果器的Q值EQ效果器的扩展功能压缩器的参数压缩效果器的类型|多段压缩器压缩器的Attack和Release压缩效果器的扩展功能饱和效果器限幅器噪声门降噪声像调整调制类效果器扩展器效果器的连接方式|M/S处理dBSPL/dBm/dBu/dBV/dBFS基本波形采样精度采样率延迟效果器延迟效果器的延迟时间摇滚混音人声和声的混音压缩效果器处理人声低频处理电脑性能节省测算和修改BPM失真电吉他的混音卧室制作人的母带制作Tips声场扩大混音融合度混音增强鼓的打击感侧链压缩的应用

欢迎加入UPCHORD音频人养成计划

⬆️上和弦地理位置

详情咨询请戳👇