最近在研究AI语音合成,试了不少工具,但大多数效果都差强人意——要么声音生硬,要么语调奇怪,听着很出戏。
直到发现了 VoxCPM,一个来自国内团队的开源语音模型。试用了一下在线Demo,简直被惊艳到了。
今天就跟大家分享这个宝藏工具。

声音居然能这么自然?
打开 VoxCPM 的在线演示,输入一段文字,点击生成,几秒钟后就能听到效果。
最让我惊讶的是它的多语言支持——不仅能说普通话,还支持粤语、四川话等方言,甚至能在同一段语音里混合粤语和英语,切换得非常自然。

我试了一段诗歌朗诵,抑扬顿挫,感情饱满,完全不像机器合成的声音。
能玩出什么花样?
VoxCPM 不仅仅是个简单的文字转语音工具,它的可玩性很高:
- 多语种切换
:30种语言随意切换,还能混合使用 - 情绪控制
:可以调整声音的情感表达,从轻声耳语到慷慨激昂 - 角色定制
:能模拟不同年龄、不同性格的声音,比如智慧老者、淘气小孩 - 非语言表达
:甚至能生成"嗯..."这样的语气词,让语音更生动
想象一下,用它来做有声书、游戏NPC配音、短视频旁白,都非常合适。

技术控关心的点
对于喜欢折腾的朋友,VoxCPM 也很友好:
支持48kHz高保真音频输出,音质很棒 模型开源,代码在 GitHub 上可以直接下载 提供一键推理部署方案,上手门槛不高 支持模型微调,你可以训练自己的专属音色
实际体验分享
我用它做了几个测试:
- 有声书片段
:把一段散文转换成音频,语调自然,停顿合理,听起来很舒服 - 游戏配音
:生成了一段"智慧老者"的台词,深沉稳重,很有代入感 - 多语言混合
:试了粤语+英语混合的句子,切换流畅,没有违和感
整体来说,这是我用过的效果最好的开源语音合成模型之一。
写在最后
AI语音合成技术发展得真快,现在的效果已经能达到以假乱真的程度了。VoxCPM 作为国产开源项目,能做到这个水平,真的很让人骄傲。
如果你也对AI语音感兴趣,或者有语音合成的需求,不妨去试试 VoxCPM。它的在线Demo完全免费,不用下载就能体验。
VoxCPM官网: voxcpm.com/zh
在线Demo: huggingface.co/spaces/openbmb/VoxCPM-Demo
GitHub: github.com/OpenBMB/VoxCPM
支持30国语言、8大方言,48kHz高保真输出。
夜雨聆风