打工人们,平时上下班通勤、或者晚上睡前,是不是都有“听书”的习惯?但现实往往很骨感:很多冷门小说、专业文档或者网文,根本找不到真人播音的有声书版本。而用阅读软件自带的 AI 朗读,那毫无感情的“机器人电音”听久了简直让人抓狂。
如果你想拥有一个“私人专属”的朗读者,甚至想用斯嘉丽·约翰逊、大卫·爱登堡或者你自己的声音来读小说,今天这款 GitHub 上的开源硬核神器绝对能惊掉你的下巴——ebook2audiobook。
它不仅能把各种格式的电子书一键转换成带有章节和元数据的专业有声书,还支持语音克隆和惊人的 1158 种语言!作为你们的“试用官”,我第一时间在本地把它跑了起来,下面直接上硬核实测。

🛠️ 第一印象:极其亲民的硬件门槛与“傻瓜式”部署
老实说,一开始看到“语音克隆”和“高级 TTS 引擎”,我以为这又是一个吃配置的性能怪兽。但看了一眼 README 的最低要求,我震惊了:最低只需 2GB 内存和 1GB 显存! 并且通吃 CPU、N 卡(CUDA)、A 卡(ROCm)甚至是苹果的 M 系列芯片(MPS)。
部署过程异常友好,作者直接提供了“一键启动脚本”。 对于 Windows 用户,直接双击 ebook2audiobook.cmd;Mac 用户双击 Mac Ebook2Audiobook Launcher.command 就能跑起来(它甚至会自动用 Scoop 或 Homebrew 帮你补齐缺失的依赖)。 随着终端跑完进度条,浏览器自动弹出了一个清爽的 Gradio Web UI 界面 http://localhost:7860/,没有花里胡哨的配置,开箱即用。
🚀 深度实测:从“电子书”到“大片级听觉盛宴”
为了榨干它的潜力,我准备了一本 .epub 格式的科幻小说和一段 PDF 扫描件进行实测。
1. 震撼的语音克隆与顶级 TTS 引擎
这款工具集成了目前最能打的几个开源 TTS 引擎:XTTSv2、Bark、Tortoise 等。最吸引我的当然是 Voice Cloning(语音克隆) 功能。
我在界面上选择了一个自定义语音包(只要上传一段十几秒的干净干声录音),然后丢进去了那本 .epub 小说。转换完成后,我戴上耳机一听——断句、呼吸声、甚至那种轻微的沙哑感都被完美复刻了!你甚至可以录一段自己的声音,让 AI 每天晚上用你的声音给孩子读睡前故事。
2. 格式通吃,连“带字的图片”都不放过
很多转换工具只认 TXT,但 ebook2audiobook 支持高达 20 多种格式(.epub, .mobi, .pdf, .docx 等)。
我特意找了一份全是扫描图片的 PDF 扔进去测试。它居然内置了 OCR 扫描功能,直接把图片里的文字硬生生抠出来并转成了音频!而且,如果是标准的 .epub或 .mobi 文件,它还能自动识别并划分章节,最后输出的 .m4b 格式有声书在手机播放器里自带章节目录,体验极其舒适。
3. “导演级”场面控制:SML 标签系统
这是我觉得最硬核、也是最有创意的一个功能。如果你在文本中加入特定的 SML 标签,你可以像导演一样控制朗读节奏。 比如加上 [pause:2] 就能让 AI 停顿 2 秒;更夸张的是,你可以用 [voice:/path/to/voice/file] 标签在文本中间无缝切换朗读者的声音! 这意味着,如果你愿意稍微排一下版,你完全可以用它做出一部多角色配音的广播剧!
⚠️ 避坑与试用建议
在折腾了一整天后,我也给大家排了几个雷,想入坑的朋友请注意:
1.提前清理电子书内容:.epub 格式本身是不区分正文和“前言、目录、版权声明”的。如果你不提前手动删掉这些内容,AI 会老老实实地用充满感情的声音为你朗读一长串的网址和 ISBN 书号,非常出戏。
2.算力即速度:虽然它说支持 CPU 运行,但现代的顶级 TTS 引擎在 CPU 上跑得非常慢。如果你的电脑没有独立显卡(GPU),建议在界面里选择 YourTTS 或 Tacotron2 等轻量级模型,否则生成一本长篇小说可能需要挂机一整晚。
3.版权警告:官方特别强调,此工具仅限于处理无 DRM 保护且合法获取的电子书,大家千万不要用它生成有声书去谋利。
📊 测评结论
毫无疑问,ebook2audiobook 是一款极具极客精神和实用价值的开源利器。它把原本只有专业团队才能完成的“高质量有声书制作”,拉低到了每一个普通用户的桌面端。
易用性:⭐⭐⭐⭐ (一键安装好评,但长文本处理前需要人工整理排版)
创新性:⭐⭐⭐⭐⭐ (SML 标签控场和无缝集成的语音克隆令人拍案叫绝)
实用价值:⭐⭐⭐⭐⭐ (小说党、考研党听资料、甚至视障人士的绝对福音)
如果你对现在的 AI 朗读效果不满意,想要定制一本专属于自己的有声书,赶紧去 GitHub 搜索 DrewThomasson/ebook2audiobook 亲自体验一下这震撼的“赛博发声”吧!
夜雨聆风