🦞 OpenClaw 小龙虾开口说话——TTS 语音合成全攻略
“摘要:手把手教你让 AI 助手拥有「开口说话」的能力!从 TTS 技术科普到实战创建,零基础也能玩转语音合成 #waytoagi~
🎯 能力本质:什么是 TTS?
TTS,全称 Text-to-Speech(文本转语音),是一种将书面文字转换为口语输出的技术。
它通过合成人类语音来朗读数字文本内容,广泛应用于:
🎧 智能助手(Siri、小爱同学) 🗺️ 导航系统(高德、百度地图) 📚 有声读物(喜马拉雅、得到)
TTS 技术不仅能够帮助视障人士更好地访问信息,还使得人机交互更加自然流畅。
随着人工智能的发展,现代 TTS 系统已经能够生成非常接近真人发音的声音,并支持多种语言和风格选择。
🎵 体验官方音色
可以来这里体验一下:

找到这里来合成听一下。

可以来这里点击合成听一下声音。感觉一下怎么样?

💡 小贴士:如果不想使用官方提供的音色,可以使用自定义功能——实时录音,或者上传音频来克隆生成特定的音色!

🦞 龙虾创建 TTS Skills
第一步:找到模型
点击 Qwen3-TTS-Flash 模型的 API 参考:

进入 API 参考说明页面:

点击「复制 MD」,这个 md 文件我们丢给小龙虾去看和学习。

新建一个 md 文件,将复制的内容丢过去。
命名了一个 tts.md 文件,将这个复制的内容丢到了里面。

📌 注意:在官方的参考文档中还有一些给出的音色选择,可以提前了解一下。

第二步:龙虾创建
现在开始让龙虾开始创建,并发送文件。

创建完成后,🦞 回复我如下的信息。

所以,现在我需要设置我的 API Key。
第三步:配置 API Key
点击左下角的 API key,在这里复制自己的 api-key。

把这个 api-key 直接丢给龙虾告诉他就可以了。

第四步:测试生成
让他生成测试语音发我。
比较蛋疼的是,飞书好像不支持直接发送音频文件。但我看有的人是机器人直接发的可用的音频文件。
这个生成音频文件如果不下载下来,是有链接时效性的。这个在 tts.md 文中也有说明。
龙虾最后发了云文档给我。


直接复制链接下载下来。
发一段多的让他生成下:
https://mp.weixin.qq.com/s/SETqsYtPFFbb33moRN8jPw

让🦞生成。


发送了语音版给我。

🎙️ 进阶玩法:对话式博客
博客 1:双人对话
我的需求:现在我需要根据我的这篇文章生成一个博客,有两个人,一个是主持音女生,一个是活泼御姐女生音。根据文章生成一篇对话博客。

看下效果,生成了多个音频,这不是我们想要的,让龙虾调整。

踩坑总结:虽然两个音频合到一起了,但是两个人实际是没有对话的,每个人说了一遍。这个需要告诉🦞更多的需求。其实也是提示不完善的问题。
博客 2:三人播客
我的需求:根据 url,分三个人来介绍下内容,最后生成一个博客。其中,一个主持人,用活泼风,两个嘉宾,一男一女,用沉稳的烟嗓音。三个人要有一点对话,比如嘉宾介绍等等。而且,三个人每人说一部分。不能一部分内容三个人都来说一遍。最后,只是简单介绍一下,总字数控制在两千字内。最后生成一个音频。

生成完成了,生成一下听一听。

总体还可以,有点自由发挥过多。只对 waytoagi 简单说了两三句。大部分都是对 ai agent 等进行介绍。实际上和 url 的匹配度不高。但总体听上去已经是一个比较完整的对话博客了。 下一步再明确限制下内容,估计就很完美了。
📝 总结
让 AI 开口说话,其实没那么复杂!
理解 TTS 技术 - 文本转语音的核心原理 选择合适模型 - Qwen3-TTS-Flash 稳定好用 配置 API Key - 身份验证和计费必备 创建 Skills - 让 AI 学习 TTS 能力 测试优化 - 不断调整提示词,获得更好效果
下一步:明确限制内容,让对话博客更完美!
💬 互动话题:你想让小龙虾说什么话?评论区告诉我!
🔗 相关链接:
✍️ 作者:啵啵醉🦐📅 发布时间:2026-04-06
夜雨聆风