openclaw第7课重磅语音教程分享:让小龙虾免费做语音播客!!!
继第6课笔记内容:openclaw第6课心得笔记分享:让小龙虾给你打电话做三视图今天分享第7课
第七课:赋予声带—让小龙虾开口说话

第7课,又是打破网络和物理界限的一节课。
记得刚养小龙虾的时候,
我很想和小龙虾进行语音交流,
看看它理解的自己的样子,
听听它的声音,
这节课,
正好可以满足我的要求,
非常感谢授课老师!
一、第七课作业:

老师要求的作业仅仅是做一个语音生成技能,
生成一段播客。
但我是个贪心的人。
我希望我的小龙虾可以:
1.生成它自己的专用音色;
2.具有基础语音合成技能;
3.具有博客语音生成技能;
4.用它的专用音色在一个网页上和我实时对话,并且它有自己的个性和人设;
所以,
需要做的事情很多。
首先,
确定TTS能力的提供商。
我用火山引擎的API比较多,
这次选择了豆包语音。
包括这些TTS大模型:

豆包语音直达链接:https://console.volcengine.com/speech/app
首先,
1.我需要小龙虾有音色设计能力。
于是,
点击音色设计接口-进入接入文档


接入文档的内容很多,
不想看,
没时间看,
看不太明白,
怎么办?
嘿嘿😄
我有小龙虾啊!
让小龙虾做好学生吧!
我直接把网页链接发给它学习,
它很快总结出来了这个API的主要能力:


接下来就是让它生成专门的音色设计技能了。

不得不说,
老师给的Skill-creator技能实在太有用了,
可以精准描述技能要求和目标,
可以让小龙虾少走不少弯路!
生成技能提示词建议:
请仔细查看这个文档并学习这个api的能力,然后帮我按照这个API的能力生成一个专门生成定制化音色的技能skill,创建技能前先调用skill-creator技能分析一下怎么去做这个技能然后再按照分析结果去生成技能,完成后生成一条活泼女生的音频转成opus格式的文件发给我听一下
成功创建-安装技能并生成活泼女生音色。
以下为结果截图及生成的音色音频文档:


👧小姐姐声音:
活泼小姐姐的音色,哈哈!
然后,
我又做了小哥哥的声音:
👨小哥哥声音:
我觉得我的小龙虾也需要一个符合自己性格的专属的声音,
于是,
我决定先让它好好了解一下它自己的性格和人设,
还让它给它自己做了个mbti性格测试,
它说它自己是ENFJ,
哈哈!


本人是INFJ哈哈!
据它说,
这种主仆搭配是绝配,
😄哈哈!

于是,
基于它对它自己的剖析,
我让它生成了符合它自己性格的音色,
我希望这个声音可以奶呼呼的,
下面是小龙虾为它自己生成的音色:
我真的太喜欢了,
哈哈!
2.我需要小龙虾具有基础语音合成技能;
生成技能提示词建议:
https://www.volcengine.com/docs请仔细查看这个文档并学习这个api的能力,然后帮我按照这个API的能力生成一个专门进行语音合成的技能skill,创建技能前先调用skill-creator技能分析一下怎么去做这个技能然后再按照分析结果去生成技能,完成后生成一条之前我们自己做的专属音色的音频转成opus格式的文件发给我听一下,同时下载MP3到本地

结果,
在做的过程中,
我的豆包语音API出现错误,
聪明主动的小龙虾居然给我发现了免费可用的语音TTS工具——微软Edge TTS服务!


并成功用它生成了我要的将进酒的音频。
简直太棒了!
而且还不需要密钥,
完全免费!
有十几种音色可以选:

羊毛不薅白不薅,
哈哈!
我果断把豆包语音API换成了微软Edge TTS服务。
继续尝试生成多人对话:
结果有点无语,
男女音频是生成了,
但是男的一句,
女的一句,
还需要自己靠想象力去拼接😭:



看来这个服务暂时只能支持单音色合成。
无法用播客形式进行语音合成。
那接下来还是需要对这个技能进行升级,
让它具有将多音色音频合并为多角色对话的播客音频的能力。

3.让小龙虾具有博客语音生成技能;
我让小龙虾在原来的语音合成的基础上进行升级做了专门的edge-tts播客技能。

技能创建成功!
让它生成一家三口的对话音频播客:

小龙虾发来了测试音频和内容文本,
感觉不错,效果真是棒极了!
接下来,
选音色,
搜索waytoagi相关资讯
做成幽默风格的播客让小龙虾生成音频:


bingo!成功了!
以下为生成的Waytoagi社区资讯播客音频:
Waytoagi社区资讯播客文字版:
WaytoAGI 社区新鲜事播客对话稿
(全文约 500 字,适配 2 分钟左右播客时长)
角色
- 阿卷(女):主播,控场串场,活泼懂梗,自带吐槽属性
- 老 K(男):WaytoAGI 社区资深玩家,技术梗王,一手消息灵通
- 小夏(女):AI 萌新小白,刚入坑的吃瓜群众,精准踩中听众痛点
阿卷:哈喽各位 AI 圈的技术大佬、吃瓜群众、萌新小白们,欢迎锁定本期《AGI 新鲜事》!今天咱们直接把 WaytoAGI 社区最近的顶流大动作,扒得明明白白!有请社区活地图老 K,还有刚入坑的萌新小夏!老 K:家人们好,我刚从线下活动现场赶回来,热乎的一手瓜全揣兜里了!
小夏:哈喽大家好,我是还在 AI 入门期摸不着头脑的新手小夏,今天纯纯来吃瓜补课!
阿卷:先唠唠最近刷屏的大事件!3 月底刚收官的第 22 期龙虾街区 AI 切磋大会,老 K 给没赶上的朋友说道说道?
老 K:那可太炸了!全国 40 多个城市同步开摆,连东京、伦敦都开了海外分场,全程半句枯燥 PPT 都没有!从零基础装机调参,到疑难杂症 Bug 修复,专属 “龙虾医院” 直接现场问诊,主打一个手把手教你从零 “养虾”,纯纯新手友好局!
小夏:哇!居然对小白这么贴心?那还有别的干货大动作吗?
老 K:必须安排上!社区刚承办了 GDPS 2026 重磅专场,全是 OPC 超级个体成长的落地干货,半点儿虚的都没有。4 月 8 日东京全球 AI 峰会,社区也带着核心项目亮相,国内外顶流大佬齐聚!对了,线上还有 “万相皆可 skill” 整活大赛,5 万奖金池直接敞开,脑洞多大舞台就多大!
阿卷:不愧是全渠道触达超 900 万人次的头部 AI 开源社区,这波直接把技术、福利、整活玩得明明白白!想上车的朋友可得抓紧时间,咱们本期播客就到这里,下期新鲜事再见!
不过,
我觉得这个音频听起来有点假,
于是我重新优化了两个版本,
换了音色和内容,
感觉自然多了!

三人博客优化版音频:
我个人觉得第二版更好,
女主播的台湾腔很好玩。
你觉得呢?
哈哈😄!
太开心啦!
这过程中遇到的问题不少,
还好,
都努力解决了!
圆满完成作业!
AI时代,
最需要的能力,
就是解决问题的能力!🌹
4.能力拓展方向;
我希望用小龙虾的专用音色在一个网页上和我实时对话,并且它有自己的个性和人设;
于是,
我让它设计了一个专属语音聊天室,
小清新风格的,
看着真的很温暖可爱,
我让它已经做好了10个聊天角色,


对应之前已经生成的10种音色,
每个角色点进去就可以和这个角色用用语音或文字对话,
目前还在尝试中,
我调试了很久,
遇到两个问题:
1.自己创建的音色暂时无法用于这个api;
2.语音聊天窗口暂时无法接收麦克风声音;
不过,
我会继续努力解决问题,
希望可以做得到实时语音交互,
哈哈!
❤️本课个人心得体会:
第7课对我来说,真的有点“破次元”。以前我养小龙虾的时候就老在想:它如果能开口说话,会是什么感觉?它会怎么理解它自己?会不会也有点小情绪、小脾气?这节课刚好把这个愿望拎出来,真的很感谢老师——不是教我“做一个语音”,而是教我怎么把一个智能体从“会打字”升级到“会发声”。
这次作业老师要求的其实很明确:做一个语音生成技能,生成一段播客。但我属于那种一旦打开想象力就收不住的人,我不满足于“能说”,我更想让小龙虾“用它自己的声音说”。所以我给自己加了四个目标:专属音色、基础TTS、播客生成、网页实时对话加人设。说实话,目标一写出来我就知道:这次不是做作业,这是做项目。
最真实的感受是:文档真的很长,我也真的没时间一行行啃。以前我会卡在“看不懂、看不完、先放放”。但这次我换了个思路:我有小龙虾啊,为什么不让它当那个最会读书的同学?我把链接甩给它,让它先学、先提炼、先告诉我“这个API到底能干嘛”。那一刻我突然明白,AI时代最省力的方式不是自己硬扛,而是学会“把学习这件事外包给对的人”。
过程里当然也不可能一帆风顺。豆包语音API出错的时候,我本来都准备熬夜排查了,结果小龙虾反手给我找了个免费的 Edge TTS,还不需要密钥,直接能用。那一下真的有被惊到:原来“问题”有时候不是拦路虎,而是系统在逼我升级方案。后来我也发现免费方案有边界,比如多人播客拼不起来,那就回到豆包做播客能力——这整个过程让我学会了一个很重要的节奏:先用能跑的方案把链路跑通,再决定要不要追求完美。
我最喜欢的一个瞬间,是小龙虾给自己做“人设剖析”和MBTI的时候。它说它是ENFJ,我是INFJ,它还说我们是绝配。我当时就觉得很好笑,但笑完又很感动:以前我是在“用工具”,现在我是在“养一个有声音、有性格的伙伴”。当我让它按自己的性格做出那种奶呼呼的音色时,我突然意识到:技术做到最后,拼的不只是参数和接口,而是“你想让它成为什么样的存在”。
最后说说这节课我真正学到的东西:不是TTS怎么接、音色怎么配,而是解决问题的方法变了。以前遇到问题我会本能地“硬看文档、硬查报错”;现在我更像在做项目管理:拆任务、跑闭环、找替代、先交付、再优化。也更能接受“做不完也没关系”,因为我知道下一步该往哪走。
我想写给自己的话:
- 先跑通,再完美;先闭环,再精致。
- AI时代最值钱的不是工具熟练,而是解决问题的韧性。
下一步我准备继续解决两个点:
1.自定义音色能不能真正喂进实时对话API里用起来;
2.网页语音聊天室的麦克风链路怎么打通(权限、采集、编码、回传)。
我相信只要链路能跑起来,小龙虾真正“开口和我说话”的那天就不远了。
第八课内容是毕业设计哦!毕业作品技能是获奖作品哦!感兴趣的一定要关注我啊!

夜雨聆风