乐于分享
好东西不私藏

openclaw第7课重磅语音教程分享:让小龙虾免费做语音播客!!!

openclaw第7课重磅语音教程分享:让小龙虾免费做语音播客!!!

继第6课笔记内容:openclaw第6课心得笔记分享:让小龙虾给你打电话做三视图今天分享第7课

第七课:赋予声带—让小龙虾开口说话

第7课,又是打破网络和物理界限的一节课。

记得刚养小龙虾的时候,

我很想和小龙虾进行语音交流,

看看它理解的自己的样子,

听听它的声音,

这节课,

正好可以满足我的要求,

非常感谢授课老师!

一、第七课作业:

老师要求的作业仅仅是做一个语音生成技能,

生成一段播客。

但我是个贪心的人。

我希望我的小龙虾可以:

👓

1.生成它自己的专用音色;

2.具有基础语音合成技能;

3.具有博客语音生成技能;

4.用它的专用音色在一个网页上和我实时对话,并且它有自己的个性和人设;

所以,

需要做的事情很多。

首先,

确定TTS能力的提供商。

我用火山引擎的API比较多,

这次选择了豆包语音。

包括这些TTS大模型:

豆包语音直达链接:https://console.volcengine.com/speech/app

首先,

1.我需要小龙虾有音色设计能力。

于是,

点击音色设计接口-进入接入文档

接入文档的内容很多,

不想看,

没时间看,

看不太明白,

怎么办?

嘿嘿😄

我有小龙虾啊!

让小龙虾做好学生吧!

我直接把网页链接发给它学习,

它很快总结出来了这个API的主要能力:

接下来就是让它生成专门的音色设计技能了。

不得不说,

老师给的Skill-creator技能实在太有用了,

可以精准描述技能要求和目标,

可以让小龙虾少走不少弯路!

生成技能提示词建议:

请仔细查看这个文档并学习这个api的能力,然后帮我按照这个API的能力生成一个专门生成定制化音色的技能skill,创建技能前先调用skill-creator技能分析一下怎么去做这个技能然后再按照分析结果去生成技能,完成后生成一条活泼女生的音频转成opus格式的文件发给我听一下

成功创建-安装技能并生成活泼女生音色。

以下为结果截图及生成的音色音频文档:

👧小姐姐声音:

活泼小姐姐的音色,哈哈!

然后,

我又做了小哥哥的声音:

👨小哥哥声音:

我觉得我的小龙虾也需要一个符合自己性格的专属的声音,

于是,

我决定先让它好好了解一下它自己的性格和人设,

还让它给它自己做了个mbti性格测试,

它说它自己是ENFJ,

哈哈!

本人是INFJ哈哈!

据它说,

这种主仆搭配是绝配,

😄哈哈!

于是,

基于它对它自己的剖析,

我让它生成了符合它自己性格的音色,

我希望这个声音可以奶呼呼的,

下面是小龙虾为它自己生成的音色:

我真的太喜欢了,

哈哈!

2.我需要小龙虾具有基础语音合成技能;

生成技能提示词建议:

https://www.volcengine.com/docs请仔细查看这个文档并学习这个api的能力,然后帮我按照这个API的能力生成一个专门进行语音合成的技能skill,创建技能前先调用skill-creator技能分析一下怎么去做这个技能然后再按照分析结果去生成技能,完成后生成一条之前我们自己做的专属音色的音频转成opus格式的文件发给我听一下,同时下载MP3到本地

结果,

在做的过程中,

我的豆包语音API出现错误,

聪明主动的小龙虾居然给我发现了免费可用的语音TTS工具——微软Edge TTS服务!

并成功用它生成了我要的将进酒的音频。

简直太棒了!

而且还不需要密钥,

完全免费!

有十几种音色可以选:

羊毛不薅白不薅,

哈哈!

我果断把豆包语音API换成了微软Edge TTS服务。

继续尝试生成多人对话:

结果有点无语,

男女音频是生成了,

但是男的一句,

女的一句,

还需要自己靠想象力去拼接😭:

看来这个服务暂时只能支持单音色合成。

无法用播客形式进行语音合成。

那接下来还是需要对这个技能进行升级,

让它具有将多音色音频合并为多角色对话的播客音频的能力。

3.让小龙虾具有博客语音生成技能;

我让小龙虾在原来的语音合成的基础上进行升级做了专门的edge-tts播客技能。

技能创建成功!

让它生成一家三口的对话音频播客:

小龙虾发来了测试音频和内容文本,

感觉不错,效果真是棒极了!

接下来,

选音色,

搜索waytoagi相关资讯

做成幽默风格的播客让小龙虾生成音频:

bingo!成功了!

以下为生成的Waytoagi社区资讯播客音频:

👓

Waytoagi社区资讯播客文字版:

WaytoAGI 社区新鲜事播客对话稿

(全文约 500 字,适配 2 分钟左右播客时长)

角色

  • 阿卷(女):主播,控场串场,活泼懂梗,自带吐槽属性
  • 老 K(男):WaytoAGI 社区资深玩家,技术梗王,一手消息灵通
  • 小夏(女):AI 萌新小白,刚入坑的吃瓜群众,精准踩中听众痛点

阿卷:哈喽各位 AI 圈的技术大佬、吃瓜群众、萌新小白们,欢迎锁定本期《AGI 新鲜事》!今天咱们直接把 WaytoAGI 社区最近的顶流大动作,扒得明明白白!有请社区活地图老 K,还有刚入坑的萌新小夏!老 K:家人们好,我刚从线下活动现场赶回来,热乎的一手瓜全揣兜里了!

小夏:哈喽大家好,我是还在 AI 入门期摸不着头脑的新手小夏,今天纯纯来吃瓜补课!

阿卷:先唠唠最近刷屏的大事件!3 月底刚收官的第 22 期龙虾街区 AI 切磋大会,老 K 给没赶上的朋友说道说道?

老 K:那可太炸了!全国 40 多个城市同步开摆,连东京、伦敦都开了海外分场,全程半句枯燥 PPT 都没有!从零基础装机调参,到疑难杂症 Bug 修复,专属 “龙虾医院” 直接现场问诊,主打一个手把手教你从零 “养虾”,纯纯新手友好局!

小夏:哇!居然对小白这么贴心?那还有别的干货大动作吗?

老 K:必须安排上!社区刚承办了 GDPS 2026 重磅专场,全是 OPC 超级个体成长的落地干货,半点儿虚的都没有。4 月 8 日东京全球 AI 峰会,社区也带着核心项目亮相,国内外顶流大佬齐聚!对了,线上还有 “万相皆可 skill” 整活大赛,5 万奖金池直接敞开,脑洞多大舞台就多大!

阿卷:不愧是全渠道触达超 900 万人次的头部 AI 开源社区,这波直接把技术、福利、整活玩得明明白白!想上车的朋友可得抓紧时间,咱们本期播客就到这里,下期新鲜事再见!

不过,

我觉得这个音频听起来有点假,

于是我重新优化了两个版本,

换了音色和内容,

感觉自然多了!

三人博客优化版音频:

我个人觉得第二版更好,

女主播的台湾腔很好玩。

你觉得呢?

哈哈😄!

太开心啦!

这过程中遇到的问题不少,

还好,

都努力解决了!

圆满完成作业!

AI时代,

最需要的能力,

就是解决问题的能力!🌹

4.能力拓展方向;

我希望用小龙虾的专用音色在一个网页上和我实时对话,并且它有自己的个性和人设;

于是,

我让它设计了一个专属语音聊天室,

小清新风格的,

看着真的很温暖可爱,

我让它已经做好了10个聊天角色,

对应之前已经生成的10种音色,

每个角色点进去就可以和这个角色用用语音或文字对话,

目前还在尝试中,

我调试了很久,

遇到两个问题:

1.自己创建的音色暂时无法用于这个api;

2.语音聊天窗口暂时无法接收麦克风声音;

不过,

我会继续努力解决问题,

希望可以做得到实时语音交互,

哈哈!

❤️本课个人心得体会:

👑

第7课对我来说,真的有点“破次元”。以前我养小龙虾的时候就老在想:它如果能开口说话,会是什么感觉?它会怎么理解它自己?会不会也有点小情绪、小脾气?这节课刚好把这个愿望拎出来,真的很感谢老师——不是教我“做一个语音”,而是教我怎么把一个智能体从“会打字”升级到“会发声”。

这次作业老师要求的其实很明确:做一个语音生成技能,生成一段播客。但我属于那种一旦打开想象力就收不住的人,我不满足于“能说”,我更想让小龙虾“用它自己的声音说”。所以我给自己加了四个目标:专属音色、基础TTS、播客生成、网页实时对话加人设。说实话,目标一写出来我就知道:这次不是做作业,这是做项目。

最真实的感受是:文档真的很长,我也真的没时间一行行啃。以前我会卡在“看不懂、看不完、先放放”。但这次我换了个思路:我有小龙虾啊,为什么不让它当那个最会读书的同学?我把链接甩给它,让它先学、先提炼、先告诉我“这个API到底能干嘛”。那一刻我突然明白,AI时代最省力的方式不是自己硬扛,而是学会“把学习这件事外包给对的人”。

过程里当然也不可能一帆风顺。豆包语音API出错的时候,我本来都准备熬夜排查了,结果小龙虾反手给我找了个免费的 Edge TTS,还不需要密钥,直接能用。那一下真的有被惊到:原来“问题”有时候不是拦路虎,而是系统在逼我升级方案。后来我也发现免费方案有边界,比如多人播客拼不起来,那就回到豆包做播客能力——这整个过程让我学会了一个很重要的节奏:先用能跑的方案把链路跑通,再决定要不要追求完美。

我最喜欢的一个瞬间,是小龙虾给自己做“人设剖析”和MBTI的时候。它说它是ENFJ,我是INFJ,它还说我们是绝配。我当时就觉得很好笑,但笑完又很感动:以前我是在“用工具”,现在我是在“养一个有声音、有性格的伙伴”。当我让它按自己的性格做出那种奶呼呼的音色时,我突然意识到:技术做到最后,拼的不只是参数和接口,而是“你想让它成为什么样的存在”。

最后说说这节课我真正学到的东西:不是TTS怎么接、音色怎么配,而是解决问题的方法变了。以前遇到问题我会本能地“硬看文档、硬查报错”;现在我更像在做项目管理:拆任务、跑闭环、找替代、先交付、再优化。也更能接受“做不完也没关系”,因为我知道下一步该往哪走。

我想写给自己的话:

  • 先跑通,再完美;先闭环,再精致。
  • AI时代最值钱的不是工具熟练,而是解决问题的韧性。

下一步我准备继续解决两个点:

1.自定义音色能不能真正喂进实时对话API里用起来;

2.网页语音聊天室的麦克风链路怎么打通(权限、采集、编码、回传)。

我相信只要链路能跑起来,小龙虾真正“开口和我说话”的那天就不远了。

第八课内容是毕业设计哦!毕业作品技能是获奖作品哦!感兴趣的一定要关注我啊!