乐于分享
好东西不私藏

4倍效率跃迁,手把手解锁顶级语音输入与AI助手

4倍效率跃迁,手把手解锁顶级语音输入与AI助手

为了语音输入,还要买ai鼠标,现在不用了,安装这一款软件就可以妥妥的体验上,为了完整地使用上以上非常好用的语音输入体验,我们需要配置两个东西:

  1. 语音识别模型
  2. 具备视觉能力的 AI 大模型

下面的教程会一步步教大家进行完整的配置,非常详细,非常简单,很好操作,不用担心。

获得最佳语音输入体验的操作指南

就跟着下面这个指南一步一步的操作,一定能够搞定。 都是详细地拆到最细的步骤上了。

第一步:在闪电说内填入语音识别模型API是的,按照以上步骤完成配置后,你就可以在闪电说中使用流畅的免费语音输入+AI处理能力,获得完整的最佳使用体验了。

为了免费获得最快最准的语音识别体验。

  1. 打开闪电说 APP,点击左侧的模型,在语音识别服务商里面找到火山引擎,点击打开
  2. 打开之后,您会看到需要填写 App ID 和 Access Token,这两个您暂时不用管,下一步会教您如何获取这两个东西。
  3. 打开字节的云服务火山引擎,点击这里:火山引擎官网,您会看到下面这个登录页面,然后正常使用手机进行登录注册就好了。
  4. 进入到官网之后,需要先走一个实名认证的流程,非常简单。
    先点击”前往实名认证”,再点击“微信/抖音扫脸认证”就可以了。字节的所有 API 开通都是需要实名认证的。这里认证过一次之后,以后就都非常方便了。
  5. 认证完成之后,再回到“豆包语音”。如果不知道怎么回去,点击这里:豆包语音。然后直接点击最中间的创建应用。
  6. 在创建应用里面,应用名称填“shandianshuo”(只支持英文),应用简介写“自己用“,接入能力选择:”豆包流式语音识别模型2.0 小时版“。点击右下角的“确定”,就把应用创建好了。
  7. 创建成功之后,您把这个创建应用的页面在右上角给叉掉。然后在左侧的 API 服务中心的菜单里面点到第一个”豆包流式语音识别模型 2.0”。就可以看到下面这个页面了,把这个页面滑到底部,您就能找到最开始我们在闪电说的配置里给您看的 App ID 和 Access Token(正常情况下是隐藏的,点击小眼睛可以打开) 。Access Token 是您的密码,一定要保存好,也不要告诉任何人。目前在字节火山引擎这个版本里面给您提供了 20 小时的免费额度,可以使用很久了。注意:检查一下这里的应用名称是否是刚才设置的,因为是可以创建多个应用的
  8. 这里额外注意一下两个注意事项:
    1. 千万不要点击服务开通,这个服务开通的意思是,开通付费版本,开通了之后就不能用免费的试用的20h额度了。如果不小心开通了,按照下图指示,去左侧应用管理再创建一个新的应用,然后回到本页面,在应用名称那里选择你最新创建的应用即可,可能重名,一定要检查清楚,主要检查服务的是否显示“开通”(显示“开通”表示还没有开通)。然后可以继续后面的操作。
    2. 应用名称一定要是你刚刚的那个,可能有你曾经创建了多个应用情况。你要选择你最新创建的那个。
  9. 回到闪电说 APP,把刚刚您获取的 App ID 和 Access Token 依次填进去。然后点击下方的运行速度测试,如果出结果了,就说明您的 API 接口是通的,有时候可能不稳定,您可以多点两次。但如果多次点击都不出结果的话,您可以看看之前的哪一步错了,如果确实不确定,可以来咨询我们。
  10. 最后您只需要在这个页面点击“设为默认模型”,您就已经获得了目前中文范围内,可以说是最好的语音转写体验。同样,阿里云的“qwen3-asr”模型也非常优秀,如果您感兴趣,可以自行设置体验。
  11. 最后我们回到模型界面检查一下,首先是语音识别模型已经更换为了”豆包流式”。其次,下方”火山引擎”的供应商栏有一个绿色小点,说明它运转正常。

第二步:在闪电说内填入具备视觉能力的 AI 大模型 API

为了使用我们提供的 AI 输入技能和 AI 助手技能,获得完整的沟通 Agent 体验。

  1. 还是打开闪电说,然后在模型里面找到大模型服务商,然后选择火山引擎。
  2. 打开之后,您会看到需要填写 Access Token / API Key(这是一个东西,等会下面我们就会看到它了),API 地址已经填好了,您不用管。所以这回我们只用找一个东西就好了。
  3. 鉴于您刚刚已经进行了火山引擎的登录和实名认证的步骤,所以我这里直接引导你进入大模型的开通页面。打开字节火山引擎的 AI 开通页面,点击这里:火山方舟开通管理页面。
  4. 选择Doubao-Seed-2.0-lite,然后点击开通服务。
  5. 然后在开通服务的页面,为了方便以后更加简单易用,可以先点击”全选”,然后点击”自动开通新增模型”,最后点击”确定开通与授权”。这样不管以后就是需要用什么新模型,你都可以直接用了,就不用再做进一步的配置了。
  6. 然后在开通管理页面检查一下,看看这个模型是否已经开通成功。开通成功之后,操作那里会变成,会从”开通服务”变成”关闭服务”。如果出现意外情况没有开通服务,可以重新再走一遍刚刚那个流程。同时,字节提供了50万 token 的额度,也可以用很久了。
  7. 在”开通管理”下方有一个 “API Key 管理”,点击它。然后进到页面里面之后,点击”创建 API Key”。
  8. 点击之后,里面的信息都是默认填好的,直接点创建就可以了。
  9. 然后你就可以在,就是接下来这个页面里面去复制你的 API Key 了,还是点击小眼睛之后会出现密码和复制按钮。API Key 千万不要告诉别人,这个就是你的密码。
  10. 回到闪电说 APP,把刚刚获得的 API Key 填进去。先点击设为默认模型,把豆包 2.0 应用上。
  11. 检测之后,会出现一个通过的状态,说明 API Key 没有问题。
  12. 最后我们整体做一次检查,回到模型页面:
    1. 默认语音识别模型是”豆包流式语音识别模型2.0”,默认的大模型是”Doubao-Seed-2.0-lite”
    2. 语音识别服务商火山引擎和大模型服务商火山引擎的小绿点都是亮着的。

达到上面这个状态,就完全配置完成了。

体验后,语音输入还好,速度很快,语音助手有点不太理想,后面在摸索摸索。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » 4倍效率跃迁,手把手解锁顶级语音输入与AI助手

猜你喜欢

  • 暂无文章