当你在用在用 AI 生成一段口播视频的时候,会不会出现这样的情况?要么就是太快,像是在说唱,到最后可能因为时间来不及,少说几个字。要么就是太慢,非常拖节奏。
如果明明5秒钟就可以说完的字数,你非得生成10秒钟视频,不仅整个节奏拖沓,他还有可能自由发挥去加一些你不需要的台词。更关键的是还浪费积分!
主要原因就是大多数人对于“多少字说多少秒”没有概念。
为了解决这个问题呢,我把各大 AI 都问了一遍。但是他们给我的答案也有些差异。所以我干脆自己用慢、中、快三种速度朗读了几段文字。然后把每秒钟的平均语速记录下来。再结合 AI 给到的答案,就得到了这张表格。

(对比发现,其实各大AI官方给的语速参考,整体还是偏慢的,真人听起来会有点呆,还是我实测的这套更自然。)
知道了语速,那怎么算字数呢?很多人写完脚本,会习惯性丢进 Word 看左下角的字数。但那个字数是包含标点符号的,不够精准。想要更纯净的字数,可以用这个网站(www.EtestE.com),把台词丢进去,一秒就能过滤掉标点。
不过,查出字数还要自己手动拿计算器算时间,还是太麻烦了对吧?
来,保姆级大招来了!我帮大家把【字数预测提示词】已经写好了。你只需要把提示词复制给AI(不要给豆包,不准确),然后在最底下粘贴你的脚本台词,发过去,AI 就会直接吐出“快、中、慢”三种语速分别需要多少秒。
这样你再去生成口播视频的时候,就能更准确地判断应该生成几秒,不容易拖节奏,也不容易浪费积分。
【字数预测提示词】

夜雨聆风