今天聊一个做短视频内容的人都会碰到的事:怎么快速拿到短视频里的逐字稿。
拆爆款、学口播结构、积累文案素材,第一步都一样:先把视频里说的话变成文字。
听起来简单,实际操作起来很烦。
把链接丢进小程序,要看广告才能解锁。免费次数用完了就得付费。有的工具干脆只给前 30 秒,剩下的要充会员。
也有人先下载视频,再丢进剪映识别字幕再导出。能用,但链路长,一条视频折腾下来好几分钟。如果你每天要拆三五条,逐条手动处理,光提取这一步就能占掉半小时。
但其实不少人不知道有一种量大管饱还有免费额度的途径:用的是飞书多维表格 + 阿里百炼。
飞书多维表格有一个字段捷径,叫"音频视频转文字",背后对接的是阿里百炼的语音识别模型,配置好阿里百炼的 key。在表格里加这个字段,把视频的原始链接传进去,它就能自动把口播内容转成完整的逐字稿。

关键是,阿里百炼每月有免费的 10 小时额度,按照一条3分钟的视频来算,大概能处理200条,日常拆片完全够用。

而且多条视频链接填进飞书表格后,字段会自动自动提取,不用一条一条等。提取完的逐字稿和视频信息在同一张表里,后续对比、标注、归档都方便。
但这里有一个坑。很多人卡在这一步。
阿里百炼需要的不是小红书或抖音的分享链接。分享链接打开是一个网页,模型没法直接从网页里提取音频。
它需要的是视频的原始文件链接,长这样:
1 2
https://sns-video-xxx.xhscdn.com/xxxx.mp4?sign=xxx而不是这样:
1 2
https://www.xiaohongshu.com/explore/xxxx
怎么拿到原始链接?
其实有很多浏览器插件可以做到,比如MediaClaw社媒虾,能从小红书、抖音直接提取视频的原始文件链接。
单条操作很简单,在插件侧边栏里对当前视频触发采集,原始链接会作为字段之一被提取出来,导出成 excel 表格。

拿到视频原始链接,复制到飞书表格里,AI 字段就能直接读取并提取逐字稿。

一条两分钟的视频,通常几十秒出结果。
整套流程跑通之后,从刷到视频到拿到逐字稿,中间没有任何多余的步骤。
不用下载视频,不用在多个工具间切换,不用看广告。采集和取链接在 MediaClaw 里完成,逐字稿提取在飞书表格里完成,结果集中在一张表。
拿到逐字稿之后能做的事情就多了。
对比多条视频的口播结构,用 AI 做进一步拆解,积累可复用的文案素材。甚至整条笔记的标题、正文、口播内容的改写,都可以直接在表格里进行。
你再在这些结果基础上,做判断、取舍和创作。


怎么上手:
chrome 插件市场直接安装 medaiclaw 这个插件,单条笔记和视频都可以免费采集。飞书模板+分析提示词我也准备好了【在文末获取】,你可以复制过去配置模型,按你的需求修改。
每月 10 小时免费额度,先跑通流程再说。
要是你操作数量比较多,或者不想每次手动复制链接,MediaClaw 的付费版支持采集数据直接同步飞书多维表格,原始链接自动填入,配合 AI 字段提取逐字稿,拆解脚本,改写新笔记,一步到位,省掉中间所有手动环节。
如果你也在做短视频拆解,或者在搭类似的内容工作流,欢迎交流。
https://my.feishu.cn/base/H9fAb5QYtagaLDsjgdPcaliGnyf?from=from_copylink
夜雨聆风