不会剪视频?能用AI工具自动生成了!
我是那种「想学剪视频想了三年,一次也没打开过剪映」的人,偶尔得做点短视频。以前找同事帮忙,后来不好意思老麻烦人。
于是花了周末,研究了一个开源工具——HyperFrames。
它的定位就九个字:写 HTML,渲染视频,为智能体而生。
什么意思?你不用写代码,你只需要告诉它你想做什么。它自己写 HTML 画面、自己渲染、自己合成——全程不需要你碰任何剪辑软件。给一段内容,自动出视频。
下面用一篇读书笔记当例子,讲讲它怎么用。
先用一个真实例子看看效果
我存了一篇纳瓦尔的文章,讲财富和幸福的。里面有几句挺有意思:
"财富不是拼命追来的,而是正确工作的副产品。"
"幸福是一种可以训练的技能。欲望是痛苦的根。"
我就想:能不能用 HyperFrames 把它做成一条 60 秒视频?
怎么用:四步出片:
第一步:给素材,拿脚本
把两千字文章丢进去,说一句:「提炼成 60 秒视频脚本,8 个场景。」
自动生成了一份分镜表,每个场景标好了:这一段放什么文字、占多少秒、用什么版式。
打工人不用理解「分镜」是什么,拿结果就行。
第二步:生成画面
这是我觉得最实用的地方。
市面上做视频画面一般用 AI 生图——但试过的都知道,中文经常变成乱码。而且改一个字要重新生成一张,等五分钟。
HyperFrames用代码直接渲染画面——深色背景、白色大字、彩条点缀。手机竖屏尺寸,8 个场景,一个脚本跑完,15 秒全出来。中文一个字不差。
排版排字这件事,代码本来就比 AI 生成靠谱。
第三步:配音
旁白用的免费文字转语音。不用注册、不用付费、不用 API key。
自动匹配脚本的每一段,生成对应长度的配音。
第四步:合成
画面有了,配音有了,最后用 FFmpeg 拼成 MP4。
工具还自动给画面加了轻微推近动效——静止图片直接拼会显得死板,有一点镜头运动感就好很多。
跑完,打开 final.mp4,60 秒,有动效,有人声,有字幕。整个过程中我没打开过任何剪辑软件。
打工人为什么需要这个?
在日常工作里,视频的需求在变多:
- 给团队录一段功能演示
- 把周报亮点做成 30 秒快览
- 培训材料里插一段步骤讲解
- 活动复盘做个 60 秒总结
开源 + 免费
HyperFrames 已开源,GitHub 直接拿:
https://github.com/heygen-com/hyperframes
配音免费方案,合成开源组件,整套链路零成本。
关注我,每周分享一个「让打工人也能用起来的 AI 工具实战」。
夜雨聆风