Hermes制作动画用到的skill,名叫manim videos,其原理是用代码来写一段动画。实际上类似的skill在其他智能体工具中都有,比如在codex和claude code中,这个skill叫做HyperFrames。而HyperFrames在生成视频时,是可以用指定的图片或者视频作为视频的底层的,我们可以将需要的素材放在指定文件夹中,让codex使用这些素材。
并且,HyperFrames是可以人工干预剪辑的,如果你对最终结果要求比较高,可以让codex在最终导出前先让你确认,那么你就能进入到HyperFrames的剪辑界面,调整完成后再生成mp4的视频。

那么,有同学要说了,做视频最麻烦的步骤不是剪辑,而是找素材,能不能让AI帮我把找素材、剪辑全都搞定呢?答案是可以!这时候就要用到codex的另一个skill:Codex Chrome Extension。这是一个让codex可以后台操作Chrome浏览器的skill,你可以让codex根据脚本文案的意思,自动去找视频素材,下载,然后剪辑。
在这里,主播给了codex一个免费视频的下载网站,这里也可以推荐给大家,pexels。在提示词中,主播让codex根据脚本内容提炼关键词,然后用关键词在pexels上搜索素材,限定为横版视频,并且提醒codex区分广告和收费内容。于是,我们就实现了让coedx根据视频脚本自动找素材自动下载、剪辑最终输出视频。
你学会了么?赶紧去试试吧!
请根据我提供的视频脚本和口播音频制作一条视频。
输入素材:
- 视频脚本:(填入路径)
- 口播音频:(填入路径)
- 输出文件夹:(填入路径)
视频规格:
- 横版 16:9
- MP4 格式
- 不额外添加配音,采用提供的口播音频作为配音。
- 不额外添加配乐,除非我另行说明
- 视频主体画面必须以真实动态视频素材为主,不要用“静态图片 + 文字框切换”作为主要形式
核心制作方式:
1. 先阅读脚本,将视频拆分成若干个叙事镜头。
2. 根据每个镜头的语义,整理视频素材搜索关键词表。关键词需要包含中文和英文,例如“发电 / power generation / power plant / electricity / renewable energy”等。
3. 使用 Chrome 自动访问免费视频素材网站搜索素材,优先使用 Pexels:
https://www.pexels.com/zh-cn/videos/
4. 搜索素材时必须筛选横版视频,只下载免费素材。
5. 注意甄别广告、收费素材、点数下载、Premium 内容。只要页面出现付费、支付点数、Premium、订阅下载等信号,就不要下载该素材。
6. 每个候选素材下载前,先打开详情页确认:
- 是否免费
- 是否横版
- 是否和镜头内容匹配
- 是否没有明显水印或广告
7. 下载素材后,用 ffprobe 检查素材信息,包括分辨率、比例、时长、帧率、有无音轨。
8. 将下载的视频素材统一保存到输出文件夹下的 assets/videos 子目录,并建立素材来源记录表,包括素材文件名、来源链接、关键词、用途镜头、分辨率、时长。
剪辑要求:
- 视频素材是主要画面内容。
- 根据内容节奏裁切、拼接素材,使画面和讲述内容同步。
- 每个镜头素材要服务叙事,不要只是关键词相似。
- 如果某一段脚本更适合图表、流程、对比、时间线或关键词提示,可以用 HyperFrames 叠加文字、图标、标签框、箭头、圈画、数据卡片等解释层。
- 文字叠加要克制,不要大段字幕铺满画面。
- 重点内容可以用短标题、关键词标签、手写标注、下划线、箭头、局部高亮等方式呈现。
HyperFrames 制作要求:
- 使用 HyperFrames 制作最终视频。
- 使用口播音频作为主时间轴。
- 视频素材作为底层 `<video>` 内容。
- 使用 GSAP / CSS / SVG / Canvas 添加必要的信息层动效。
- 叠加层必须和脚本内容匹配,例如:
- 关键结论:短标题浮现
- 因果关系:箭头或流程线
- 数据或趋势:简洁图表
- 企业/机构:真实 logo 或官方风格素材
- 重点词:圈画、下划线、便签标注
- 不要让文字、图表、标签遮挡视频主体。
- 每个镜头都要有自然入场和转场。
- 动画应确定性可复现,不使用不可控随机效果。
- 不要使用无限循环动画。
流程要求:
1. 读取脚本,预估时长。
2. 拆分镜头,并给出镜头表。
3. 为每个镜头生成素材搜索关键词。
4. 使用 Chrome 到 Pexels 搜索、筛选、下载横版免费视频素材。
5. 建立素材资产表。
6. 使用 ffmpeg 对素材做必要裁切、转码、静音处理或尺寸统一。
7. 使用 HyperFrames 制作视频合成。
8. 运行 HyperFrames lint / validate / inspect。
9. 渲染最终 MP4。
10. 抽取关键帧截图检查文字溢出、元素遮挡、素材错配等问题。
11. 最终告诉我:
- MP4 输出路径
- 使用了哪些视频素材
- 每个主要镜头叠加了哪些文字、图表或说明元素
- 检查流程是否通过
如果 Chrome 无法操作、素材网站出现验证码、登录限制、付费限制或无法确认授权,不要绕过限制,请暂停并向我说明问题。
夜雨聆风