2026 做视频不用剪辑软件了:6 个 AI 视频 Skill 实战,丢给 Claude Code 就出片
大家好我是老罗。
前两天我想做个短视频,打开剪辑软件,导入素材、拖时间轴、加字幕、调色……一套折腾下来半小时没了,关键最后还丑。
我就琢磨:都 2026 了,我天天用 Claude Code 写代码,凭什么做视频还得手动拖时间轴?
于是我把 GitHub 上 6 个最顶的开源 AI 视频 Skill 全装上了。素材丢进去,跟 AI 说句话,成片直接出来——剪辑、调色、字幕、动画全自动,而且全开源、全免费。
今天老罗就把这 6 个全给你盘一遍:每个是干嘛的、怎么装、我实测的案例、适合谁用。我还本地真渲了两个成品当证据,不空口吹。
一句话先给结论
这 6 个 Skill 不是同类竞品互相打架,而是一条完整的 AI 视频流水线,各管一段:
-
• 想要代码渲染画面(极客感)→ HyperFrames -
• 想要聊天式剪辑(素材直接变成片)→ video-use -
• 想要数学/算法动画(硬核可视化)→ Manim -
• 想要React 批量出片(模板化)→ Remotion -
• 想要命令行处理视频(压片/裁剪)→ FFmpeg Skill -
• 想要一整个 AI 视频团队(流水线)→ OpenMontage
下面挑最猛的三个手把手讲,剩下三个快速过。
01. HyperFrames:写 HTML 就能渲视频
HeyGen 刚开源的(Apache 2.0 协议)。它的思路很疯:你写一段 HTML/CSS/JS,它给你渲染成 MP4。
你刷到的那些”AI 敲代码、光标逐字闪烁”的视频,画面全是代码渲染出来的,一帧都不随机——改个参数,整条视频精确重绘。这对程序员太对味了,咱们最擅长的就是写代码。
🎬 老罗实操演示:
我用它渲了个「罗码视界」的标题卡:浅底 + 大标题 + 橙色 tagline + GSAP 淡入动画。写完 HTML,一行命令:
npx hyperframes render --output titlecard.mp4
3 秒、90 帧,真渲出来一个 MP4。这玩意儿不是我手剪的,是 HTML 直接渲出来的。
适合谁: 做极客感片头、产品演示、代码动画的开发者。设计师用可能门槛高点,但程序员上手跟写网页一样丝滑。
02. video-use:聊天式剪辑,我个人觉得最猛
这个是 browser-use 团队出的(就是搞 AI 浏览器自动化那个明星项目)。一句话讲清:把素材丢进文件夹,跟 Claude Code 说”剪成片”,final.mp4 就出来了。
它内部把剪辑师干的那堆活全包了:
-
• ✅ 自动剪掉口癖(嗯、啊、冷场停顿) -
• ✅ 自动调色(暖色电影感 / 中性 / 自定义 ffmpeg 链) -
• ✅ 自动烧字幕(默认两词一换的大写 chunk) -
• ✅ 每个 cut 加 30ms 音频淡入淡出,杜绝”啪”的爆音
⚠️ 装法不一样,这是最大的坑:
其他 5 个都能一行命令装好。但 video-use 不能这么装。它是 browser-use 官方 repo,得手动来:
git clone https://github.com/browser-use/video-use ~/Developer/video-use
ln -sfn ~/Developer/video-use ~/.claude/skills/video-use
然后装 ffmpeg、配一个 ElevenLabs 的 key(它用 ElevenLabs 做语音转写)。别跟其他几个混着敲,照搬 npx skills add 会失败。
适合谁: 做 Vlog、教程、访谈、口播的——只要你有素材,它能从”一堆 raw 片段”直接给你怼到”成片”。
03. Manim:3Blue1Brown 同款,硬核可视化天花板
如果你看过 3Blue1Brown 的数学视频,那种”圆变方、函数曲线一点点生长、向量空间变换”的动画,全是 Manim 渲的。现在它能装成 Skill,让 AI 帮你画。
🎬 老罗实操演示:
我写了二十来行 Python,渲了个坐标轴 + 黄色 sin 曲线 + 正方形变圆的动画:
from manim import *
import numpy as np
class Demo(Scene):
def construct(self):
axes = Axes(x_range=[-4,4], y_range=[-2,2])
graph = axes.plot(lambda x: np.sin(x), color=YELLOW)
self.play(Create(axes), Create(graph))
square = Square().shift(RIGHT*3)
self.play(Transform(square, Circle().shift(RIGHT*3)))
渲完一个 MP4,3Blue1Brown 那味儿直接就有了。
适合谁: 做数学、算法、数据结构、机器学习原理讲解的硬核知识博主。这工具就是为你生的,别人想抢都抢不走。
其余三个,快速过
Remotion:用 React 写视频。改个参数,整条视频自动重绘,适合批量模板化出片。你现在看的这篇对应的视频,就是我拿 Remotion 渲的——代码就是视频,视频就是代码,这感觉挺奇妙。
FFmpeg Skill:视频处理的祖师爷 FFmpeg 包装成 Skill。压缩、裁剪、转格式、抽帧,AI 一句话搞定,再也不用去查那一长串 ffmpeg 参数。
OpenMontage:开源的 agentic 视频生产系统,12 条流水线、52 个工具、500+ skills,把 AI 凑成”一整个视频团队”。适合要规模化做视频的团队用。
怎么装?一行命令搞定(video-use 除外)
Vercel Labs 出了个 skills CLI,支持 Claude Code、Cursor、Codex 等 68+ agent,标准用法就一行:
npx skills add <owner>/<repo>
比如装 HyperFrames 就 npx skills add heygen-com/hyperframes。
唯独 video-use 是例外,前面讲过了,要 git clone + 软链。这个坑我替你踩了,别再踩。
装完直接跟你的 AI agent 说”帮我做个视频”,它会自动调用对应的 Skill 干活。
按场景选型清单
这页建议收藏,按场景对号入座:
-
• 要极客感片头 / 代码动画 → HyperFrames -
• 要数学 / 算法可视化 → Manim -
• 要批量模板化出片 → Remotion -
• 要聊天式剪辑素材 → video-use -
• 要命令行压片 / 裁剪 → FFmpeg Skill -
• 要规模化视频流水线 → OpenMontage
总结:剪辑软件不是被替代,是被降维了
有人说 AI 剪出来的视频没灵魂。我倒觉得,那些重复的拖时间轴、对口型、加字幕,本来就不该是人干的活。AI 把这些接管了,人才能腾出脑子去想真正重要的——内容、叙事、观点。
2026 年,会用 AI 做视频的人,和还在手动拖时间轴的人,效率差出十倍不止。
这 6 个 Skill 你最想先试哪个? 评论区告诉我,下期我挑呼声最高的那个出一篇完整教程。
往期硬核推荐:
关于作者:
我是老罗,AI 博主,长期深度使用 Claude Code / Codex / Cursor / MCP 做真实项目。关注「罗码视界」,继续拆 AI 编程工具里的真实坑:哪些配置真有用,哪些权限必须收紧,哪些自动化不能裸奔进生产。
夜雨聆风