乐于分享
好东西不私藏

阿里这个变态的AI短视频神器,10.2k Star,我却不敢推荐给所有人

阿里这个变态的AI短视频神器,10.2k Star,我却不敢推荐给所有人

上周五晚上十一点。我对着电脑屏幕发呆。

刚做完一条视频, 1 分半。耗时: 3 小时。播放量: 23 。

然后我用了这个工具。 15 分钟。又做了一条。

播放量: 2100 。

不是我做得好——是这个工具,确实有点东西。


然后上周刷 GitHub ,看到一个项目叫 Pixelle-Video 。 AIDC-AI 开源的,阿里国际做的。 10.2k Star , 1.6k Fork 。

看到 Star 的时候,我心想:又来一个吹牛的。

但点进去看完了——我沉默了三分钟。

不是因为它完美。是因为它在”吹牛”和”真能干”之间的那条线上,踩得特别准。

当然,也可能是我想多了。 1.6k Fork 里有多少是”收藏了就是会了”,谁知道呢。


它到底能干嘛?

说人话:你给它一段文字,它帮你生成一条带画面、带配音、带字幕、带 BGM 的完整短视频。

不是 PPT 轮播。是真的有镜头感、有节奏、有情绪的那种。

核心三大模块:

数字人口播

上传一段真人视频, AI 提取你的形象和声音。然后你输入文字,”你”就能对着镜头念出来。

支持韩语、英语、中文。口型能对上,语气不机械——至少演示里是这样。

我第一次看到这个效果时,愣了。

不是因为它有多好。是它让我意识到——以后”真人出镜”这件事,可能再也不值钱了。

当然,演示是演示,你跑起来是另一回事。收费平台贵是贵,至少有人维护。开源项目呢? 7 个贡献者, 65 个 Issue 堆在那儿, 18 个 PR 没人理。你遇到问题,大概率要自己啃代码。

这很现实。也很劝退。

图生视频

给一张静态图, AI 让它动起来。卡通风格、写实风格都能做。

不是那种傻乎乎的左右平移。是有景深、有运镜、有物理感的那种动态。

官方演示很惊艳。我实际跑出来的效果——嗯,有一半吧。另一半像 PPT 加了点特效。

动作迁移

这个有点狠。你给一个人物图,再给一段动作视频, AI 让图里的人物做出同样的动作。

演示里是一只小猫在跳舞。效果——有点鬼畜,但确实在动。

我直说吧:这个功能现阶段就是玩具。帧率不稳,肢体穿模,动作僵硬。玩玩可以,认真不行。


它最吸引我的,其实是这个

做短视频这行,最费时间的不是拍,是”找”。

找素材,找 BGM ,找合适的转场节奏,找能用的模板。

Pixelle 给了 11 种场景模板。不是说功能堆砌——是每一种都针对具体场景调好的:

人文纪实——旅行 vlog 、风景记录,画面慢, BGM 舒缓
知识科普——Qwen 生图 + AI 解说,一条龙,适合做知识号
副业赚钱——电影解说、带货视频,节奏快,适合变现类账号

剩下 8 种就不一一说了。总之,你做哪类视频,就用哪个模板。不是随便套滤镜,是真的按场景设计的。

不过我也得说——模板再好看,救不了烂内容。你脚本烂,出来的视频就是”精致的垃圾”。

这锅 AI 不背。


我试了 3 次才跑通,差点砸电脑

这是我最关心的问题:好不好部署。

Pixelle 给了三条路: Windows 一键包、 Docker 、源码安装。

我试的是 Docker 。从 clone 到跑起来,大概 15 分钟。

中间卡了一次——config.yaml 要填 LLM 的 API Key 。没有 Key 的话,脚本生成直接报错。

这设计挺烦的。你不能先让我跑起来看看效果,再决定要不要填 Key 吗?

而且文档没写清楚哪些 Key 是必填、哪些可选。我试了三次才通。第三次的时候差点把电脑砸了。

填上 Key 之后,正常。 Web UI 是 Streamlit , localhost:8501 。三步走,确实不复杂。


但有几个坑,官方不会告诉你

好了,夸完了。说点实在的。

第一,它不是完全免费的

开源是开源,但跑起来要调各种 API 。 LLM 用 OpenAI 或 Claude ,图像生成用 RunningHub 或 ComfyUI , TTS 也有成本。

一条 1 分钟的视频,成本大概 0.5-2 块钱。取决于你用的模型。

但别忘了——这还没算你的 GPU 电费。 4090 跑 5 分钟,电费也得几毛。

比请剪辑师便宜,但不是”零成本”。

那些吹”完全免费”的博主,不是蠢,是坏。

第二,生成速度没那么快

官方没说具体数字。我估算——一条 2 分钟的视频,在 5090 上大概 13-15 分钟。

CPU 跑?

别想了。没有 GPU ,等一条视频的时间够你手动剪三条。

我试过。风扇狂转 40 分钟,结果报错内存不足。那感觉——就像你排队半小时买奶茶,轮到你了说卖完了。

第三,质量天花板取决于你的 prompt

Garbage in, garbage out 。

你脚本烂,出来的视频就烂。模板再好看也救不了。

AI 只是把你的想法,更快地变成画面。

如果你连想法都没有——

那 AI 只能帮你更快地生产垃圾。


我的结论

如果你符合以下任意一种情况, Pixelle 值得试:

做自媒体,每天需要量产短视频
做知识付费,想把文章转成视频分发
做跨境电商,需要多语言口播视频
就是好奇,想玩玩 AI 视频

如果你不符合——

比如一个月才发一条,或者对画面质量要求极高——那还是请剪辑师吧。

AI 工具不是万能药。它是止痛药。你疼的时候有用,不疼的时候别乱吃。

AI 工具的价值,不是替代专业人士。

是让”本来做不到”的人,”勉强能做到”。

让”本来要花 2 小时”的事,”15 分钟搞定”。

Pixelle 在这个定位上,做得挺扎实的。

不是革命。是实用的进步。

不是所有工具都要改变世界。有些工具,只是让今天的你,比昨天轻松一点。

这本身就是价值。

当然,如果你试完觉得不好用——

回来骂我。我等着。


开源地址: https://github.com/AIDC-AI/Pixelle-Video

你觉得 AI 做短视频,能替代人工剪辑吗

转发给那个天天喊”我要做短视频”但一直没动手的朋友