《丧尸清道夫》之后,我翻了一遍手头的AI工具

最近，《丧尸清道夫》刷屏了。

一个云南小伙，中专毕业，火车司机转行婚礼摄影，用10天时间、3000块钱，手搓了一部3分34秒的AI短片。全网播放量过亿，好莱坞导演满世界找他。

他在片尾把AI模型写进了制作人员名单，像对待一个真实的团队成员。

我看这个片子的时候，第一反应不是"哇好厉害"，而是——我也在用AI，工具充了一堆会员，怎么没做出这种效果？

然后我老老实实把手上用过的工具又过了一遍。

不对比参数，不列功能表——那些官网都有。只说我自己的真实感受，踩过的坑，花过的钱。

文生图：四款工具，一个结论

我充过会员的文生图工具有四个：WHEE、可灵、豆包、GPT-Image-2。

我的习惯是同一个prompt丢进几个工具比着试，看谁出图最接近我脑子里的画面。试多了就清楚了——

GPT-Image-2，生图的主场。

我用的平台是秒出AI，底层就是Image2。OpenAI今年4月出的，画质是这四个里最高的，没有之一。同样一个提示词，Image2出的图在光影、材质、细节上明显高一档。

但有个坑：中文文字还是会乱码。做带中文字的图，Image2搞不定，所以我用豆包来补这个短板。中文文字相关的图交给豆包，其他的一律Image2。

秒出AI的设计会员39.9一个月，限100张图。对出图质量有要求的话，这个钱花得值——因为别的工具出的图你还得返工，返工的时间也是成本。

WHEE和可灵，说实话，出图比较生硬。

同一个prompt，Image2能理解你想要的那种质感，WHEE和可灵出来的画面总差一口气——不是说不能用，是差那么点意思。像你心里想的是油画，它给你出了张水彩，不是不对，但不是你要的。

WHEE上手简单，"灵感广场"能看别人怎么写提示词，对新手友好。可灵做视频是强项，文生图是顺带的。这两款我用，但不是主力。

豆包，辅助用的。

方便，手机端随时用，跟聊天一样。有想法直接用，搞不定的再换别的工具。遇到中文文字渲染的问题，豆包顶上。豆包当速写本可以，当交付工具差点意思。

我的结论： Image2是生图主场，豆包打辅助补中文短板，WHEE和可灵偶尔比对着用。

文生视频：三个工具，三种气质

文生视频我试过Vidu、扣子、豆包。

但先说一句——我不是拿这些工具随便玩玩的。在做"钱去哪了"之前，我用AI做中医养生调理类的视频。那时候没有方向，就近找了一条路，就扎进去了。后来搁置了，后面再说原因。先说工具。

Vidu，让静态图动起来。

我最主要的用法不是从零生成视频，而是把一张静态图片丢进去，让画面动起来——而且可以延展图片的近景远景，画面不失真。这个能力太实用了。你有一张构图不错的图，想让它有动态感，Vidu一丢就出，出来的画面跟原图是一个调子，不会跑偏。

也能从零文生视频，画质在线，1080P直出，细节不糊。

扣子，功能最全，成本最狠。

说真的，扣子的视频生成功能是我用过最"全"的。从脚本生成、分镜拆解、画面生成、配音配乐，到最终成片——一站式搞定，不需要在五六个工具之间来回切。功能强大是事实。

但最大的缺点也是事实：贵。

贵到什么程度？一个3分钟左右的视频，生成一次要23万积分。还不包含后期的调整和修改。

23万积分什么概念？你算算，如果只是个人创作者，想做几条内容试试水，这个成本根本扛不住。它更适合团队、企业级用户，有预算、有明确产出要求的场景。

对一个人干的我来说，功能再强，用不起就是用不起。

豆包，人物最稳。

文生视频最烦的是什么？人物变脸。前一个镜头还是张三，下一个镜头变李四了。豆包在角色一致性上做得不错，同一段视频里人物不会跑偏。

功能上，文生视频、图生视频、数字人都有，覆盖面广。字节生态的好处是跟即梦、剪映打通了，视频生成完直接进剪映剪辑，流程顺。

缺点是画质不如Vidu，长度也不如Vidu能续。5-10秒的短视频没问题，想做个有叙事逻辑的3分钟，还是得拼。

我的结论： 静态图动起来用Vidu，要一站式流程用扣子（前提是扛得住积分），要人物稳定用豆包。没有完美的，只有适合的。

那条我走过了又放下的路

前面说了，做"钱去哪了"之前，我用AI做中医养生调理类视频。

那时候没方向，能做什么就做什么，就近找了一条路就扎进去了。

后来搁置了。不是做不下去，是看清了几件事：

第一，重心得放在钱去哪了上。 一个人精力有限，产品不推不动，视频号放着不会自己长。

第二，那不是我的路。 我会做视频，技术层面没问题，但美学、光感这些，我做不到90分。能做到60分，能交付，但做不到让人眼前一亮。做内容这事，60分和90分之间差的不是30分，差的是有没有人看。

第三，做视频的消耗太大了。 AI视频最折磨人的不是生成，是统一。你要保证每一帧图片、每一段视频风格一致——同样的色调、同样的质感、同样的人物。这就要消耗大量的积分反复试，工作量全砸在重复里。生成一遍不难，生成十遍选一个最像的，才要命。

所以中医养生视频这个方向，我做了一段时间后放下了。

不是AI不行，是我用AI做视频这件事，到不了我想要的标准。

说点大实话

刘梓瑜做《丧尸清道夫》花了3000块。

但重点不在钱上。刘梓瑜做短片之前，玩了十年摄影、看了无数电影、做过说唱音乐、自学过导演剪辑。他说过一句话："你看到的不仅仅是AI，也是我看过的电影、听过的音乐、读过的书和写过的字。"

工具人人都有，审美不是。

我花时间在工具上，他花时间在"看"上。我用AI做产品图、做封面、做视频素材——这些都是在执行。他拿着AI做创作。

执行和创作之间，差的不是工具。

当然，我不是在说"别用工具"。恰恰相反——我充了这么多会员，每个工具都有它的用处。关键是：别把时间全花在比较工具上，工具只要够用就行，剩下的时间拿去看、去想、去磨你脑子里的那个画面。

刘梓瑜最折磨他的镜头，是机器人骑鸵鸟被椰子树绊倒那一段。AI一直不听他的，位置对了场景不好看，场景好看了位置不对。他死磕。

这种死磕，不是工具能替你做的。

我也在用AI建我的产品"钱去哪了"，每一步都在试、在调。用的工具不一定是最贵的，但一定是我实际试过之后选的。

不迷信任何一个工具，也不排斥任何一个。能用就用，不好用就换。

如果你也在试各种AI工具，欢迎聊聊你的真实体验——不是官网说的那些，是你自己踩过坑之后的感受。

如果你想知道你的公司最大的问题值多少钱，试试「钱去哪了」。