最近,《丧尸清道夫》刷屏了。
一个云南小伙,中专毕业,火车司机转行婚礼摄影,用10天时间、3000块钱,手搓了一部3分34秒的AI短片。全网播放量过亿,好莱坞导演满世界找他。
他在片尾把AI模型写进了制作人员名单,像对待一个真实的团队成员。
我看这个片子的时候,第一反应不是"哇好厉害",而是——我也在用AI,工具充了一堆会员,怎么没做出这种效果?
然后我老老实实把手上用过的工具又过了一遍。
不对比参数,不列功能表——那些官网都有。只说我自己的真实感受,踩过的坑,花过的钱。
文生图:四款工具,一个结论
我充过会员的文生图工具有四个:WHEE、可灵、豆包、GPT-Image-2。
我的习惯是同一个prompt丢进几个工具比着试,看谁出图最接近我脑子里的画面。试多了就清楚了——
GPT-Image-2,生图的主场。
我用的平台是秒出AI,底层就是Image2。OpenAI今年4月出的,画质是这四个里最高的,没有之一。同样一个提示词,Image2出的图在光影、材质、细节上明显高一档。
但有个坑:中文文字还是会乱码。做带中文字的图,Image2搞不定,所以我用豆包来补这个短板。中文文字相关的图交给豆包,其他的一律Image2。
秒出AI的设计会员39.9一个月,限100张图。对出图质量有要求的话,这个钱花得值——因为别的工具出的图你还得返工,返工的时间也是成本。
WHEE和可灵,说实话,出图比较生硬。
同一个prompt,Image2能理解你想要的那种质感,WHEE和可灵出来的画面总差一口气——不是说不能用,是差那么点意思。像你心里想的是油画,它给你出了张水彩,不是不对,但不是你要的。
WHEE上手简单,"灵感广场"能看别人怎么写提示词,对新手友好。可灵做视频是强项,文生图是顺带的。这两款我用,但不是主力。
豆包,辅助用的。
方便,手机端随时用,跟聊天一样。有想法直接用,搞不定的再换别的工具。遇到中文文字渲染的问题,豆包顶上。豆包当速写本可以,当交付工具差点意思。
我的结论: Image2是生图主场,豆包打辅助补中文短板,WHEE和可灵偶尔比对着用。
文生视频:三个工具,三种气质
文生视频我试过Vidu、扣子、豆包。
但先说一句——我不是拿这些工具随便玩玩的。在做"钱去哪了"之前,我用AI做中医养生调理类的视频。那时候没有方向,就近找了一条路,就扎进去了。后来搁置了,后面再说原因。先说工具。
Vidu,让静态图动起来。
我最主要的用法不是从零生成视频,而是把一张静态图片丢进去,让画面动起来——而且可以延展图片的近景远景,画面不失真。这个能力太实用了。你有一张构图不错的图,想让它有动态感,Vidu一丢就出,出来的画面跟原图是一个调子,不会跑偏。
也能从零文生视频,画质在线,1080P直出,细节不糊。
扣子,功能最全,成本最狠。
说真的,扣子的视频生成功能是我用过最"全"的。从脚本生成、分镜拆解、画面生成、配音配乐,到最终成片——一站式搞定,不需要在五六个工具之间来回切。功能强大是事实。
但最大的缺点也是事实:贵。
贵到什么程度?一个3分钟左右的视频,生成一次要23万积分。还不包含后期的调整和修改。
23万积分什么概念?你算算,如果只是个人创作者,想做几条内容试试水,这个成本根本扛不住。它更适合团队、企业级用户,有预算、有明确产出要求的场景。
对一个人干的我来说,功能再强,用不起就是用不起。
豆包,人物最稳。
文生视频最烦的是什么?人物变脸。前一个镜头还是张三,下一个镜头变李四了。豆包在角色一致性上做得不错,同一段视频里人物不会跑偏。
功能上,文生视频、图生视频、数字人都有,覆盖面广。字节生态的好处是跟即梦、剪映打通了,视频生成完直接进剪映剪辑,流程顺。
缺点是画质不如Vidu,长度也不如Vidu能续。5-10秒的短视频没问题,想做个有叙事逻辑的3分钟,还是得拼。
我的结论: 静态图动起来用Vidu,要一站式流程用扣子(前提是扛得住积分),要人物稳定用豆包。没有完美的,只有适合的。
那条我走过了又放下的路
前面说了,做"钱去哪了"之前,我用AI做中医养生调理类视频。
那时候没方向,能做什么就做什么,就近找了一条路就扎进去了。
后来搁置了。不是做不下去,是看清了几件事:
第一,重心得放在钱去哪了上。 一个人精力有限,产品不推不动,视频号放着不会自己长。
第二,那不是我的路。 我会做视频,技术层面没问题,但美学、光感这些,我做不到90分。能做到60分,能交付,但做不到让人眼前一亮。做内容这事,60分和90分之间差的不是30分,差的是有没有人看。
第三,做视频的消耗太大了。 AI视频最折磨人的不是生成,是统一。你要保证每一帧图片、每一段视频风格一致——同样的色调、同样的质感、同样的人物。这就要消耗大量的积分反复试,工作量全砸在重复里。生成一遍不难,生成十遍选一个最像的,才要命。
所以中医养生视频这个方向,我做了一段时间后放下了。
不是AI不行,是我用AI做视频这件事,到不了我想要的标准。
说点大实话
刘梓瑜做《丧尸清道夫》花了3000块。
但重点不在钱上。刘梓瑜做短片之前,玩了十年摄影、看了无数电影、做过说唱音乐、自学过导演剪辑。他说过一句话:"你看到的不仅仅是AI,也是我看过的电影、听过的音乐、读过的书和写过的字。"
工具人人都有,审美不是。
我花时间在工具上,他花时间在"看"上。我用AI做产品图、做封面、做视频素材——这些都是在执行。他拿着AI做创作。
执行和创作之间,差的不是工具。
当然,我不是在说"别用工具"。恰恰相反——我充了这么多会员,每个工具都有它的用处。关键是:别把时间全花在比较工具上,工具只要够用就行,剩下的时间拿去看、去想、去磨你脑子里的那个画面。
刘梓瑜最折磨他的镜头,是机器人骑鸵鸟被椰子树绊倒那一段。AI一直不听他的,位置对了场景不好看,场景好看了位置不对。他死磕。
这种死磕,不是工具能替你做的。
我也在用AI建我的产品"钱去哪了",每一步都在试、在调。用的工具不一定是最贵的,但一定是我实际试过之后选的。
不迷信任何一个工具,也不排斥任何一个。能用就用,不好用就换。
如果你也在试各种AI工具,欢迎聊聊你的真实体验——不是官网说的那些,是你自己踩过坑之后的感受。
如果你想知道你的公司最大的问题值多少钱,试试「钱去哪了」。
夜雨聆风