乐于分享
好东西不私藏

那些抖音爆火的AI视频,背后用了哪些工具和技巧?

那些抖音爆火的AI视频,背后用了哪些工具和技巧?

最近抖音上是不是经常刷到一些AI做的短视频?有的画质堪比电影大片,有的剧情反转让人猝不及防,评论区经常有人问“这真的是AI做的吗?”

今天就来聊聊这些AI视频到底是怎么做出来的,普通人想试试的话需要哪些工具和技巧。

一、从吃面噩梦到以假乱真:威尔·史密斯吃面进化史

先看两张动图对比。

这是2023年3月,AI生成的“威尔·史密斯吃意大利面”:

那时候的AI视频还很“抽象”。画面里这个“伪人”一样的史密斯拿着意面手舞足蹈,做出各种莫名其妙的张嘴和咀嚼动作,仿佛什么诡异的祭祀场景。这则视频在推特上获得了超过900万的播放量,也让“威尔·史密斯吃面”成了AI视频界公认的“图灵测试”——AI生成的面条有多真实,成了判断各家模型实力的标准之一。

再看这个:2025年10月,AI生成的同一场景:

到了2025年,AI终于能做出像模像样的吃面画面了。史密斯能好好坐在桌前,流畅自然地品尝意面,配合炉火纯青的AI配音技术,整个视频甚至像是真人拍摄的一般自然。虽然少数细节还有破绽,但和两年前相比,已经天壤之别。

“威尔·史密斯吃意面”已成为衡量AI视频进步的非正式基准——从2023年扭曲怪异的噩梦画面,到2025年逼真自然的日常场景,不到两年时间,AI视频完成了从“伪人模仿人类”到“以假乱真”的飞跃。

为什么进步这么快?

关键在于2024-2025年间AI视频技术引入了DaS(Diffusion as Shader)生成控制模型,赋予了AI“3D感知”的能力。简单来说,AI会在三维空间中先构建物体的坐标,再根据相对位置生成每一帧图像——这就让AI视频从“吃了毒蘑菇后的幻觉”变成了有逻辑的运动画面。

2024年2月,OpenAI推出Sora,凭借4K分辨率和最长60秒的超逼真文生视频效果,瞬间引爆全球AI行业。虽然Sora在2026年3月被关停了,但它给行业带来的冲击和推动是不可否认的。

二、现在AI视频能做到什么程度?

现在的AI视频,画质上已经相当接近专业拍摄水平,光影质感、人物表情都做得非常自然。更厉害的是叙事能力——AI视频已经从单纯的“画面展示”进化到可以讲故事了。

比如抖音上爆火的《雪山救狐狸》,采用邵氏武侠风格,讲述侠客雪中救狐、狐狸化人后反套路喊出“我不是狐狸,我是那只酱板鸭”的喜剧反转故事,传播量突破50亿次。而整个视频从创意到上线只花了大约5个小时。

虽然AI视频并非完美无缺,但技术的进步已经让AI视频从一个“偶尔惊艳”的玩具,变成了越来越多创作者的生产力工具。目前在抖音上,大量AI好作品正在涌现,创作者们正在用AI做出以前根本不敢想象的画面。

三、现在主流的AI视频工具有哪些?

目前市面上的主流AI视频工具,国产的已经非常能打了。

1. 快手可灵(Kling)

目前公认效果最出色的一档。2026年2月5日,可灵正式发布3.0系列模型,新增了“主体参考”功能——创作者可以上传参考图,让AI精准锁定主角特征,彻底解决了AI视频中“角色跑偏”的痛点。此外还支持智能分镜,最长可生成15秒连续高清视频。截至2026年1月,可灵AI累计服务已超过500万用户。

2. 字节即梦(Jimeng)

即梦由字节跳动旗下剪映团队打造,深度整合了抖音生态,生成的视频一键就能发布到抖音,非常方便。它对中文提示词的捕捉很准,不会出现“翻译腔”浓厚的怪异画面。目前每天提供20次免费生成额度。2026年2月7日,即梦上线了Seedance 2.0模型,凭借多镜头叙事和高保真画面迅速刷屏。

3. 剪映AI

说剪映是AI工具里的全能王,估计没人反对。2026年的剪映已经完全实现了从“输入文案”到“全自动成片”的闭环,而且大部分核心功能对普通用户完全免费。它的AI克隆音色、数字人主播、智能剪辑功能都是工业级水准。

4. 其他值得关注的工具

– 海艺AI:可以通过集成接口享受某些顶级模型的“无限次”使用权,比如可灵2.6

– 红鸦AI:擅长解决AI创作中的“风格漂移”问题,生成的图片背景、字体、色调高度一致

 通义万相:阿里旗下的AI视频工具,也在快速迭代中

四、AI视频提示词怎么写?

很多新手第一次用AI视频工具时,输入“一只猫在草地上打滚”之类的简单描述,结果生成出来的东西完全不是自己想要的。其实写好提示词是有技巧的。

推荐公式(以Runway官方标准为例):

镜头运动 + 场景搭建 + 细节补充

这个公式的核心逻辑是:先告诉AI用什么方式拍(镜头),再告诉它拍什么(场景),最后补充效果细节。

一个正确的示范:

“FPV摄像机视图。一个漂浮的气泡在沙漠般的田野中央空中移动,周围布满仙人掌植物。阳光在气泡表面折射出彩虹光斑。”

如果是从图片生成视频(图生视频):

那就只需要写画面里“动起来”的部分,不要重复描述图片里已经有的内容。

公式:镜头运动 + 主体动作 + 环境变化

正确的示范:

“无人机环绕镜头,灯塔的灯光有节奏地闪烁,海浪拍打礁石溅起白色浪花。”

新手避雷要点:

1. 不要写故事——一次只做一个“视觉瞬间”,别写“汽车启动→公路飞驰→刹车”这种多个动作串联

2. 不要重复描述——图片里已经有了的,提示词里就别再写一遍

3. 用专业术语提升质感——可以加“8k分辨率”“变形镜头”“电影级照明”等关键词

一个完整的提示词示例:

“低角度跟拍镜头,穿着运动鞋的双脚在绿色草地上奔跑,扬起的草屑在阳光下闪烁。”

用这个公式去尝试,废片率会大大降低。

AI视频正在从一个“新奇玩具”变成真正的创作工具。它不会取代创作者——反而在抖音等平台上,大量AI好作者与好内容正在涌现。

正如一位创作者说的:“用AI做视频,最难的不是操作工具,而是想出一个好故事。”