很多人写AI视频提示词时,只会描述“画面里有什么”。
中文提示词:
场景 1(0–5 秒):一名大胆的空中游侠使用光滑的生物机械滑翔翼在密集的浮空森林中滑翔。他并非直线移动——而是动态地穿梭于巨大的浮空根须、悬挂的藤蔓和漂浮的岩石碎片之间。进行细微的空中动作,轻微的倾斜和偏转。柔和的阳光透过迷雾和植被,形成空灵的光束。摄像机从后面和略微下方紧随其后,强调运动和深度。
场景 2(5–10 秒):游侠离开森林,进入浮空岛上的广阔空中集市。他立即向右转(重要的方向转变),展现出一个繁忙的垂直市场,市场中有空中的商人、浮空的摊位、绳索桥梁和过往的空中飞船。他穿过混乱的环境向下俯冲——躲避狮鹫,从交易点滑过,飞过石头拱门和桥梁。摄像机进行平滑的电影式追踪运动,动态运动模糊,增强速度和敏捷性。
场景 3(10-15 秒):亡命之徒接近一个显眼的空中酒馆/西部牛仔风格空中沙龙(幻想版的“餐厅”),它悬挂在漂浮的岛屿之间。他首先到达主入口平台,然后滑翔进入。镜头无缝跟随他进入内部:温暖的发光灯光,木制幻想混合建筑,绳索,灯笼,以及热闹的气氛。从明亮的天空过渡到舒适的室内灯光。风格与视觉基调:超现实主义,高奇幻电影美学,史诗规模,强烈的速度和垂直运动感,体积光,雾气,水晶反射,动态运动模糊,高细节,4K。
英文提示词:
Scene 1 (0–5s): A daring aerial rogue glides through a dense floating sky-forest using a sleek bio-mechanical glider. He does not move in a straight line—instead, he weaves dynamically between giant floating roots, hanging vines, and drifting rock fragments. Subtle aerial maneuvers, slight banking and tilting. Soft sunlight filters through mist and foliage, creating ethereal light beams. Camera follows closely from behind and slightly below, emphasizing motion and depth. Scene 2 (5–10s): The rogue exits the forest into a vast floating-island bazaar in the sky. He immediately turns right (important directional shift), revealing a bustling vertical marketplace filled with airborne merchants, floating stalls, rope bridges, and passing airships. He dives downward through the chaotic environment—dodging griffins, slipping past trading posts, and flying under stone arches and bridges. Camera performs a smooth cinematic tracking movement with dynamic motion blur, enhancing speed and agility. Scene 3 (10–15s): The rogue approaches a prominent sky tavern / cowboy-style aerial saloon equivalent (fantasy adaptation of “restaurant”) suspended among the floating islands. He first reaches the main entrance platform, then glides inward. Camera follows him seamlessly into the interior: warm glowing lights, wooden-fantasy hybrid architecture, ropes, lanterns, and lively atmosphere. Transition from bright sky to cozy interior lighting. Style & Visual Tone: Ultra-realistic, high-fantasy cinematic aesthetic, epic scale, strong sense of speed and vertical motion, volumetric lighting, mist, crystal reflections, dynamic motion blur, high detail, 4K.
详细图解:

比如:森林、飞行器、人物、集市、酒馆、阳光、雾气……
但真正决定一条AI视频有没有电影感的,并不是这些单独的元素,而是:
空间怎么变化?镜头怎么跟随?人物怎么运动?画面节奏怎么推进?
这次我们来看一个15秒的AI奇幻飞行视频案例。
它的内容并不复杂,但结构非常清晰:
天空森林 → 漂浮集市 → 空中酒馆
短短15秒,完成了一次完整的奇幻世界穿越。
01
先建立世界观:让观众第一秒就进入画面
视频一开始,并不是简单地展示一个人物飞行。
而是让一位“空中侠客”驾驶一架仿生机械滑翔机,穿梭在茂密的漂浮天空森林中。
这里有几个关键点:
第一,人物不是静止的。他在飞,而且飞行路线不是直线。
第二,环境不是普通森林。而是漂浮在天空中的森林,有巨大的树根、垂下的藤蔓、漂浮的碎石。
第三,镜头不是旁观。镜头从后方略低的位置紧跟角色,让观众有一种“跟着他一起飞”的代入感。
这就是电影感的第一步:
不要只写场景,要写角色与场景之间的运动关系。
如果只写:
一个侠客驾驶滑翔机飞过天空森林
画面可能会很平。
但如果写成:
他在巨大漂浮树根、垂蔓和碎石之间灵动穿梭,滑翔机轻微倾斜、盘旋、躲避障碍,镜头从后方略下方紧随其后
画面立刻就有了速度、空间和纵深。
02
中段加入方向转换,让画面真正“动起来”
第二段最重要的设计,是一个非常明确的动作:
他立即向右转。
这个细节非常关键。
很多AI视频失败,不是因为画面不好看,而是因为运动方向不明确。模型不知道角色该往哪里走,也不知道镜头该怎么跟。
所以提示词里必须加入明确的方向指令。
比如这里写的是:
He immediately turns right.
这个“向右转”不是普通动作,而是一次空间切换。
角色从森林中冲出,右转进入一座巨大的漂浮岛屿集市。
于是画面从自然场景,切换到更复杂的社会场景:
空中商贩、漂浮摊位、绳索桥、飞艇、狮鹫、交易站、石拱桥……
这一步让视频的层次变丰富了。
它不是单纯飞行,而是进入了一个正在运转的奇幻城市。
这类画面最适合用在AI视频里,因为它有足够多的视觉信息:
高低错落的建筑、来回穿梭的飞行物、复杂的前中后景、不断变化的速度感。
03
结尾给出明确落点,视频才不会散
第三段设计得很好,因为它没有继续无限飞下去。
它给了观众一个明确目的地:
空中酒馆 / 牛仔风格的奇幻酒吧。
角色先抵达入口平台,然后滑翔进入室内。
这一步非常重要。
因为一个好的短视频,不能只有炫技,还要有“到达感”。
前面是高速飞行、躲避、穿梭;最后进入酒馆,光线从明亮天空变成温暖室内灯光。
这个光线转换,会让视频有一种完整的结尾感。
冷色天空、薄雾、体积光,转为木质结构、灯笼、绳索、暖光。
画面情绪也从“刺激冒险”,过渡到“神秘热闹”。
这就是一个15秒短片的完整结构:
开场进入世界,中段加速穿越,结尾抵达目标。
04
这条提示词真正值得学习的地方
这条提示词不是简单堆关键词,而是具备完整的影视逻辑。
它至少有5个值得学习的点:
1. 有明确角色
不是“一个人”,而是:
a daring aerial rogue一位胆大的空中侠客 / 空中盗贼。
角色身份越明确,AI越容易生成统一气质。
2. 有明确载具
不是普通滑翔机,而是:
sleek bio-mechanical glider造型流畅的仿生机械滑翔机。
这个设定让画面立刻有了奇幻与科幻混合感。
3. 有明确路线
不是“飞过天空”,而是:
天空森林 → 漂浮集市 → 空中酒馆
路线清楚,视频才有叙事。
4. 有明确镜头
提示词里写了:
Camera follows closely from behind and slightly below.
镜头从后方略下方紧跟。
这会让画面更像电影追逐镜头,而不是普通展示镜头。
5. 有明确光影变化
第一段是柔和阳光、雾气、森林光束;第二段是集市空间里的动态光影;第三段是从明亮天空进入温暖室内。
光影变化让视频有节奏,而不是从头到尾一个调子。
05
这类AI视频提示词应该怎么写?
如果你也想做类似的AI奇幻短片,可以按照这个结构来写:
第一步:确定主角他是谁?身份是什么?气质是什么?
第二步:确定交通方式飞行、奔跑、滑行、骑乘、驾驶?
第三步:确定三个空间开场在哪里?中段经过哪里?最后到达哪里?
第四步:确定镜头运动跟拍、俯拍、低角度、推镜、拉镜、环绕、穿越?
第五步:确定视觉风格超写实、电影感、奇幻、赛博朋克、末日、童话、复古?
06
可复用提示词结构
下面这个结构可以直接套用:
A [character identity] moves through [scene 1] using [vehicle / movement method].The character does not move in a straight line, but dynamically weaves through [obstacles and environmental elements].Camera follows from [camera position], emphasizing speed, depth, and motion.Then the character exits into [scene 2], makes a clear [directional action], and moves through a more complex environment filled with [secondary elements].Finally, the character reaches [destination scene] and transitions from exterior to interior.Style: ultra-realistic, cinematic, high detail, volumetric lighting, dynamic motion blur, epic scale.
这个结构的核心不是堆形容词,而是让AI理解:
谁在动,怎么动,从哪里到哪里,镜头怎么跟。
结尾总结
一条好的AI视频提示词,本质上不是“画面描述”,而是“镜头导演”。
你要做的不是告诉AI画面里有什么,而是告诉AI:
角色怎么运动,空间怎么切换,镜头怎么跟随,情绪怎么变化。
当提示词具备这些内容时,AI视频才会从“好看的图动起来”,变成真正有叙事感的电影片段。
这条15秒奇幻飞行视频,就是一个很好的例子。
它用三个场景完成了一次完整冒险:
从天空森林出发,穿过漂浮集市,最终抵达空中酒馆。
短,但完整。快,但不乱。奇幻,但有镜头逻辑。
这才是AI视频提示词真正应该学习的地方。
夜雨聆风