【凌晨2点的微信语音】

凌晨2点17分,我的微信响了。
是小北。一个做AI漫剧的创作者,去年辞了设计院的工作,全职做古风玄幻短剧。
语音很长,我点开,背景音里有键盘敲击声和叹气声。
“哥,我快崩了。“
“甲方看了我新做的古风漫剧,说了一句话——“
他顿了顿,像是在学那个甲方的语气,一字一顿:
“画面挺精致的,就是……像高级PPT自动播放。“
“我做了8版。每一版他都这么说。第8版的时候他终于说实话了:’你的镜头一直在同一个位置,人物一直在同一个大小,我看30秒就困了。’“
“但我真的不知道怎么改。我提示词写了2000字,从光影到配色到服装细节,该写的都写了。他还想要我怎样?“
我听完,回了他一条消息:
“明天下午3点,带你的分镜脚本来找我。我请你喝咖啡。“

一、那杯咖啡喝出来的真相
第二天下午,我们在一家安静的书店咖啡馆坐下。
小北打开笔记本,给我看他的分镜脚本。
第一集,7分钟,一共23个镜头。
我扫了一眼,发现问题比他描述的还要严重。
23个镜头里,19个是中景。人物永远卡在腰部以上,面对镜头说话,说完切到下一场景,继续说话。
远景?没有。
特写?2个。
推镜头?没有。
拉镜头?没有。
摇镜头?没有。
所有的运动都是“缓慢移动“和“轻微晃动“。

我指着屏幕问他:“你这些提示词,告诉我,这句’高质量、电影感、精致光影’,是在描述什么?“
他看了看:“画面要好看啊。“
“那这句’缓慢移动’呢?“
“就是……镜头要动起来啊。“
“问题就在这。“我把咖啡杯放下,“你的每一个字都在说画面长什么样。但没有一个字在说镜头怎么看它。“
“AI不知道你是谁,也不知道你在讲故事。它只知道你写了什么。你只写了’画面要好看’,它就给你一个标准中景,然后循环播放。“
“而电影感的秘密,从来不在于画面多好看,在于镜头会不会呼吸。“
小北愣了一下:“呼吸?“
我说:“对。镜头要有远有近,有进有退,有凝视有抽离。就像人的呼吸——有吸气,有屏息,有呼气。你的视频全程匀速,没有节奏,观众当然困。“
“那怎么办?“
我拿出一张纸,在上面写了五个字。
“景别,决定观众看什么。“
二、五个距离,五种心理
我跟小北讲了一个我自己的故事。
三年前,我第一次给一个古风短剧做分镜指导。导演是个很有想法的人,但不懂镜头。他所有的画面都很好看——宫殿精致、服装考究、光影细腻。
但样片出来,投资人看了10分钟,说了一句话:“这剧没有气场。“
导演很委屈:“我花了那么多钱做美术,怎么没有气场?“
我说:“因为你没有给观众’远近’。“
然后我拿了一段视频给他看。同样是女主角站在宫殿前的场景,我做了五个版本:
第一个版本:大远景。 宫殿坐落在群山之间,云海翻涌。人物只在白玉长桥上一点点出现,小得像蚂蚁。
投资人说:“这个有气势。“
我说:“远景看的不是人,是世界。观众需要知道这个故事发生在哪里,这个舞台有多大。开场不给远景,就像上台不鞠躬——不体面。“
第二个版本:全景。 女主角全身入画,站在宫殿台阶下,衣摆被风吹动。背景里能看到侍卫列队、宫灯摇晃。
投资人说:“这个人站得很有底气。“
我说:“全景看的是动作和关系。全身入画,观众才能看清姿态、武器、站位。这是人物登场最基本的分寸。“

第三个版本:中景。 女主角腰部以上,正在和对面的人对话。表情清楚,手势清楚,背景虚化了但还留着宫殿的轮廓。
投资人说:“这是正常的叙事。“
我说:“对,中景是叙事主力。但它不能是唯一的景别。就像吃饭不能只吃米饭——会腻。“
第四个版本:近景。 女主角肩部以上,眼眶泛红,嘴唇微微颤抖,强忍着没有落泪。
投资人说:“这个有情绪了。“
我说:“近景是情绪放大器。当人物听到真相、做出决定、内心崩塌——这些时刻,你必须把观众拉到她面前,让她占领整个屏幕。“
第五个版本:大特写。 女主角的眼睛占满画面,瞳孔中倒映着燃烧的宫殿。一滴泪从眼角滑落。
投资人沉默了很久,说:“这个……我记住了。“
我说:“特写不是放大,是压缩。把所有信息压到一个点——眼睛、手指、泪滴、裂缝。观众会本能地觉得:这个细节,会改变一切。“
那天,导演把原本60%的中景,压缩到了35%。加了远景开场、全景登场、近景情绪、特写悬念。
投资人二看样片,只说了一个字:“行。“
我跟小北讲完这个故事,他在纸上写了五个词:
远、全、中、近、特。
然后问我:“那运镜呢?“
三、七种运动,七种情绪
我在纸上又写了七个词。
固定、推、拉、摇、移、跟、环绕。
“景别决定观众看什么,运镜决定观众怎么感受。“
“固定不是偷懒,是沉默。推不是靠近,是逼近。拉不是后退,是真相。摇不是转头,是发现。移不是移动,是穿行。跟不是跟随,是代入。环绕不是旋转,是审判。“
小北挠挠头:“有点抽象。“
我说:“我给你举例子。“
固定镜头——最被低估的安全牌。
“你拍两个人对话,如果镜头一直晃来晃去,观众注意力就被运动分散了。固定下来,所有的动态发生在画面内部——眼神变化、手指颤动、风吹衣摆。这是最安全、最不容易崩的AI运镜。“
推镜头——情绪加压器。
“你有没有看过那种镜头,一开始人物站在废墟里,镜头慢慢靠近她的脸。越来越近,越来越紧。观众会本能地紧张。推得越慢,压力越大。AI视频里,写’缓慢推进’,不要写’快速推进’——那是怼脸,不是艺术。“

拉镜头——真相揭示器。
“镜头先拍一个少女跪在雨中哭泣的脸,然后慢慢拉远。越拉越远,观众看到整座城都在燃烧。人物越来越小,环境越来越大。这种’被世界吞没’的孤独感,只有拉镜头能给。“
摇镜头——视线引导器。
“悬疑片里常用。镜头从空荡街道,慢慢摇向墙角——那里躲着一个人。观众会跟着镜头的转动,自己’发现’这个秘密。这个’发现感’就是摇镜头的价值。“
移镜头——空间穿行器。
“跟摇镜头不一样。摇是站在原地转头看,移是你真的在空间里走。比如拍一个人穿过街道,镜头和他平行移动,背景真实地往后流动。这种穿行感,会让空间显得有厚度。“
跟镜头——代入感制造机。
“这是沉浸感最强的运镜。镜头跟在主角身后,他跑,镜头跑;他转弯,镜头转。观众像变成了主角的影子。但要注意,AI视频里跟镜头不要复杂转向,单方向跟随最稳。“
环绕镜头——高光审判席。
“这个不是日常用的。它是仪式感制造机。主角觉醒、神力爆发、命运转折——这些时刻,镜头围绕他旋转。但不要长,一个短促的环绕就够了。AI容易崩,要节制。“
小北听完,在笔记本上画了两个圈。
“所以景别是横轴,从远到近。运镜是纵轴,怎么动。两个轴交叉,就是一个镜头的坐标?“
我说:“对。而且你只画了坐标系,还没填坐标。“
四、三个万能公式
我拿起他的分镜脚本,翻到第一集第3场。
“来,实战。“
公式一:爆款开场公式
“你看你的开场。第一个镜头是中景,女主角在房间里说话。观众还没搞清楚这是哪里、这是什么世界、这是谁,你就让他看一个人说话。他不困谁困?“
“正确的开场应该是这样——“
远景(交代世界)→ 全景(展示处境)→ 中景(推进动作)→ 近景(放大情绪)→ 特写(制造悬念)
“远景建立空间,全景建立人物,中景推进情节,近景进入内心,特写留下钩子。这五个镜头,就是一场戏的呼吸节奏。“

公式二:觉醒高光公式
“你第5场,主角觉醒神力。你是怎么做的?“
小北看了看脚本:“中景,主角站起来,周围发光,然后切到下一个场景。“
我摇摇头:“觉醒不是’站起来发光’。觉醒是心理仪式。“
全景(建立压迫)→ 近景(绝望表情)→ 大特写(触发力量,瞳孔变化)→ 环绕镜头(觉醒仪式感)→ 远景(展示影响规模)
“先让观众看到他有多绝望,再看到绝望里迸发出什么,再看到这股力量席卷了多大范围。这个节奏,观众才会爽。“


景别和运镜放在最前面,因为它们是导演语言,决定了观看方式。后面的才是美术语言,决定画面长什么样。“
“你之前写的2000字提示词,大概是这样:’高质量,电影感,古风少女站在废墟中,精致的服装,细腻的光影,8K,东方暗黑奇幻……’“
“所有字都在描述’画面长什么样’。但镜头在哪、怎么动、看什么、怎么看——一个字没有。“
“正确的写法应该是这样:“
中景,缓慢推镜头,古风少女站在废墟中央,向镜头伸出手求救,背后是坍塌的楼阁和飞散的金色碎片,人物居中构图,冷蓝月光与暖金逆光交织,紧张无助,东方暗黑奇幻电影感,9:16竖屏
“看到了吗?中景,缓慢推镜头——这8个字,放在最前面。它们决定了整个镜头的灵魂。后面的200字只是皮肉。“
小北盯着这行字看了很久。
然后说:“我回去重写。全部重写。
三个月后的那条朋友圈
三个月后,小北发了一条朋友圈。
没有文字,只有一张截图。
截图是他后台的数据:单条视频播放量127万,点赞8.2万,评论区被“镜头感绝了““这运镜好舒服““终于不是PPT了“刷屏。
他私聊我,发了一个表情包:跪谢。
我回他:“不用谢我。你本来就只差一层窗户纸。“
“那层纸是什么?“
“先定镜头,再定画面。“
如果你也在做AI漫剧、AI视频、短视频分镜,如果你也花了大量时间调提示词、买会员、换工具,但作品总是“精致但无聊“——
问题可能不在工具,不在提示词长度,而在你有没有给镜头“呼吸“。
我把那天跟小北讲的所有内容,整理成了一份《AI漫剧镜头语言速查手册》:
五大景别的标准提示词写法 + 适用场景对照表
六大运镜的AI控制要点 + 避坑指南
三个可以直接套用的分镜串联公式
标准分镜书写模板(镜号/景别/运镜/场景/主体/动作/光影/情绪/镜头目的)
AI视频提示词通用结构模板
需要的同学,评论区回复「镜头手册」,或者后台私信「手册」两个字。
我直接发你。
不收费。
但有个小请求——拿到之后,去试一个镜头。就用最简单的:
远景交代环境 → 全景展示动作 → 中景推进对话 → 近景放大情绪 → 特写留下钩子
先定镜头,再定画面。
评论区留言或者私我发电子文档

夜雨聆风