他买AI视频会员,却被甲方说“像PPT“:直到我教会他这5个景别

【凌晨2点的微信语音】

凌晨2点17分，我的微信响了。

是小北。一个做AI漫剧的创作者，去年辞了设计院的工作，全职做古风玄幻短剧。

语音很长，我点开，背景音里有键盘敲击声和叹气声。

“哥，我快崩了。“

“甲方看了我新做的古风漫剧，说了一句话——“

他顿了顿，像是在学那个甲方的语气，一字一顿：

“画面挺精致的，就是……像高级PPT自动播放。“

“我做了8版。每一版他都这么说。第8版的时候他终于说实话了：’你的镜头一直在同一个位置，人物一直在同一个大小，我看30秒就困了。’“

“但我真的不知道怎么改。我提示词写了2000字，从光影到配色到服装细节，该写的都写了。他还想要我怎样？“

我听完，回了他一条消息：

“明天下午3点，带你的分镜脚本来找我。我请你喝咖啡。“

一、那杯咖啡喝出来的真相

第二天下午，我们在一家安静的书店咖啡馆坐下。

小北打开笔记本，给我看他的分镜脚本。

第一集，7分钟，一共23个镜头。

我扫了一眼，发现问题比他描述的还要严重。

23个镜头里，19个是中景。人物永远卡在腰部以上，面对镜头说话，说完切到下一场景，继续说话。

远景？没有。

特写？2个。

推镜头？没有。

拉镜头？没有。

摇镜头？没有。

所有的运动都是“缓慢移动“和“轻微晃动“。

我指着屏幕问他：“你这些提示词，告诉我，这句’高质量、电影感、精致光影’，是在描述什么？“

他看了看：“画面要好看啊。“

“那这句’缓慢移动’呢？“

“就是……镜头要动起来啊。“

“问题就在这。“我把咖啡杯放下，“你的每一个字都在说画面长什么样。但没有一个字在说镜头怎么看它。“

“AI不知道你是谁，也不知道你在讲故事。它只知道你写了什么。你只写了’画面要好看’，它就给你一个标准中景，然后循环播放。“

“而电影感的秘密，从来不在于画面多好看，在于镜头会不会呼吸。“

小北愣了一下：“呼吸？“

我说：“对。镜头要有远有近，有进有退，有凝视有抽离。就像人的呼吸——有吸气，有屏息，有呼气。你的视频全程匀速，没有节奏，观众当然困。“

“那怎么办？“

我拿出一张纸，在上面写了五个字。

“景别，决定观众看什么。“

二、五个距离，五种心理

我跟小北讲了一个我自己的故事。

三年前，我第一次给一个古风短剧做分镜指导。导演是个很有想法的人，但不懂镜头。他所有的画面都很好看——宫殿精致、服装考究、光影细腻。

但样片出来，投资人看了10分钟，说了一句话：“这剧没有气场。“

导演很委屈：“我花了那么多钱做美术，怎么没有气场？“

我说：“因为你没有给观众’远近’。“

然后我拿了一段视频给他看。同样是女主角站在宫殿前的场景，我做了五个版本：

第一个版本：大远景。宫殿坐落在群山之间，云海翻涌。人物只在白玉长桥上一点点出现，小得像蚂蚁。

投资人说：“这个有气势。“

我说：“远景看的不是人，是世界。观众需要知道这个故事发生在哪里，这个舞台有多大。开场不给远景，就像上台不鞠躬——不体面。“

第二个版本：全景。女主角全身入画，站在宫殿台阶下，衣摆被风吹动。背景里能看到侍卫列队、宫灯摇晃。

投资人说：“这个人站得很有底气。“

我说：“全景看的是动作和关系。全身入画，观众才能看清姿态、武器、站位。这是人物登场最基本的分寸。“

第三个版本：中景。女主角腰部以上，正在和对面的人对话。表情清楚，手势清楚，背景虚化了但还留着宫殿的轮廓。

投资人说：“这是正常的叙事。“

我说：“对，中景是叙事主力。但它不能是唯一的景别。就像吃饭不能只吃米饭——会腻。“

第四个版本：近景。女主角肩部以上，眼眶泛红，嘴唇微微颤抖，强忍着没有落泪。

投资人说：“这个有情绪了。“

我说：“近景是情绪放大器。当人物听到真相、做出决定、内心崩塌——这些时刻，你必须把观众拉到她面前，让她占领整个屏幕。“

第五个版本：大特写。女主角的眼睛占满画面，瞳孔中倒映着燃烧的宫殿。一滴泪从眼角滑落。

投资人沉默了很久，说：“这个……我记住了。“

我说：“特写不是放大，是压缩。把所有信息压到一个点——眼睛、手指、泪滴、裂缝。观众会本能地觉得：这个细节，会改变一切。“

那天，导演把原本60%的中景，压缩到了35%。加了远景开场、全景登场、近景情绪、特写悬念。

投资人二看样片，只说了一个字：“行。“

我跟小北讲完这个故事，他在纸上写了五个词：

远、全、中、近、特。

然后问我：“那运镜呢？“

三、七种运动，七种情绪

我在纸上又写了七个词。

固定、推、拉、摇、移、跟、环绕。

“景别决定观众看什么，运镜决定观众怎么感受。“

“固定不是偷懒，是沉默。推不是靠近，是逼近。拉不是后退，是真相。摇不是转头，是发现。移不是移动，是穿行。跟不是跟随，是代入。环绕不是旋转，是审判。“

小北挠挠头：“有点抽象。“

我说：“我给你举例子。“

固定镜头——最被低估的安全牌。

“你拍两个人对话，如果镜头一直晃来晃去，观众注意力就被运动分散了。固定下来，所有的动态发生在画面内部——眼神变化、手指颤动、风吹衣摆。这是最安全、最不容易崩的AI运镜。“

推镜头——情绪加压器。

“你有没有看过那种镜头，一开始人物站在废墟里，镜头慢慢靠近她的脸。越来越近，越来越紧。观众会本能地紧张。推得越慢，压力越大。AI视频里，写’缓慢推进’，不要写’快速推进’——那是怼脸，不是艺术。“

拉镜头——真相揭示器。

“镜头先拍一个少女跪在雨中哭泣的脸，然后慢慢拉远。越拉越远，观众看到整座城都在燃烧。人物越来越小，环境越来越大。这种’被世界吞没’的孤独感，只有拉镜头能给。“

摇镜头——视线引导器。

“悬疑片里常用。镜头从空荡街道，慢慢摇向墙角——那里躲着一个人。观众会跟着镜头的转动，自己’发现’这个秘密。这个’发现感’就是摇镜头的价值。“

移镜头——空间穿行器。

“跟摇镜头不一样。摇是站在原地转头看，移是你真的在空间里走。比如拍一个人穿过街道，镜头和他平行移动，背景真实地往后流动。这种穿行感，会让空间显得有厚度。“

跟镜头——代入感制造机。

“这是沉浸感最强的运镜。镜头跟在主角身后，他跑，镜头跑；他转弯，镜头转。观众像变成了主角的影子。但要注意，AI视频里跟镜头不要复杂转向，单方向跟随最稳。“

环绕镜头——高光审判席。

“这个不是日常用的。它是仪式感制造机。主角觉醒、神力爆发、命运转折——这些时刻，镜头围绕他旋转。但不要长，一个短促的环绕就够了。AI容易崩，要节制。“

小北听完，在笔记本上画了两个圈。

“所以景别是横轴，从远到近。运镜是纵轴，怎么动。两个轴交叉，就是一个镜头的坐标？“

我说：“对。而且你只画了坐标系，还没填坐标。“

四、三个万能公式

我拿起他的分镜脚本，翻到第一集第3场。

“来，实战。“

公式一：爆款开场公式

“你看你的开场。第一个镜头是中景，女主角在房间里说话。观众还没搞清楚这是哪里、这是什么世界、这是谁，你就让他看一个人说话。他不困谁困？“

“正确的开场应该是这样——“

远景（交代世界）→ 全景（展示处境）→ 中景（推进动作）→ 近景（放大情绪）→ 特写（制造悬念）

“远景建立空间，全景建立人物，中景推进情节，近景进入内心，特写留下钩子。这五个镜头，就是一场戏的呼吸节奏。“

公式二：觉醒高光公式

“你第5场，主角觉醒神力。你是怎么做的？“

小北看了看脚本：“中景，主角站起来，周围发光，然后切到下一个场景。“

我摇摇头：“觉醒不是’站起来发光’。觉醒是心理仪式。“

全景（建立压迫）→ 近景（绝望表情）→ 大特写（触发力量，瞳孔变化）→ 环绕镜头（觉醒仪式感）→ 远景（展示影响规模）

“先让观众看到他有多绝望，再看到绝望里迸发出什么，再看到这股力量席卷了多大范围。这个节奏，观众才会爽。“

公式三：反转揭示公式

"你第7场，女主角发现反派密谋。你是怎么拍的？"

"中景，女主角站在门外，听见里面说话。"

"太平了。试试这样——"

特写（异常细节：门缝里的一滴血）→ 近景（女主角瞳孔收缩）→ 摇镜头（从她的脸摇向门缝，揭示真相）→ 拉镜头（拉远，展示她身后还站着另一个黑衣人）

"先给异常，再给反应，再给揭示，最后给更大的威胁。这个信息递进，观众才会'哇'出来。"

小北把这些公式抄在纸上，反复看了几遍。

然后问我："那提示词到底怎么写？我之前写的'高质量、电影感'，问题到底在哪？"

2000字提示词，败给一句话

我在纸上写了一行字：

【景别】+【运镜】+【主体】+【动作】+【场景】+【构图】+【光影】+【情绪】

"这是标准提示词结构。

景别和运镜放在最前面，因为它们是导演语言，决定了观看方式。后面的才是美术语言，决定画面长什么样。“

“你之前写的2000字提示词，大概是这样：’高质量，电影感，古风少女站在废墟中，精致的服装，细腻的光影，8K，东方暗黑奇幻……’“

“所有字都在描述’画面长什么样’。但镜头在哪、怎么动、看什么、怎么看——一个字没有。“

“正确的写法应该是这样：“

中景，缓慢推镜头，古风少女站在废墟中央，向镜头伸出手求救，背后是坍塌的楼阁和飞散的金色碎片，人物居中构图，冷蓝月光与暖金逆光交织，紧张无助，东方暗黑奇幻电影感，9:16竖屏

“看到了吗？中景，缓慢推镜头——这8个字，放在最前面。它们决定了整个镜头的灵魂。后面的200字只是皮肉。“

小北盯着这行字看了很久。

然后说：“我回去重写。全部重写。

三个月后的那条朋友圈

三个月后，小北发了一条朋友圈。

没有文字，只有一张截图。

截图是他后台的数据：单条视频播放量127万，点赞8.2万，评论区被“镜头感绝了““这运镜好舒服““终于不是PPT了“刷屏。

他私聊我，发了一个表情包：跪谢。

我回他：“不用谢我。你本来就只差一层窗户纸。“

“那层纸是什么？“

“先定镜头，再定画面。“

如果你也在做AI漫剧、AI视频、短视频分镜，如果你也花了大量时间调提示词、买会员、换工具，但作品总是“精致但无聊“——

问题可能不在工具，不在提示词长度，而在你有没有给镜头“呼吸“。

我把那天跟小北讲的所有内容，整理成了一份《AI漫剧镜头语言速查手册》：

五大景别的标准提示词写法 + 适用场景对照表

六大运镜的AI控制要点 + 避坑指南

三个可以直接套用的分镜串联公式

标准分镜书写模板（镜号/景别/运镜/场景/主体/动作/光影/情绪/镜头目的）

AI视频提示词通用结构模板

需要的同学，评论区回复「镜头手册」，或者后台私信「手册」两个字。

我直接发你。

不收费。

但有个小请求——拿到之后，去试一个镜头。就用最简单的：

远景交代环境 → 全景展示动作 → 中景推进对话 → 近景放大情绪 → 特写留下钩子

先定镜头，再定画面。

评论区留言或者私我发电子文档