AI的死穴:为什么它总把你的“中景”拍成“全景”?

《AI电影美学之景别控制论》第4集 | 系列共50集

先做一个实验。

请你现在打开任何一个AI视频工具，输入下面这行提示词：

中景镜头，一个穿白衬衫的男人坐在办公桌前，看着电脑屏幕，办公室有落地窗，自然光，电影感。

然后看看AI给了你什么。

大概率是两种结果：

结果一：一个男人从头到脚都在画面里，办公桌、落地窗、甚至天花板上的灯都拍进去了。这是全景，不是你写的中景。

结果二：一个男人的脸占了画面三分之二，电脑屏幕被切掉一半，办公室环境几乎消失。这是近景，也不是你写的中景。

你明明写了“中景”，AI为什么就是不听？

这不是你的提示词不够详细。这是AI有一条奇怪的“中景回避本能”。

---

01 中景是AI最不想拍的景别

在七种标准景别里，AI最愿意拍的是哪两种？

大远景和特写。

你写大远景，AI很开心——环境越大越好，细节越模糊越不容易出错。AI可以尽情挥霍它擅长的风景生成能力。

你写特写，AI也很开心——一张脸占满画面，背景虚化到完全看不清楚。AI不需要处理复杂的环境与人物关系，压力很小。

但中景不一样。

中景需要AI同时做好三件事：人物的表情要清晰、人物的手部动作要自然、环境要保留但不能抢戏。

这三件事，每一件单独拿出来都是AI的弱项。

合在一起，就成了AI最想逃避的作业。

所以当你写“中景”的时候，AI会悄悄往两头跑——要么退一步拍成全景，把环境摊开来慢慢画；要么进一步拍成近景，把背景虚掉省事。

这不是bug。这是AI在偷懒。

---

02 AI的“中景恐慌”到底怕什么？

拆开来看，AI在中景上有三个具体的心病。

第一个心病：手。

中景的取景范围是腰部以上。这意味着，手必须入画。

而AI画手，至今仍然是它的阿喀琉斯之踵。

全景里手太小，画糊了你也看不出来。近景里手常常被切到画外。只有中景，手在画面中央，手指根根分明，AI的弱点暴露无遗。

所以AI的逻辑是：能不拍手就不拍手。全景里手只是一个小色块，安全多了。

第二个心病：人物与背景的边界。

中景要求背景虚化但依然可辨。你需要观众看到“这是一间办公室”，但不是“看清办公室墙上挂的日历”。

这个“虚化但可辨”的度，对AI来说极其难以拿捏。

虚化太多，变成近景。虚化太少，变成全景。

AI的深度估计能力还不够稳定，它常常在“虚多少”这个简单问题上翻车。

第三个心病：构图惯性。

AI的训练数据里，中景的图片样本远远少于全景和特写。

为什么？因为人类拍照片，要么退远拍个全景纪念照，要么凑近拍个特写大头照。规规矩矩站在两米外拍一张腰部以上的中景，在日常生活中反而少见。

数据不够，AI就没学会中景应该长什么样。它只能往它熟悉的全景或特写方向去猜。

---

03 三招逼出AI的完美中景

既然AI想逃，我们就得用提示词把它锁死在中景上。

以下三个方法，实测有效。

---

第一招：用“腰部以上”替代“中景”

“中景”这个词，AI见过，但它对“中景”的理解边界非常模糊。

但“腰部以上”是物理描述，AI的视觉理解对这个更敏感。

· 翻车写法：中景镜头，一个男人在办公室

· 正确写法：腰部以上取景，一个穿白衬衫的男人坐在办公桌前，人物从腰部到头顶完整出现在画面中

· 为什么有效：你把取景范围变成了一个空间指令，而不是一个术语标签

一个通用的中景公式：

腰部以上取景，[人物描述]，人物从腰部到头顶完整入画，[环境描述但标注背景虚化]，浅景深。

---

第二招：给手安排一个“合法动作”

既然中景必拍手，那就不要让手闲在那里。

AI画不好手，主要是因为手在无所事事的时候，AI不知道手指该怎么摆。但如果你给手一个明确的动作，AI有了方向，出错率反而会下降。

· 手不知道该干嘛时：手指可能六根、交叉变形

· 手有明确任务时：拿着咖啡杯、握着笔、翻文件、推眼镜——这些动作AI训练数据里多，手型反而稳定

一个把“手的缺陷”变成“叙事优势”的提示词模板：

腰部以上取景，男人右手握着白色咖啡杯把手，左手食指轻敲桌面，手部动作自然清晰，办公室背景虚化。

你看，手不再是一个“可能会出bug的器官”，而是变成了一个“讲故事的细节”。

---

第三招：写清楚“背景虚化到什么程度”

不要只写“背景虚化”。AI对“虚化”的理解是薛定谔的——打开之前你不知道它是虚了一点点还是虚成了一团色块。

把虚化程度写具体。

· 翻车写法：背景虚化

· 正确写法：背景轻度虚化，办公室的落地窗和百叶帘依然可辨但细节模糊，人物与背景有明显分离感

· 或者：背景虚化程度中等，观众能看出这是一间办公室但不被细节分散注意力

三个虚化等级，你可以直接复制使用：

· 轻度虚化：背景元素轮廓清晰但细节柔化，环境可辨识

· 中度虚化：背景元素可辨认但无法看清细节，人物与背景明显分离

· 重度虚化：背景化为光斑和色块，完全不可辨识

中景一般用“轻度”或“中度”，保留环境的存在感。

---

04 一条提示词，三重锁定

把上面三招合并在一起，就是一条“AI无法逃离的中景提示词”。

锁定前（AI大概率拍成全景）：

中景，一个男人在办公室看电脑。

锁定后（AI乖乖给出中景）：

腰部以上取景，一个穿白衬衫的年轻男人坐在办公桌前，右手握着鼠标，左手轻放在键盘上，眼睛专注地看着电脑屏幕，背景轻度虚化，办公室的落地窗和绿植依然可辨，自然光从侧方照入，人物从腰部到头顶完整入画，浅景深，电影感。

这条提示词里塞进了三重锁定：

· 取景锁定：“腰部以上取景”“从腰部到头顶完整入画”

· 动作锁定：“右手握着鼠标，左手轻放在键盘上”——手有明确任务

· 虚化锁定：“背景轻度虚化，落地窗和绿植依然可辨”——不给AI乱虚的机会

三重锁一上，AI逃不掉了。

---

05 一个测试：这些提示词，哪个能逼出中景？

下面四条提示词，只有一条能稳定生成标准中景。其他三条要么变全景，要么变近景。你来判断一下。

提示词A：

中景镜头，一个女人在厨房做饭。

提示词B：

腰部以上取景，一个女人在厨房切菜，双手动作清晰可见，背景轻度虚化，厨房环境可辨。

提示词C：

特写中景，一个女人在厨房，电影感。

提示词D：

全景，一个女人在厨房做饭，腰部以上。

---

答案在文末。先别翻。

---

06 本周实战作业

这次的作业是“锁定练习”。

请用下面这个场景，写一条AI无法逃离的中景提示词。

场景：深夜便利店，一个穿校服的女生站在杂志架前，手里翻着一本杂志。

要求：必须用上今天讲的“三重锁定”——取景锁定、动作锁定、虚化锁定。

直接在评论区写下你的提示词。我下周挑几个典型做点评。

---

上期测试题答案：

B是唯一能稳定生成标准中景的。A只有“中景镜头”一个模糊指令，AI大概率退成全景。C写“特写中景”，这是一个自相矛盾的术语，AI会不知所措，大概率给出近景。D先写“全景”再写“腰部以上”，AI会听第一个词的，给你全景。

---