《AI电影美学之景别控制论》第4集 | 系列共50集
先做一个实验。
请你现在打开任何一个AI视频工具,输入下面这行提示词:
中景镜头,一个穿白衬衫的男人坐在办公桌前,看着电脑屏幕,办公室有落地窗,自然光,电影感。
然后看看AI给了你什么。
大概率是两种结果:
结果一:一个男人从头到脚都在画面里,办公桌、落地窗、甚至天花板上的灯都拍进去了。这是全景,不是你写的中景。
结果二:一个男人的脸占了画面三分之二,电脑屏幕被切掉一半,办公室环境几乎消失。这是近景,也不是你写的中景。
你明明写了“中景”,AI为什么就是不听?
这不是你的提示词不够详细。这是AI有一条奇怪的“中景回避本能”。
---
01 中景是AI最不想拍的景别
在七种标准景别里,AI最愿意拍的是哪两种?
大远景和特写。
你写大远景,AI很开心——环境越大越好,细节越模糊越不容易出错。AI可以尽情挥霍它擅长的风景生成能力。
你写特写,AI也很开心——一张脸占满画面,背景虚化到完全看不清楚。AI不需要处理复杂的环境与人物关系,压力很小。
但中景不一样。
中景需要AI同时做好三件事:人物的表情要清晰、人物的手部动作要自然、环境要保留但不能抢戏。
这三件事,每一件单独拿出来都是AI的弱项。
合在一起,就成了AI最想逃避的作业。
所以当你写“中景”的时候,AI会悄悄往两头跑——要么退一步拍成全景,把环境摊开来慢慢画;要么进一步拍成近景,把背景虚掉省事。
这不是bug。这是AI在偷懒。
---
02 AI的“中景恐慌”到底怕什么?
拆开来看,AI在中景上有三个具体的心病。
第一个心病:手。
中景的取景范围是腰部以上。这意味着,手必须入画。
而AI画手,至今仍然是它的阿喀琉斯之踵。
全景里手太小,画糊了你也看不出来。近景里手常常被切到画外。只有中景,手在画面中央,手指根根分明,AI的弱点暴露无遗。
所以AI的逻辑是:能不拍手就不拍手。全景里手只是一个小色块,安全多了。
第二个心病:人物与背景的边界。
中景要求背景虚化但依然可辨。你需要观众看到“这是一间办公室”,但不是“看清办公室墙上挂的日历”。
这个“虚化但可辨”的度,对AI来说极其难以拿捏。
虚化太多,变成近景。虚化太少,变成全景。
AI的深度估计能力还不够稳定,它常常在“虚多少”这个简单问题上翻车。
第三个心病:构图惯性。
AI的训练数据里,中景的图片样本远远少于全景和特写。
为什么?因为人类拍照片,要么退远拍个全景纪念照,要么凑近拍个特写大头照。规规矩矩站在两米外拍一张腰部以上的中景,在日常生活中反而少见。
数据不够,AI就没学会中景应该长什么样。它只能往它熟悉的全景或特写方向去猜。
---
03 三招逼出AI的完美中景
既然AI想逃,我们就得用提示词把它锁死在中景上。
以下三个方法,实测有效。
---
第一招:用“腰部以上”替代“中景”
“中景”这个词,AI见过,但它对“中景”的理解边界非常模糊。
但“腰部以上”是物理描述,AI的视觉理解对这个更敏感。
· 翻车写法:中景镜头,一个男人在办公室
· 正确写法:腰部以上取景,一个穿白衬衫的男人坐在办公桌前,人物从腰部到头顶完整出现在画面中
· 为什么有效:你把取景范围变成了一个空间指令,而不是一个术语标签
一个通用的中景公式:
腰部以上取景,[人物描述],人物从腰部到头顶完整入画,[环境描述但标注背景虚化],浅景深。
---
第二招:给手安排一个“合法动作”
既然中景必拍手,那就不要让手闲在那里。
AI画不好手,主要是因为手在无所事事的时候,AI不知道手指该怎么摆。但如果你给手一个明确的动作,AI有了方向,出错率反而会下降。
· 手不知道该干嘛时:手指可能六根、交叉变形
· 手有明确任务时:拿着咖啡杯、握着笔、翻文件、推眼镜——这些动作AI训练数据里多,手型反而稳定
一个把“手的缺陷”变成“叙事优势”的提示词模板:
腰部以上取景,男人右手握着白色咖啡杯把手,左手食指轻敲桌面,手部动作自然清晰,办公室背景虚化。
你看,手不再是一个“可能会出bug的器官”,而是变成了一个“讲故事的细节”。
---
第三招:写清楚“背景虚化到什么程度”
不要只写“背景虚化”。AI对“虚化”的理解是薛定谔的——打开之前你不知道它是虚了一点点还是虚成了一团色块。
把虚化程度写具体。
· 翻车写法:背景虚化
· 正确写法:背景轻度虚化,办公室的落地窗和百叶帘依然可辨但细节模糊,人物与背景有明显分离感
· 或者:背景虚化程度中等,观众能看出这是一间办公室但不被细节分散注意力
三个虚化等级,你可以直接复制使用:
· 轻度虚化:背景元素轮廓清晰但细节柔化,环境可辨识
· 中度虚化:背景元素可辨认但无法看清细节,人物与背景明显分离
· 重度虚化:背景化为光斑和色块,完全不可辨识
中景一般用“轻度”或“中度”,保留环境的存在感。
---
04 一条提示词,三重锁定
把上面三招合并在一起,就是一条“AI无法逃离的中景提示词”。
锁定前(AI大概率拍成全景):
中景,一个男人在办公室看电脑。
锁定后(AI乖乖给出中景):
腰部以上取景,一个穿白衬衫的年轻男人坐在办公桌前,右手握着鼠标,左手轻放在键盘上,眼睛专注地看着电脑屏幕,背景轻度虚化,办公室的落地窗和绿植依然可辨,自然光从侧方照入,人物从腰部到头顶完整入画,浅景深,电影感。
这条提示词里塞进了三重锁定:
· 取景锁定:“腰部以上取景”“从腰部到头顶完整入画”
· 动作锁定:“右手握着鼠标,左手轻放在键盘上”——手有明确任务
· 虚化锁定:“背景轻度虚化,落地窗和绿植依然可辨”——不给AI乱虚的机会
三重锁一上,AI逃不掉了。
---
05 一个测试:这些提示词,哪个能逼出中景?
下面四条提示词,只有一条能稳定生成标准中景。其他三条要么变全景,要么变近景。你来判断一下。
提示词A:
中景镜头,一个女人在厨房做饭。
提示词B:
腰部以上取景,一个女人在厨房切菜,双手动作清晰可见,背景轻度虚化,厨房环境可辨。
提示词C:
特写中景,一个女人在厨房,电影感。
提示词D:
全景,一个女人在厨房做饭,腰部以上。
---
答案在文末。先别翻。
---
06 本周实战作业
这次的作业是“锁定练习”。
请用下面这个场景,写一条AI无法逃离的中景提示词。
场景:深夜便利店,一个穿校服的女生站在杂志架前,手里翻着一本杂志。
要求:必须用上今天讲的“三重锁定”——取景锁定、动作锁定、虚化锁定。
直接在评论区写下你的提示词。我下周挑几个典型做点评。
---
上期测试题答案:
B是唯一能稳定生成标准中景的。A只有“中景镜头”一个模糊指令,AI大概率退成全景。C写“特写中景”,这是一个自相矛盾的术语,AI会不知所措,大概率给出近景。D先写“全景”再写“腰部以上”,AI会听第一个词的,给你全景。
---
夜雨聆风