你敢相信这是AI生成的吗?🫣
不是那种假笑的、眼睛不动的、表情像打了肉毒杆菌的AI视频。
是真正的电影级微表情——眉头微蹙、下眼睑蓄泪、嘴唇颤抖、泪珠滚落。全程没有嚎啕大哭,没有歇斯底里,就是那种死死忍着、最后无声崩溃的表演。
我拿给朋友看,他第一反应是:"这哪个演员?演技真好。"
AI短剧最大的硬伤,不是画质,是表情
玩过AI视频生成的人都知道:
画面已经够用了,质感也上去了,运镜也很到位了。
唯独有个东西,90%的AI视频都翻车——人物表情。
不是模型不行,是你的提示词太粗糙。
大多数人写AI短剧提示词,写到"一个女人在哭"就完事了。这种描述,模型只能给你一个"哭"的通用模板——皱眉、流泪、张嘴,跟小学生画的哭脸差不多。
真正的微表情控制,需要你把情绪拆成时间轴,每一秒告诉AI演员该怎么演。
下面三组提示词,是我反复测试打磨出来的,直接复制就能用,不谢。
人物形象卡:

第一组:戏曲女演员·无声哭泣
这组的场景是一位身着传统戏服的年轻戏曲女演员,在镜头前无声崩溃。
核心难度在于"克制"——不是大哭,是忍着不哭,最后实在忍不住了。
提示词全文(直接复制):
核心画面:电影级近景胸像,一位身着精致传统戏服与头饰的年轻中国戏曲女演员。镜头极其稳定,带有微弱的电影感呼吸感。浅景深,背景幽暗,柔和逆光精准捕捉面部泪水的晶莹高光。展现出极致的皮肤纹理质感、戏服布料纹理,以及大师级的无声哭泣、隐忍克制、情感力竭的细腻表演。
0-4秒:人物微微抬脸,眼神看向斜上方镜头外,眼神空洞而受伤。内眉微蹙轻微上提,下眼睑泛红并蓄满泪水。嘴唇微张并伴随极轻微的颤抖,伴随轻微的呼吸起伏,呈现出刚刚哽咽但死死强忍的克制状态。
4-8秒:眼神开始缓慢向下坠落、失焦。打湿的睫毛变沉,鼻尖和脸颊因哭泣呈现自然微红。泪痕在脸颊上闪烁微光,嘴角轻轻下压,唇部肌肉放松,表情从委屈转为彻底的失望与无力。
8-12秒:脖颈与肩膀逐渐松劲,人物极其缓慢地垂下头。眉头从紧绷转力疲惫,双眼不再看镜头,闭合嘴唇将哭声咽回。伴随最后一次轻微呼吸,一滴眼泪从蓄满泪水的下眼睑中滚落,情绪进入坠落后的空白感与认命的寂静崩溃。大师级面部微表情,极慢速动作,情绪无缝递进。库克镜头柔光风格,电影级光影质感。无嚎啕大哭,无夸张抽泣,纯粹的无声哭泣 (silent crying)、压抑抽噎 (restrained sobbing)、情感力竭(emotionally exhausted)。
避免的画面(Negative Prompt):避免夸张大哭,歇斯底里,大喊大叫,张大嘴巴,面部表情扭曲变形,头部快速晃动。
第二组:古装室内·一镜到底哭戏独白
这组是做AI短剧最实用的一组提示词。人物有台词,情绪从压抑到崩溃再到沉默,15秒走完一整条情绪弧线。写这组提示词的核心不是光写表情,而是要同时控制镜头语言、场景约束、表演节奏,三线并行。
提示词全文(直接复制):
本片为室内写实主义哭戏独白片段,采用固定中近景偏特写、一镜到底拍摄,机位设于人物正前方略偏左,全程不切换镜头、不做大幅度推拉旋转,仅保留轻微手持呼吸感,画面走电影级写实风格,不使用美颜、卡通画风,全程单人出镜,严禁任何人影、肢体、倒影入画,无对手戏、无群像,场景保持古代室内环境不变。人物居于画面中间偏右,全程坐姿不变,整体姿态微微前倾、双肩收紧,神态隐忍委屈。表演节奏由压抑逐步递进至情绪崩溃,最终归于失望沉默,全程拒绝夸张哭喊、大吼大叫、大幅肢体动作与五官扭曲,表情、动作、台词均追求生活化真实感,人物每3秒自然眨眼,还原真人神态。
0秒-2秒室内自然光,人物低头垂目、不看镜头,嘴角下撇、眉头轻皱,眼眶泛红强忍泪水,呼吸压抑、喉头微哽。低声隐忍开口:"你让我自己一个人……"语速放缓,似憋闷许久,嘴唇轻颤、声线发虚,满是委屈。
2秒-4秒头部微微抬起,视线依旧向下,眉心愈发紧锁,双眼湿润、鼻翼轻抽,嘴角压得更低,身体继续前倾。接续台词:"叫天天不应,叫地地不灵。"声线持续发颤,前半句饱含委屈,后半句语调低沉绝望,尾音带哭腔,面部肌肉紧绷,克制住痛哭的情绪。
4秒-6秒情绪短暂卡顿,低头吸气,嘴唇抿动,泪意更浓。再度抬头、身体向前微压,迎来首轮情绪起伏,出声问道:"你让我怎么办?"音量小幅提升,以哭腔发问,无怒吼姿态,仅靠前倾体态、蹙眉、唇颤传递崩溃感。
6秒-8秒情绪持续攀升,眼眶通红,眼神游离不定,双肩紧绷,委屈转为无助。念道:"我一个人怎么办?"加重"我一个人"语气,满是无助与苦楚,声线哽咽带哭腔,说完后停顿半秒,凸显濒临失控的状态。
8秒-11秒情绪抵达顶峰,身体小幅前探,面部紧绷、眉心紧锁、嘴唇明显颤抖。带着哭腔轻声质问:"你告诉我,我能怎么办?"为本段最高情绪点,前半句带着控诉,后半句满是绝望,音量适度提高但不歇斯底里,尾音拉长带颤音。视线短暂望向前方,随即缓缓移开,流露失望。
11秒-13秒台词结束,保持前倾姿势,呼吸粗重,眼神空洞,嘴唇开合间尽显崩溃后的疲惫。情绪慢慢收敛,缓缓转头望向画面右侧,动作舒缓自然,传递出不愿再多言语的心境,眉头与嘴角依旧维持低落神态。
13秒-15秒侧脸定格,身体静立片刻,抬手轻拭眼泪,全程无多余动作。
第三组:纯面部特写·极致微表情控制
这组是地狱难度。
没有场景描写,没有台词辅助,没有肢体动作——15秒全怼在脸上,纯靠面部肌肉的微米级变化撑起整场戏。
每一个时间段精确到小数点后两位,控制的是眼裂、眉峰、下颌、嘴角走向这些演员自己都未必意识到的细节。
这组提示词适合拿来做AI视频生成的演员表情压力测试——如果模型能把这组跑好,基本什么AI短剧表演都能驾驭。
提示词全文(直接复制):
0.00-1.80s:开篇已是强忍悲痛状态,眼裂正常不瞪眼,下眼睑微绷,眼眶泛水光;眉头向眉心聚拢形成竖纹,眉峰内侧轻抬;嘴唇微张,嘴角下撇、下唇轻颤,下颌发力,头部与视线稳定不动。
1.80-3.20s:悲痛加剧,嘴部、下颌持续抽动;双眼微收,单侧眼睑间歇性收紧,下眼睑持续用力,眉心褶皱加深;嘴角下拉后微向后扯,上唇小幅抬起,牙齿短暂微露;仅因呼吸不稳出现无规律小幅张嘴,无发声口型,下巴、唇角、下唇细碎抽动。
3.20-5.40s:双唇缓缓闭合,用力压制哭意;嘴唇越抿越紧,嘴角大幅下沉,下唇内收,下巴持续微颤、下颌锁死;双眼维持常态或微眯,泪光更明显,眉心紧锁;视线微微下沉,肩颈逐步收紧。
5.40-6.70s:先后闭合双眼,低头抬臂遮眼;单侧眼睑先垂落,双眼完全闭上,头部平缓低俯,嘴唇依旧紧抿;肩颈向内收拢,单侧前臂自画面下方抬起,横挡眼部与部分额头,为本能遮泪动作,无挥手动作。
6.70-8.60s:前臂轻拭双眼并持续遮挡;低头贴近手臂,单次小幅克制擦泪,手臂不立刻放下;头部保持低垂,双肩微收,身体仅随呼吸微弱起伏、细微震颤,杜绝剧烈抽泣、反复擦眼。
8.60-9.50s:缓慢放臂,先垂首再缓抬眼;前臂平稳离开面部,头部先低垂、双目朝下,眼眶湿润,唇紧抿、下颌再度绷紧;完成一次轻短吸气或吞咽,小幅抬眼后再缓慢抬头,情绪无法立刻平复。
9.50-10.30s:头部回正,重新收敛情绪;视线偏移镜头轴线,眼裂正常不瞪眼,下眼睑紧绷、眼底含泪,眉心未舒展;双唇持续抿紧,面部维持压抑状态。
10.30-12.20s:无声抽气,痛苦感加重;紧抿的嘴唇短暂松开,仅因压抑抽气小幅张开,无发声口型;双眼微收,单侧眼睑收紧,眉头向内下压;上唇轻抬、嘴角后扯,下颌面颊发力,牙齿短暂露出,流露无声痛苦与不甘。
12.20-13.20s:嘴部、下颌紧绷至顶点;嘴唇随不稳呼吸短暂小幅分开,全程无声无音节,嘴角向后下方拉紧,下巴轻颤,眉心褶皱最深,双眼微收后嘴唇缓缓闭合。
13.20-14.20s:重抿双唇,封闭情绪;嘴唇用力紧闭下撇,下颌锁紧;双眼微眯,目光沉滞,眉心纹路清晰,不再擦拭眼泪,全程含泪紧绷克制。
14.20-15.00s:视线下移,头轻转向画面右下方;视线缓慢下沉,头部低俯小幅右转,定格望向画面右下。
微表情提示词的核心逻辑:4个字
看完这三组,你可能已经发现了——
写微表情提示词,不是堆形容词,是导演一场表演。
核心就四个字:情绪递进。
具体怎么操作?三步:
第一步:切时间轴。
把15秒的视频切成4-6段,每段2-4秒。每一段写一个情绪状态,不要写"一个人很伤心",要写"眼神失焦、嘴角下压、鼻翼微红"——身体部位+具体动作。第三组精确到了0.01秒级别,这就是微表情和普通提示词的本质区别。
第二步:设计递进,不要平铺。
第一组是"忍→失望→无声崩溃",第二组是"压抑→质问→崩溃后沉默",第三组是"强忍→遮泪→收敛→定格"。情绪必须往前走,不能原地踏步。
第三步:加Negative Prompt兜底。
告诉AI"不要做什么"比"要做什么"还重要。第二组写了"严禁任何人影入画""拒绝夸张哭喊",第三组写了"杜绝剧烈抽泣""无发声口型"——越精确的"不要",出片质量越高。
你可以拿去干什么?
情感赛道短视频:配上一段走心台词,做"成年人崩溃的瞬间"系列,完播率拉满。
AI短剧/微电影:第二组直接就是一个完整的AI短剧独白片段,加个配音就能出片,省掉演员和拍摄团队。
个人IP打造:拍一段虚拟形象的微表情特写做视频封面,辨识度秒杀一众AI木头脸。
AI能力评测:拿第三组当试金石,测测各家模型的表演控制力——目前能跑好这组的模型不超过3个。
最后说一句大实话
AI视频生成这个赛道,画面质量大家都会卷到头。AI短剧也一样,拼到最后不是谁的画面好看,而是谁的角色能"演"到人心里去。
真正的差异化,是谁能让AI生成的角色"演"得更像人。
往期文章:
夜雨聆风