你有没有见过那种情况——
自己写了个AI指令,感觉老详细了,什么"一只猫在沙发上伸懒腰",嘎嘎全面。
然后AI给你整出来一个主体糊成马赛克、背景莫名其妙、动作僵硬得像机器人的玩意儿。
这种情况太常见了。
说白了就是:你以为你写清楚了,AI觉得你写了个寂寞。
问题不在AI,在你怎么描述。
你给AI的信息密度,决定了它输出的上限。"一只猫在沙发上伸懒腰"——这种模糊描述,你让AI怎么猜?
今天这套公式,帮你把描述从"说清楚"拉到"说精确"。看完你就知道差距在哪了。
先说整个框架,就三层:
基础版:主体 + 场景 + 运动
这是最粗暴的,能跑。像大片?想太多。
进阶版:主体细节 + 场景氛围 + 运动过程 + 光影镜头 + 风格化
正经玩法,每个维度都要往深挖。
高级版:总体描述 + 镜头序号 + 时间戳 + 分镜内容
像写真正的分镜头脚本,给AI规划一个完整故事。
三层逻辑就这些,不难,往下看每个怎么用。
主体:把"一只猫"写成通缉令
大部分人写主体就三个字:一只猫。
没了。
AI收到的信息:一个猫,你看着办。
然后它就真的"看着办"了,给你整出一个玄学现场。
进阶写法是这样:
一只毛色油亮、尾巴蓬松的橘猫,眼神慵懒
想象你在给它写通缉令——最显眼的特征是什么?颜色、眼神、姿态。把这些塞进去,它才能从"一只猫"变成"那只猫"。
细节从哪挖?
外貌:颜色/纹理/形状状态:表情/姿态/情绪特征:服装/配饰/标志性物品
把最显眼的特征塞进去就行了,没那么复杂。
场景:不是背景板,是情绪
同样是"在沙发上"——
普通版:在沙发上
进阶版:洒满午后阳光的旧式布艺沙发上,空气里漂浮着细小灰尘
闭上眼睛想这个场景:你能看到什么、听到什么、闻到什么?挑最戳你的写进去。
场景是情绪的载体,不是背景板。同样是竹林,清晨薄雾和傍晚夕阳,给人的感觉完全不一样。
细节挖这三个:光线(黄昏/逆光/霓虹灯)、环境(家具/植物/天气)、情绪词(温馨/阴森/喧嚣)。
你的场景描述,决定了AI给你的是"味道"还是"背景板"。
运动:慢镜头思维
"伸懒腰"。
三个字。
你让AI怎么动?它只能随机给你来一段,然后配上尴尬的笑容。
正确姿势:想象你在用慢镜头回放这个动作,把每一帧的变化说出来。
进阶版:
先缓缓弓起背部,然后用力舒展前爪,最后张大嘴打了个哈欠
细节挖这三个:动作分解(先…再…然后…)、速度幅度(缓慢地/猛地/轻盈地)、伴随动作(一边…一边…)。
不要只说"做了什么",要说"怎么做的"。
再慢一点。AI要的是过程,不是标签。
光影镜头:当导演不是下命令
到这个层级,你不是在给AI下指令,你是在当导演。
光影和镜头决定观众怎么看这个画面。
光影例子:
柔和的侧逆光勾勒出毛发的金色轮廓霓虹灯的冷色光打在潮湿的地面上
镜头例子:
特写镜头,浅景深,背景虚化慢速推轨,从远景缓缓推至眼睛低角度仰拍,突出压迫感
技巧就一个:想好让观众"看哪里"(特写)、"什么感觉"(光线)、"怎么移动"(运镜)。
这是导演语言。你学会用镜头说话,AI才能给你电影的质感。
风格化:一句话定调
不知道怎么形容风格?想"这像哪部电影/哪位画家的风格",直接写出来,AI秒懂。
皮克斯:色彩饱和,萌系可爱赛博朋克:霓虹紫蓝主色调,霓虹灯、潮湿街道水墨画:留白意境,淡雅悠远复古胶片:颗粒感明显,色调偏暖偏黄
风格是定调,不是装饰。定准了整个视频质感统一,定不准就是四不像。
说到底就这么回事——
你把AI当读心术大师,AI就给你读心术玄学。
描述越精确,生成越惊艳。
从今天起别写"一只猫"了,写:
一只毛色油亮、尾巴蓬松的橘猫,在洒满午后阳光的旧式布艺沙发上,缓缓弓起背部慵懒地伸了个懒腰,柔和的侧逆光勾勒出毛发的金色轮廓,皮克斯风格
试试看。
点赞和转发,是对我最好的支持 👇
夜雨聆风