AI生图的时候,脑子里到底在想啥?
安全帽=工地?八块腹肌=裸体?AI的联想能力比你初中班主任还离谱。
AI根本不知道图片长啥样
先说个扎心的事实:AI不是在”画画”,它是在做题。
训练的时候,AI看了几十亿张图+文字配对。看多了它就形成了条件反射——”橘猫”这个词出现的时候,旁边大概率有一坨橙色毛茸茸的像素。它不是理解了”猫”是什么,只是做题做多了,形成了肌肉记忆。跟你看到”已知”两个字就开始写”解”是一回事。
记住这句话:AI不理解语义,只理解统计关联。下面所有的坑,都是从这来的。
为什么安全帽=工地?腹肌=裸体?
你输入”一个戴安全帽的男人”,AI100%给你工地背景。脚手架、水泥搅拌机、钢筋——全套安排。你明明想要时尚弄潮儿,AI直接把你送去搬砖了。
“八块腹肌的帅哥”?裸着上身的猛男一个。不脱怎么展示腹肌?训练数据里全是这么拍的,AI也很委屈。
这就是“关键词联想陷阱”:你以为描述的是一个元素,AI理解的是整个场景。”宇航员”必在太空,”白大褂”必在医院,”安全帽”必在工地。AI就是个刻板印象制造机。
怎么破?用场景强压!给AI一个更具体的上下文,把它的默认联想覆盖掉。
翻车
“戴安全帽的男人” → 工地搬砖
正确
“戴安全帽的男人,坐在咖啡厅喝拿铁,时尚穿搭” → 弄潮儿
翻车
“八块腹肌的男生” → 裸男
正确
“身材健硕的男生,穿白色紧身T恤,隐约可见腹肌” → 穿衣有肉
“背对””看向””侧身”为什么全翻车?
你写”背对镜头”,AI给你正脸。你写”看向远方”,AI给你眼神涣散。你写”侧身站立”,AI给你一个像腰间盘突出的诡异扭姿。
原因是AI没有三维空间概念。”背对”是相对概念——背对谁?镜头在哪?AI的世界只有二维像素,它连”空间”都没有,怎么理解”转身”?
“看向远方”也一样,训练数据里这个标注太乱了——有的真在看远方,有的是侧脸,有的闭着眼。AI学了个寂寞。
药方:用英文摄影术语
“背对” → from behind
“看向远方” → looking at the horizon
“侧脸” → side profile
“低头” → looking down
AI的母语是英文摄影术语,你跟它说中文抽象描述,它听了个寂寞。
为什么人总是占满画面?画幅总是不对?
你想要”花海中的小人”远景照,结果出来一张大头贴,脸占80%,花海只露两朵。原因是训练数据里90%有人的照片都是”以人为主”的构图。AI学到的铁律:有人=人大大的。
画幅也一样,你不说要什么比例,AI就按默认来。就像去理发店不说话,Tony老师就按他的审美安排了。
镜头术语速查:
特写 close-up — 大脸怼镜头
半身 medium shot — 腰部以上
全身 full body shot — 整个人在画里
远景 wide shot — 人小小一个
超远景 extreme wide — 人变像素点
画幅速查:
1:1 头像/小红书
4:3 公众号配图
16:9 电影感/风景
9:16 手机壁纸/短视频
四条AI生图的潜规则
1. “不要”= “必须要”
写”不要红色”,AI偏给你红色——跟你说”别想大象”你满脑子大象是一个道理。想排除的东西,闭嘴别提。
2. 形容词堆砌不如一个精准描述
“美丽优雅迷人的女生”不如“穿红色晚礼服,柔和侧光”。具体大于抽象,永远。
3. 摄影术语 > 人话
“背景模糊”→ bokeh,”画面很亮”→ high key lighting。AI对摄影术语响应精确10倍。
4. 顺序=优先级
“猫坐在桌子上”猫大,”桌子上坐着猫”桌子大。最重要的写最前面,风格词放最后。
终极武器:一条提示词的正确打开方式
按这个顺序写,避开80%的坑:
[镜头] + [主体+穿着] + [动作] + [场景] + [光线] + [风格]
wide shot, a young man in white t-shirt, sitting at a wooden table, cozy cafe, golden hour, film photography style
每一个元素都在给AI具体信号,不让它有自由发挥(翻车)的空间。
AI不懂你的意思,但你懂AI的套路就行了。
别跟AI讲道理,跟它讲概率。 别跟AI说中文,跟它说摄影术语。
觉得有用?转发给还在跟AI生图较劲的朋友,救救孩子。
夜雨聆风