你理解的 AI 摄影,可能全是错的
上周有个做电商的朋友找我,说他花 199 买了个「AI 摄影神器」,把产品图丢进去,出来的图他还是拿去请摄影师重拍了。
我问他怎么用的,他说:「不就是上传照片,选个风格,点生成吗?」
你看,这就是问题。他不是被工具坑了,他是被「AI 摄影」这四个字骗了。
网上铺天盖地的 AI 摄影教程,标题一个比一个吓人——「一键出大片」「零基础秒变摄影师」「AI 写真吊打影楼」。点进去全是结果展示图,漂亮是真漂亮,但你翻遍全文找不到一句告诉你这东西到底怎么跑通的。
我花了快一个月把这件事彻底搞明白之后,发现市面上的内容有一个通病:它们把 AI 摄影当成一个「功能」在讲。但它是个「系统」。
今天这篇文章,把这个系统拆清楚。
你以为的 AI 摄影 vs 实际上的 AI 摄影
你先看一张图。最近朋友圈刷到的那种 AI 美女写真,光影高级、皮肤质感真实、衣服褶皱自然——你第一反应肯定是:「这 AI 怎么做到的?」
然后你去搜教程,下了一堆模型,打开 ComfyUI 发现几百个节点,直接关掉了。
为什么?因为你缺的不是某个功能,你缺的是一张地图。
AI 摄影不是按一个按钮,它是一套管线。这套管线分三层,每一层处理不同的问题:
第一层:AI 图生图。 你拍一张产品照片,AI 帮你换背景、换光影、换氛围。输入是你拍的真实照片,输出是带 AI 合成的商业图。这一层门槛最低,适合电商、产品拍摄,出图快,成本也最低。
我给你举个例子。一个淘宝卖家居的朋友,以前每款产品请摄影师拍 3 个场景,一款 1500。现在他用 SD,自己拍一张白底产品图,AI 生成客厅、卧室、阳台三个场景,15 分钟搞定。这一层解决的问题是「替换」,不是「创造」。
第二层:AI 写真生成。 这才是大多数人看到的东西。用 ControlNet 控制人物姿态,用 IP-Adapter 保持面部一致性,再套个风格 LoRA 出图。你给 3 到 5 张自己的照片,AI 能生成你在巴黎街头的街拍、在日系影棚的写真、在老上海弄堂的复古照。
这一层的核心难点不是「能不能生成」,而是「生成的还像不像你」。很多新手在这里翻了——出来的图光影漂亮,脸完全不是同一个人。后面我会专门讲怎么修这个问题,但你先记住:第二层解决的是「一致性」,不是「多样性」。
第三层:LoRA 训练 + 无限变装。 用自己的 15 到 25 张照片训练一个人脸 LoRA 模型,然后它可以套任何风格的工作流。训练一次,终身复用。
分水岭就在这。到这一层,你已经不是在用 AI 修图了,你是在造自己的数字分身。不管换什么服装、什么光影、什么场景,脸都是你自己的。
这三层的关系不是「哪个更好」,而是你在不同阶段该用哪个。但我见太多人上来就想搞第三层,结果 LoRA 练了三天跑出来一张鬼图,发到群里被笑,然后放弃。正确的路径是从第一层开始,跑通一条管线,看到成果,再往上走。
你现在该从哪一层开始?
我说直接一点,帮你对号入座:
如果你做电商、产品拍摄 → 从第一层开始。图生图换背景这件事,现在成熟度已经非常高了。SDXL 加上一个好用的底模,电商场景的出图质量和摄影师拍的区别,普通消费者根本看不出来。回本周期按天算。
如果你想拍个人写真、团队形象照 → 第二层。ControlNet + IP-Adapter 的管线现在足够稳定了,参数调对了出片率 80% 以上。影楼一套写真 1500 起,你电费花不到 10 块钱。当然我需要提前说清楚——目前第二层对侧脸、大角度、复杂手势的支持还不够完美,但这些场景在写真里占比本来就低,你换几个姿势重拍就行。
如果你是一个创作者,需要频繁换风格出片 → 第三层。LoRA 训练一次,后面换任何风格都只花电费和出图时间。这件事的门槛比你想象的低——在线工具上传照片等 15 分钟就能训练好,不需要你会敲代码。
如果你只想发朋友圈玩玩 → 不需要搞这些。手机上的 AI 滤镜 App 够用了,美图秀秀的 AI 写真功能 9 块 9 出 4 张图,比你自己折腾半天还好看。别为了用 AI 而用 AI,工具是拿来解决问题的,不是拿来装逼的。
我在第一层踩的三个坑
既然建议你们从第一层开始,我把自己的翻车经历摊开说,帮你省点时间。
第一个坑:以为 SD 1.5 够用了。 我一开始舍不得下 SDXL,觉得模型太大、跑得慢。结果 1.5 出的人像皮肤像塑料,背景模糊成一团,手指永远是 6 根。换了 SDXL 之后我才意识到,1.5 和 XL 之间的差距不是「好一点」,是「能用和不能用」的区别。别省这个硬盘空间。
第二个坑:提示词写得太抽象。 我最早写 prompt 就是「a beautiful girl in a nice room with good lighting」。AI 根本不知道什么叫 beautiful,什么叫 nice,什么叫 good。你得写具体:「soft window light from left」「35mm lens f/2.8」「cream-colored linen sofa」「morning sunlight through sheer curtains」。AI 是字面意义的执行者,不是艺术家。
第三个坑:妄想一键出片。 AI 图生图出来的图,不管多好,都只是「素材」。你真的要商用,至少还需要裁切、调色、锐化三步。不要指望 AI 替你完成 100% 的工作,它完成 80%,你精修 20%,这才是正确的协作方式。接受这个现实,心态会好很多。
接下来你会学到什么
这篇是这个系列的第一篇,我把它定位成「地图」。搞清楚你站在哪里、要去哪里,后面的每一篇就是具体路线了。
下一篇直接聊工具选型。不是甩一个 100G 的下载链接给你,而是告诉你在海量模型里,真正只要装哪几个。我自己从 200G 硬盘塞满精简到 6 个核心模型,出图质量反而上去了——为什么?下一篇说清楚。
后面还有四期:ComfyUI 工作流手把手搭、LoRA 人脸训练参数全拆、AI 修图一句话替 PS、最后一期把成本从头算到尾。
这个系列的规矩很简单:每篇至少给 3 个你直接复制就能用的东西。一个提示词模板,一组参数配置,一条修图指令——反正不是空话。
你现在属于哪一层?做电商、拍写真、还是想训练自己的数字分身?或者你试过但卡住了?评论区告诉我,我会在后面的文章里有针对性地回应。
下一篇见。
夜雨聆风