你理解的 AI 摄影,可能全是错的

你理解的 AI 摄影，可能全是错的

上周有个做电商的朋友找我，说他花 199 买了个「AI 摄影神器」，把产品图丢进去，出来的图他还是拿去请摄影师重拍了。

我问他怎么用的，他说：「不就是上传照片，选个风格，点生成吗？」

你看，这就是问题。他不是被工具坑了，他是被「AI 摄影」这四个字骗了。

网上铺天盖地的 AI 摄影教程，标题一个比一个吓人——「一键出大片」「零基础秒变摄影师」「AI 写真吊打影楼」。点进去全是结果展示图，漂亮是真漂亮，但你翻遍全文找不到一句告诉你这东西到底怎么跑通的。

我花了快一个月把这件事彻底搞明白之后，发现市面上的内容有一个通病：它们把 AI 摄影当成一个「功能」在讲。但它是个「系统」。

今天这篇文章，把这个系统拆清楚。

你以为的 AI 摄影 vs 实际上的 AI 摄影

你先看一张图。最近朋友圈刷到的那种 AI 美女写真，光影高级、皮肤质感真实、衣服褶皱自然——你第一反应肯定是：「这 AI 怎么做到的？」

然后你去搜教程，下了一堆模型，打开 ComfyUI 发现几百个节点，直接关掉了。

为什么？因为你缺的不是某个功能，你缺的是一张地图。

AI 摄影不是按一个按钮，它是一套管线。这套管线分三层，每一层处理不同的问题：

第一层：AI 图生图。 你拍一张产品照片，AI 帮你换背景、换光影、换氛围。输入是你拍的真实照片，输出是带 AI 合成的商业图。这一层门槛最低，适合电商、产品拍摄，出图快，成本也最低。

我给你举个例子。一个淘宝卖家居的朋友，以前每款产品请摄影师拍 3 个场景，一款 1500。现在他用 SD，自己拍一张白底产品图，AI 生成客厅、卧室、阳台三个场景，15 分钟搞定。这一层解决的问题是「替换」，不是「创造」。

第二层：AI 写真生成。 这才是大多数人看到的东西。用 ControlNet 控制人物姿态，用 IP-Adapter 保持面部一致性，再套个风格 LoRA 出图。你给 3 到 5 张自己的照片，AI 能生成你在巴黎街头的街拍、在日系影棚的写真、在老上海弄堂的复古照。

这一层的核心难点不是「能不能生成」，而是「生成的还像不像你」。很多新手在这里翻了——出来的图光影漂亮，脸完全不是同一个人。后面我会专门讲怎么修这个问题，但你先记住：第二层解决的是「一致性」，不是「多样性」。

第三层：LoRA 训练 + 无限变装。 用自己的 15 到 25 张照片训练一个人脸 LoRA 模型，然后它可以套任何风格的工作流。训练一次，终身复用。

分水岭就在这。到这一层，你已经不是在用 AI 修图了，你是在造自己的数字分身。不管换什么服装、什么光影、什么场景，脸都是你自己的。

这三层的关系不是「哪个更好」，而是你在不同阶段该用哪个。但我见太多人上来就想搞第三层，结果 LoRA 练了三天跑出来一张鬼图，发到群里被笑，然后放弃。正确的路径是从第一层开始，跑通一条管线，看到成果，再往上走。

你现在该从哪一层开始？

我说直接一点，帮你对号入座：

如果你做电商、产品拍摄 → 从第一层开始。图生图换背景这件事，现在成熟度已经非常高了。SDXL 加上一个好用的底模，电商场景的出图质量和摄影师拍的区别，普通消费者根本看不出来。回本周期按天算。

如果你想拍个人写真、团队形象照 → 第二层。ControlNet + IP-Adapter 的管线现在足够稳定了，参数调对了出片率 80% 以上。影楼一套写真 1500 起，你电费花不到 10 块钱。当然我需要提前说清楚——目前第二层对侧脸、大角度、复杂手势的支持还不够完美，但这些场景在写真里占比本来就低，你换几个姿势重拍就行。

如果你是一个创作者，需要频繁换风格出片 → 第三层。LoRA 训练一次，后面换任何风格都只花电费和出图时间。这件事的门槛比你想象的低——在线工具上传照片等 15 分钟就能训练好，不需要你会敲代码。

如果你只想发朋友圈玩玩 → 不需要搞这些。手机上的 AI 滤镜 App 够用了，美图秀秀的 AI 写真功能 9 块 9 出 4 张图，比你自己折腾半天还好看。别为了用 AI 而用 AI，工具是拿来解决问题的，不是拿来装逼的。

我在第一层踩的三个坑

既然建议你们从第一层开始，我把自己的翻车经历摊开说，帮你省点时间。

第一个坑：以为 SD 1.5 够用了。 我一开始舍不得下 SDXL，觉得模型太大、跑得慢。结果 1.5 出的人像皮肤像塑料，背景模糊成一团，手指永远是 6 根。换了 SDXL 之后我才意识到，1.5 和 XL 之间的差距不是「好一点」，是「能用和不能用」的区别。别省这个硬盘空间。

第二个坑：提示词写得太抽象。 我最早写 prompt 就是「a beautiful girl in a nice room with good lighting」。AI 根本不知道什么叫 beautiful，什么叫 nice，什么叫 good。你得写具体：「soft window light from left」「35mm lens f/2.8」「cream-colored linen sofa」「morning sunlight through sheer curtains」。AI 是字面意义的执行者，不是艺术家。

第三个坑：妄想一键出片。 AI 图生图出来的图，不管多好，都只是「素材」。你真的要商用，至少还需要裁切、调色、锐化三步。不要指望 AI 替你完成 100% 的工作，它完成 80%，你精修 20%，这才是正确的协作方式。接受这个现实，心态会好很多。

接下来你会学到什么

这篇是这个系列的第一篇，我把它定位成「地图」。搞清楚你站在哪里、要去哪里，后面的每一篇就是具体路线了。

下一篇直接聊工具选型。不是甩一个 100G 的下载链接给你，而是告诉你在海量模型里，真正只要装哪几个。我自己从 200G 硬盘塞满精简到 6 个核心模型，出图质量反而上去了——为什么？下一篇说清楚。

后面还有四期：ComfyUI 工作流手把手搭、LoRA 人脸训练参数全拆、AI 修图一句话替 PS、最后一期把成本从头算到尾。

这个系列的规矩很简单：每篇至少给 3 个你直接复制就能用的东西。一个提示词模板，一组参数配置，一条修图指令——反正不是空话。

你现在属于哪一层？做电商、拍写真、还是想训练自己的数字分身？或者你试过但卡住了？评论区告诉我，我会在后面的文章里有针对性地回应。

下一篇见。