
大家好,我是呆哥,一个酷爱AI创作的探索者,每天分享AI实操和工具,记录自己的成长。关注公众号,一起学习,一起进步!
哈喽大家好!我是呆哥。

经常有小伙伴私信问我,看到一张特别好看的AI图片,想知道它的提示词是怎么写的,但不知道怎么反推。今天呆哥就把目前最实用的方法整理出来了,免费工具和付费方案都有,总有一个适合你。
建议收藏,用的时候随时翻出来看。
为什么要反推提示词
先说一下这个需求的场景。
你在小红书、B站或者别的地方看到一张特别好看的AI图片,可能是某种特定的风格、构图或者光影效果。你想复刻这种效果,但不知道怎么描述。
这时候,反推提示词就派上用场了。
但呆哥要先泼一盆冷水:反推出来的提示词,只能作为参考,不可能100%复刻原图。因为同样的提示词,不同模型、不同参数、不同随机种子,出来的效果都不一样。
所以,反推的目的是学习别人的描述方式,而不是复制别人的作品。
方法一:直接用AI的识图功能(最简单,强烈推荐)
这个方法最简单,新手也能秒上手。
现在主流的大模型基本都支持识图功能,比如 DeepSeek、豆包、Kimi、Gemini 等等。直接把图片丢给它们,让它们分析图片内容并生成提示词。
操作步骤
第一步:打开你常用的AI工具(这里以 DeepSeek 为例)。
第二步:选择识图模式,上传图片,输入通用提示词:
请分析这张图片的风格、构图、光影、色彩、主体等元素,并生成一段详细的即梦AI提示词,让我能复刻出类似的效果。

第三步:AI会给出分析结果和提示词。
实测对比
呆哥用同一张图片测试了几个主流工具:
DeepSeek:
优点:分析很详细,会从风格、构图、光影、色彩等多个维度拆解 缺点:有时候会过度推理,加入一些图片里其实没有的细节
豆包:
优点:生成的提示词比较接地气,适合国内模型 缺点:分析维度不够全面
Gemini:
优点:多模态能力强,分析准确 缺点:需要翻墙,对国内用户不够友好
Kimi:
优点:中文理解能力强 缺点:识图功能有时候不太稳定
呆哥的建议
有条件优选 Gemini,选平替首选 DeepSeek。日常随手用可以用豆包。
方法二:专业的提示词反推工具
如果你需要更专业的反推效果,可以用一些专门的工具。
1. CLIP Interrogator(免费,本地运行)
这是一个开源项目,基于 CLIP 模型来分析图片并生成提示词。

优点:
完全免费 本地运行,隐私性好 反推效果比较专业
缺点:
需要一定的技术门槛,要安装 Python 环境 对电脑配置有一定要求
使用方法:
第一步:安装依赖
pip install clip-interrogator
第二步:运行代码
from clip_interrogator import Config, Interrogator
from PIL import Image
image = Image.open('your_image.jpg')
ci = Interrogator(Config(clip_model_name="ViT-L-14/openai"))
print(ci.interrogate(image))
2. Img2Prompt(在线工具)
如果你不想折腾代码,可以用在线版本。
推荐工具:
Replicate 上的 img2prompt Hugging Face 上的类似工具 
优点:
无需安装,打开即用 效果还不错
缺点:
需要翻墙 免费额度有限
3. Midjourney 的 /describe 命令
如果你本身就是 Midjourney 用户,那最简单的方法就是用它的 /describe 命令。
使用方法:
第一步:在 Discord 中输入/describe
第二步:上传图片
第三步:Midjourney 会生成 4 组提示词供你参考
优点:
生成的提示词直接适配 Midjourney 操作简单
缺点:
需要 Midjourney 会员 生成的提示词有时候过于模板化
方法三:拆解法(进阶技巧)
如果你不想依赖工具,也可以手动拆解图片的元素。
呆哥总结了一个拆解框架,按照这几个维度去分析,基本能还原出大部分提示词:
1. 主体(Subject)
图片的核心内容是什么?
人物:性别、年龄、服装、表情、姿势 场景:室内/室外、建筑、自然景观 物品:道具、装饰、文字
2. 风格(Style)
图片的艺术风格是什么?
写实/卡通/油画/水彩/赛博朋克/国风等等 参考艺术家(如果有的话)
3. 构图(Composition)
视角:俯视/仰视/平视 镜头:特写/中景/远景/广角 主体位置:居中/三分法/对角线
4. 光影(Lighting)
光源方向:顺光/逆光/侧光 光线类型:自然光/人造光/柔光/硬光 氛围:明亮/昏暗/神秘/温暖
5. 色彩(Color)
色调:暖色/冷色/黑白/复古 饱和度:高饱和/低饱和/莫兰迪色系
6. 质量词(Quality)
画质:8K、highly detailed、masterpiece 渲染器:Octane render、Unreal Engine
实战案例
光说理论不够,呆哥用一个实际案例来演示。
假设我们要反推这张图片

用 DeepSeek 反推
上传图片后,DeepSeek 给出的分析:
1. 主体 (Subject)
人物:一位年轻女性,背对镜头,正向远处走去。
穿搭:她头戴米色草编遮阳帽,身穿浅薄荷绿色(或浅水蓝色)的露肩长裙,裙摆随风/动作扬起,脚踩深色短靴。
姿态:一只手提着裙摆,步伐轻快,带有轻盈的动感和飘逸感。
2. 色彩与氛围 (Color & Atmosphere)
主色调:画面呈现出极其和谐的互补色。左侧的紫色(薰衣草)与右侧的亮黄色(向日葵)形成视觉冲击,并辅以大面积的蓝绿色(裙子)和土黄色(路面)作为过渡。
氛围:明亮、治愈、浪漫、清新、复古电影感。天空是干净的浅蓝色。
3. 构图与光影 (Composition & Lighting)
构图:引导线构图 + 中心对称。中间的小路完美地将画面一分为二,引导视线聚焦在画面的视觉中心(人物)。天空约占据画面上方的1/3。
光影:柔和的漫反射光。由于是逆光或侧逆光,人物、植物的边缘有微弱的轮廓光,整体光线均匀不刺眼,带有一种“午后慵懒”的滤镜感。
4. 镜头特征 (Lens Features)
具备一定的景深效果(背景略微虚化,但依然保留了花朵的色块),类似于全画幅相机搭配50mm或85mm人像镜头拍摄的效果。
生成的提示词:
一张高质量的杂志摄影照片,一位年轻女性背对镜头,正在田野间的土路上轻快地向前走去,她一手提着裙摆,裙摆随风飘扬。她头戴草编遮阳帽,身穿浅薄荷绿色的露肩飘逸长款连衣裙,脚穿深棕色短靴,有着金色的长发。画面左侧是一片排列整齐的紫色薰衣草花田,右侧是一片盛开的亮黄色向日葵花田。天空蔚蓝,点缀着一朵白云。居中构图,利用泥土小路做引导线。自然明亮的柔和光线,梦幻、浪漫、治愈的法式田园风格,全高清,8k分辨率,色彩鲜艳且和谐,景深效果(轻微背景虚化),背景有层次感,令人愉悦的阳光和夏日氛围。
负向提示词(可选添加):
画面杂乱,模糊,阴暗,过曝,面部特征,正面拍摄,下雨,黑白,过度锐化。

用 CLIP Interrogator 反推
浪漫的田园风格,梦幻柔和的自然景观,带有电影感;中央的土路作为引导线,左侧是整齐排列的薰衣草田,右侧则是盛开的向日葵田,构图对称均衡,具有深邃的透视效果;柔和的金色黄昏光线,温暖而温和的照明效果,柔和的阴影,明亮但不显生硬;高饱和度的紫色薰衣草、鲜艳的黄色向日葵、身着淡蓝色连衣裙的女性主体、点缀着少量云朵的淡蓝色天空;背影中的女性形象,头戴草帽,淡蓝色长裙随风飘动,卷发飘逸,动态轻盈的步伐,传递出自由与浪漫的气息;宁静梦幻的氛围,繁茂的植被,干燥的小径,晴朗的天空,自然而生动的色彩,柔和的滤镜效果,带有电影感的氛围感。

可以看到,两种方法的结果大同小异,互有侧重而已。
常见问题
Q1:反推的提示词能100%复刻原图吗?
不能。同样的提示词,不同模型、不同参数、不同随机种子,出来的效果都不一样。反推的目的是学习描述方式,而不是复制作品。
Q2:为什么反推的提示词生成了完全不同的图?
可能的原因:
模型不同(Midjourney vs Stable Diffusion) 版本不同(MJ v5 vs v6) 参数不同(--ar、--stylize 等) 随机种子不同
Q3:免费工具和付费工具差别大吗?
对于一般需求,免费工具足够了。付费工具(如 Midjourney 的 /describe)的优势是生成的提示词更适配特定模型。
Q4:反推出来的提示词需要修改吗?
建议修改。看上面2张图的色差就知道AI也不是万能的。反推的提示词是机器生成的,有时候会有冗余或者不准确的地方。根据自己的需求调整,效果会更好。
各方案总结
写在最后
反推提示词是个实用技巧,但不要过度依赖。
真正重要的是理解提示词的结构和逻辑。当你能手动拆解一张图片的元素,再用自己的话描述出来,你就真正掌握了提示词的精髓。
工具是辅助,人是驾驭者。
反推工具能帮你入门,但想要做出真正独特的作品,还得靠自己的想法和创意。
最后再说一句,以上方法仅供个人学习和创作使用,尊重原创,不要直接复制别人的作品用于商业用途。
你还知道哪些反推提示词的"邪修"方法,欢迎评论区积极留言,大家一起涨知识!

点击查看更多精彩内容:
新手用豆包生成婚纱照全风格攻略,附精准生图提示词,直接复制出片(建议收藏)
非常实用!豆包图片视频无水印下载保存,全网最全方法汇总(建议收藏)
大家可能会觉得 AI 很难,所以一直在原地踏步不愿尝试。
关注公众号,直接发送:DS,免费领取价值1999元的Ai学习资料工具大礼包。

夜雨聆风