摘要:上传一张人脸图 → 粘贴一段英文提示词 → 选竖版 2K,等上半分钟左右,得到一张「电影感 3D Q 版」:小人坐在摊开的左手掌心,另一只手用食指轻戳脸颊,表情烦但可爱。文中附带 Uni-1 与市面常见绘画模型的差异对照(不讲玄学排名,只谈适用场景),以及 Luma Uni-1 的可复现流程与完整提示词。

先看反差:从「人像照片」到「掌心玩具叙事」(真实案例)
下面两张为同一次实测:左为上传至 Uni-1 的参考图,右为模型根据后文完整提示词生成的 3D Q 版成图。
参考图(上传)——正装、手势、神态清晰,五官信息给得足,有利于角色锚定。

Uni-1 成图——同一人被缩成 mini chibi:大头小身、材质偏高级粘土 / 潮玩感,坐在一只真实的手掌上;另一只手伸入画面,用食指轻戳脸颊,带一点挤压形变;表情 烦但可爱。

如果只用一句话形容这次 Uni-1 的表现:身份感和故事感同时在线——仍能认出是谁,画面却已经是完全不同的「玩具片」叙事。
Uni-1 是什么?为什么适合「一张脸开整活」
Uni-1 是 Luma 的图像模型,官方把它拆成两条很清晰的路径(心智模型先对齐,后面少翻车):
- Create
生成新画面(也可带参考图;参考图还能分工:角色 / 风格 / 光线等)。 - Modify
更像「外科手术式」修改已有图,默认更保结构——适合微调,而不是从零编故事。
对你这种「上传人脸 → 变 Q 版 → 还要复杂互动与表情」的需求,实践里常用的是:用参考图锁住脸,再用长提示词把场景、动作、情绪一次说清。官方也强调:参考图要写明角色(例如把第一张图标注为 CHARACTER),否则模型会猜,猜就容易不稳定。
和市面上主流「绘画模型」比:Uni-1 强在哪?
下面不谈玄学排名,只谈产品设计与常见工作流——同类产品迭代很快,以各平台最新说明为准;这里帮你判断:你的需求若是「参考脸 + 可控叙事 + 可能要精修」,Uni-1 哪些点更顺手。
先对齐:大家在比的不是「谁更会画画」
很多模型出图都很好看,差别往往在:
你是要一张氛围海报,还是要同一张脸在多张图里保持一致? 你是要从零生成,还是要在已有成图上做局部修改? 你能不能接受本地部署 / 插件工作流,还是只想网页里一条龙?
Uni-1 相对常见的几类竞品:怎么理解差异
| 社区文生图 | |||
| 对话生态里的生图 | |||
| 开源与本地工作流 | |||
| 企业 / 设计工具向 |
Uni-1 在我看来更「占便宜」的几条(结合官方能力表述)
Create 与 Modify 分清楚「全新构图」和「在既有图上做更像外科的修改」被拆成两条路径;官方明确:该输入的版本就用 Modify;要全新构图再用 Create。很多纯「文生图」产品默认让你反复重画,不一定强调这种编辑/重绘分工。
参考图不是「扔进去就算」:支持角色分工官方推荐写法是
Use IMAGE1 as a CHARACTER reference这类带角色的约束;Create 模式里最多 9 张参考图,可分别承担风格、角色、构图、调色等职责。对「一张脸 + 复杂互动 + 统一画风」这类需求,这比只靠一句「像照片里的人」更不容易翻车。更利于「做系列」:Seed + 迭代纪律官方把 Seed 讲得很实用:先探索,再锁种子,再一次只改一个变量——这和做表情包、做同一角色的多场景是同一套方法。
提示词空间与结构化表达官方文档给出较长的提示词长度上限与「避免空泛形容词、用可命名美学」的建议;对你这种分层的英文长提示词(比例→互动→表情→材质→镜头),更友好。
一句实话
没有「万能最强」——Midjourney 系可能更擅长你刷图找风格灵感;开源工作流可能更擅长你极致控图;Uni-1更像给「要把脸锁住、还要讲故事、还要能改」的人一套更结构化的控制面。这篇案例,本质是 角色参考 + 叙事 + 3D Q 版质感,正好落在它强调的能力带上。
超简步骤:约 30 秒操作,再等几十秒出图
打开 Uni-1 生成页访问:https://lumalabs.ai/uni-1(或进入 Luma 的 Create Image,在模型里选择 Uni-1。)
上传参考照片上传 1 张尽量清晰、正面信息足的人脸图(光线均匀、五官清楚最好)。这类「角色 Q 版化」场景里,单张人脸往往就够用,不必先凑多角度九宫格。
粘贴提示词将下文「完整提示词」整段英文粘贴进提示框(习惯以
Using UNI-1开头;若某次跟脸不紧,可再按官方文档补Use IMAGE1 as a CHARACTER reference...加强)。参数(推荐)
画幅:竖版 4:5 或 9:16(特写、信息流竖图都好用) 分辨率:2K(细节更足) 其余可先默认。 生成并等待点击后大约 20–40 秒出图(体感可能比「纯快模型」略慢,和内置推理/处理步骤有关,属正常)。经验向:首张就接近预期的情况不少,但仍建议预留 1~2 次微调或重抽(换 seed / 微调表情词),更符合真实工作流。

完整提示词(直接复制)
下面为可直接粘贴的完整英文提示词;正文排版为便于复制的代码块。
Using UNI-1, generate an ultra-detailed mini chibi versionof the person in the uploaded reference images. The charactermust have a large oversized head, very small compact body,and cute exaggerated facial features.Pose the chibi sittingnaturally on an open human left palm to show realistic sizescale. A second human right hand enters the frame and gentlypresses the chibi’s cheek using the index finger, slightlysquishing the face.The chibi expression is annoyed and pouty:puffed cheeks,subtle frown, one eye slightly squinting,brows lowered in mild frustration.Style should be premiumcinematic 3D chibi, smooth clay-like skin texture, soft pastelcolor palette, stylized hair volume, tiny detailed clothingfolds.Lighting must be soft studio lighting with naturalskin tones, clean highlights, minimal shadows.
这段提示词在控制什么(读懂它,你才能改它)
- 体型
大头、小身体、夸张五官——先把「Q 版规则」写死。 - 互动
左手托、右手戳脸、脸颊微挤压——把故事写死(比只写「生气」更耐看)。 - 表情
烦、嘟嘴、眯一眼——把情绪可读性写死。 - 材质与光
粘土感、柔光、肤色干净——减少「塑料廉价感」。 - 镜头
浅景深、bokeh、macro——让视线钉在脸与手指接触点。
你可以怎么用
- 做一套表情包
同一参考图,只改「表情段」提示词,其它结构不变。 - 做封面 / 竖版信息流
4:5 或 9:16 + 2K,平台友好。 - 做系列角色
固定一张「标准参考脸」,反复当 CHARACTER 用——比每次换自拍更稳。
工具越来越强,差距往往在于:你把需求拆成模型听得懂的层级——比例、互动、表情、材质、镜头,一次一层。Uni-1 这次算是把「讲故事的 Q 版」从纯抽卡,往可复现推了一步。
夜雨聆风