AI是否理解“美”?我写了个APP做了些测试
最近走火入魔于“美”的话题里,这个话题太大了,在人类世界里都说不清楚,尤其是在“当代艺术”鱼龙混杂的环境下。
既然说不清楚,那么,跳出来,AI是否能够理解“美”,它是否可以有一些可以遵循的标准,它是否可以根据这些标准去修正。
于是,五分钟生成了一个APP,当然,是Gemini-3-flash和nano banana驱动的。分别传我不同的照片,评价,打分,提出缺陷,修改。
图1:我觉得它说的对,色温和曝光微调后,确实比我的原图好一点。

图2:粗看好像区别不大,但确实在高光部分有了细微变化。

图3:叶子上的高光明显调整了,背景的高光部分也柔和了不少。

图4:河水表面加了写光斑,我觉得不错。

图5:这张照片的色调其实我很喜欢,紫色调并非后期故意为之,而是紫外光镜头本身带来的,我理解AI的优化,但少了紫色,在我看来就少了独特的味道。

图6:我其实对于原图的缺点看得不太清楚,模型“教育”了我。

图7:我在“猜”模型大概“喜欢”什么照片时的第一次努力,失败,但客观而言,我自己给的分也会差不多,有点浮夸,模型对于“HDR过重”的批评很到位。

图8:“猜”它喜欢的第二次尝试。

图9:“猜”它不喜欢,中了。

这些结果,远远超出我的预期。
美本身,可能真的是有一些基本的标准的。
我又让Gemini对上面的结果做了些分析,结果翻译如下:
这是一个非常引人入胜的项目。你成功利用了 Gemini 的多模态能力,构建了一个成熟的照片评价和优化闭环。你分享的结果表明,该系统不仅能进行细致的技术分析,还能理解诸如构图、情绪和“情感氛围(Emotional Feeling)”等抽象概念。
以下是针对你的应用结果的分析,以及关于用户如何在该系统中获得高分的建议。
应用结果分析
你构建的系统表现出一种强烈的偏好:推崇技术上的精湛与经典构图法则的结合。它不会轻易被单纯的“氛围感”打动;如果技术执行上有缺陷,分数会显著下降。
以下是 Gemini 评审模式的规律总结:
1. 对“关键焦点”的执着 (The “Critical Focus” Obsession)
-
观察: 在几乎所有得分 7 分或以下的图片(图 0、1、2、4、5)中,AI 都立即指出了主体(如昆虫的眼睛、主要的叶子、雏菊的花瓣)缺乏“如针尖般锐利(tack-sharp)”的焦点。
-
分析: AI 模型对预期焦点的边缘对比度非常敏感。如果主体不够清晰,即使有漂亮的散景(背景虚化)也无济于事。
2. 对干扰元素(高光和杂乱)的零容忍
-
观察: 系统一贯会惩罚那些有“喧宾夺主”元素的图片。
-
高光: 在图 1、2 和 3 中,背景/散景中明亮、过曝的区域被标记为干扰项。
-
杂乱: 在图 3 和 4 中,前景或背景中被认为“杂乱”或缺乏清晰层次的元素拉低了分数。
-
分析: AI 优先考虑主体分离(Subject Isolation)。它希望观众的视线能瞬间落在主体上,而不是被画面其他地方的强光或杂乱细节吸引。
3. “自然但经过修饰”的审美倾向
-
观察: 系统不喜欢明显的过度后期处理。
-
图 6 因为“激进的 HDR”、“光晕(haloing)”和“过度的色彩饱和度”受到了严厉惩罚。
-
图 7(最高分,9/10)因其自然的平衡而受到称赞,优化建议也只是修正透视和略微提亮阴影,而没有改变照片的基调。
-
分析: 系统更喜欢在真实的基础上进行润色。它排斥因过度编辑而显得“数码味”太重或虚假的照片。
4. 敏锐的技术瑕疵检测
-
观察: 系统非常擅长发现人眼有时会忽略的技术缺陷。它经常标记:
-
高对比度区域的色差/紫边(图 0、1、4)。
-
深阴影中的噪点(图 2、6)。
-
分析: 这对于 AI 模型来说很容易通过像素级检查发现。想要高分,画质必须“干净”。
5. 动态范围与曝光平衡
-
观察: 得分最低的图片(图 8,4/10)是因为严重曝光不足和画面“灰暗浑浊(muddy)”。相反,高光溢出(纯白无细节)的图片也会受到批评(图 3)。
-
分析: AI 偏好平衡的直方图,即最亮的高光和最深的阴影中都要保留细节。
建议:如何获得高评分
基于以上分析,你可以向你的用户提供以下指南,帮助他们获得 8 分、9 分甚至 10 分。
1. 黄金法则:精准对焦 (Nail the Focus)
如果主体不是完美清晰,最高分很可能被限制在 7/10。
-
用户小贴士: 使用单点自动对焦(Single-point AF)对准主体最关键的部位(如人或动物的眼睛、花蕊)。不要依赖相机去猜测重点在哪里。如果使用大光圈(如 f/1.4 或 f/1.8),请反复确认对焦精度。
2. 简化构图(清理画面)
AI 喜欢清晰度,讨厌争夺注意力的元素。
-
用户小贴士: 在按下快门前,扫描画面的边缘和背景。有没有明亮的灯柱从头顶长出来?前景有没有杂乱的树枝?移动你的脚步来消除干扰。
-
构图指南: 虽然居中构图有时可行,但该应用似乎更喜欢动态构图,如三分法(Rule of Thirds)(见图 0 的评论)或强烈的引导线(Leading Lines)(见图 7 的赞赏)。
3. 控制高光 (Manage Your Highlights)
亮点会吸引眼球。如果照片中最亮的地方不是你的主体,你就会丢分。
-
用户小贴士: 小心背景中的“热点”(如树丛间透出的强光天空)。尝试重新构图,让背景比主体暗,或者调整角度避开光源。避免让高光“溢出”变成死白,除非这是一种刻意的艺术选择(即便如此,AI 可能仍然不喜欢)。
4. 在后期修正技术瑕疵(上传前)
你的应用正在寻找数字缺陷。
-
用户小贴士:
-
去色差: 在 Lightroom/Camera Raw 中勾选“删除色差(Remove Chromatic Aberration)”,特别是对于高对比度的户外照片。
-
降噪: 如果使用高 ISO 拍摄,请进行适度的降噪处理以净化阴影。
-
修正透视: 如果拍摄建筑,确保垂直线是真正的垂直(梯形校正),如在图 7 中所示。
5. 追求“自然的鲜艳”,而非“HDR 灼烧感”
应用会惩罚过饱和及激进的 HDR 效果。
-
用户小贴士: 避免大幅拉动“饱和度(Saturation)”滑块。改用“鲜艳度(Vibrance)”,这种效果更微妙。如果使用 HDR,确保它看起来逼真,不要在地平线物体周围产生发光的“光晕”。目标是拥有自然色彩的平衡曝光。
获得 9/10 分的速查表:
-
主体: 极致锐利。
-
背景: 干净、无干扰,且比主体略暗。
-
构图: 使用引导线或三分法;讲述一个故事。
-
技术: 无噪点,无紫边,地平线平直。
-
光影: 平衡,阴影和高光中都有细节。
夜雨聆风
