乐于分享
好东西不私藏

AI是否理解“美”?我写了个APP做了些测试

AI是否理解“美”?我写了个APP做了些测试

最近走火入魔于“美”的话题里,这个话题太大了,在人类世界里都说不清楚,尤其是在“当代艺术”鱼龙混杂的环境下。

既然说不清楚,那么,跳出来,AI是否能够理解“美”,它是否可以有一些可以遵循的标准,它是否可以根据这些标准去修正。

于是,五分钟生成了一个APP,当然,是Gemini-3-flash和nano banana驱动的。分别传我不同的照片,评价,打分,提出缺陷,修改。

图1:我觉得它说的对,色温和曝光微调后,确实比我的原图好一点。

图2:粗看好像区别不大,但确实在高光部分有了细微变化。

图3:叶子上的高光明显调整了,背景的高光部分也柔和了不少。

图4:河水表面加了写光斑,我觉得不错。

图5:这张照片的色调其实我很喜欢,紫色调并非后期故意为之,而是紫外光镜头本身带来的,我理解AI的优化,但少了紫色,在我看来就少了独特的味道。

图6:我其实对于原图的缺点看得不太清楚,模型“教育”了我。

图7:我在“猜”模型大概“喜欢”什么照片时的第一次努力,失败,但客观而言,我自己给的分也会差不多,有点浮夸,模型对于“HDR过重”的批评很到位。

图8:“猜”它喜欢的第二次尝试。

图9:“猜”它不喜欢,中了。

这些结果,远远超出我的预期。

美本身,可能真的是有一些基本的标准的。

我又让Gemini对上面的结果做了些分析,结果翻译如下:

这是一个非常引人入胜的项目。你成功利用了 Gemini 的多模态能力,构建了一个成熟的照片评价和优化闭环。你分享的结果表明,该系统不仅能进行细致的技术分析,还能理解诸如构图、情绪和“情感氛围(Emotional Feeling)”等抽象概念。

以下是针对你的应用结果的分析,以及关于用户如何在该系统中获得高分的建议。

应用结果分析

你构建的系统表现出一种强烈的偏好:推崇技术上的精湛与经典构图法则的结合。它不会轻易被单纯的“氛围感”打动;如果技术执行上有缺陷,分数会显著下降。

以下是 Gemini 评审模式的规律总结:

1. 对“关键焦点”的执着 (The “Critical Focus” Obsession)

  • 观察: 在几乎所有得分 7 分或以下的图片(图 0、1、2、4、5)中,AI 都立即指出了主体(如昆虫的眼睛、主要的叶子、雏菊的花瓣)缺乏“如针尖般锐利(tack-sharp)”的焦点。

  • 分析: AI 模型对预期焦点的边缘对比度非常敏感。如果主体不够清晰,即使有漂亮的散景(背景虚化)也无济于事。

2. 对干扰元素(高光和杂乱)的零容忍

  • 观察: 系统一贯会惩罚那些有“喧宾夺主”元素的图片。

    • 高光: 在图 1、2 和 3 中,背景/散景中明亮、过曝的区域被标记为干扰项。

    • 杂乱: 在图 3 和 4 中,前景或背景中被认为“杂乱”或缺乏清晰层次的元素拉低了分数。

  • 分析: AI 优先考虑主体分离(Subject Isolation)。它希望观众的视线能瞬间落在主体上,而不是被画面其他地方的强光或杂乱细节吸引。

3. “自然但经过修饰”的审美倾向

  • 观察: 系统不喜欢明显的过度后期处理。

    • 图 6 因为“激进的 HDR”、“光晕(haloing)”和“过度的色彩饱和度”受到了严厉惩罚。

    • 图 7(最高分,9/10)因其自然的平衡而受到称赞,优化建议也只是修正透视和略微提亮阴影,而没有改变照片的基调。

  • 分析: 系统更喜欢在真实的基础上进行润色。它排斥因过度编辑而显得“数码味”太重或虚假的照片。

4. 敏锐的技术瑕疵检测

  • 观察: 系统非常擅长发现人眼有时会忽略的技术缺陷。它经常标记:

    • 高对比度区域的色差/紫边(图 0、1、4)。

    • 深阴影中的噪点(图 2、6)。

  • 分析: 这对于 AI 模型来说很容易通过像素级检查发现。想要高分,画质必须“干净”。

5. 动态范围与曝光平衡

  • 观察: 得分最低的图片(图 8,4/10)是因为严重曝光不足和画面“灰暗浑浊(muddy)”。相反,高光溢出(纯白无细节)的图片也会受到批评(图 3)。

  • 分析: AI 偏好平衡的直方图,即最亮的高光和最深的阴影中都要保留细节。


建议:如何获得高评分

基于以上分析,你可以向你的用户提供以下指南,帮助他们获得 8 分、9 分甚至 10 分。

1. 黄金法则:精准对焦 (Nail the Focus)

如果主体不是完美清晰,最高分很可能被限制在 7/10。

  • 用户小贴士: 使用单点自动对焦(Single-point AF)对准主体最关键的部位(如人或动物的眼睛、花蕊)。不要依赖相机去猜测重点在哪里。如果使用大光圈(如 f/1.4 或 f/1.8),请反复确认对焦精度。

2. 简化构图(清理画面)

AI 喜欢清晰度,讨厌争夺注意力的元素。

  • 用户小贴士: 在按下快门前,扫描画面的边缘和背景。有没有明亮的灯柱从头顶长出来?前景有没有杂乱的树枝?移动你的脚步来消除干扰。

  • 构图指南: 虽然居中构图有时可行,但该应用似乎更喜欢动态构图,如三分法(Rule of Thirds)(见图 0 的评论)或强烈的引导线(Leading Lines)(见图 7 的赞赏)。

3. 控制高光 (Manage Your Highlights)

亮点会吸引眼球。如果照片中最亮的地方不是你的主体,你就会丢分。

  • 用户小贴士: 小心背景中的“热点”(如树丛间透出的强光天空)。尝试重新构图,让背景比主体暗,或者调整角度避开光源。避免让高光“溢出”变成死白,除非这是一种刻意的艺术选择(即便如此,AI 可能仍然不喜欢)。

4. 在后期修正技术瑕疵(上传前)

你的应用正在寻找数字缺陷。

  • 用户小贴士:

    • 去色差: 在 Lightroom/Camera Raw 中勾选“删除色差(Remove Chromatic Aberration)”,特别是对于高对比度的户外照片。

    • 降噪: 如果使用高 ISO 拍摄,请进行适度的降噪处理以净化阴影。

    • 修正透视: 如果拍摄建筑,确保垂直线是真正的垂直(梯形校正),如在图 7 中所示。

5. 追求“自然的鲜艳”,而非“HDR 灼烧感”

应用会惩罚过饱和及激进的 HDR 效果。

  • 用户小贴士: 避免大幅拉动“饱和度(Saturation)”滑块。改用“鲜艳度(Vibrance)”,这种效果更微妙。如果使用 HDR,确保它看起来逼真,不要在地平线物体周围产生发光的“光晕”。目标是拥有自然色彩的平衡曝光。

获得 9/10 分的速查表:

  • 主体: 极致锐利。

  • 背景: 干净、无干扰,且比主体略暗。

  • 构图: 使用引导线或三分法;讲述一个故事。

  • 技术: 无噪点,无紫边,地平线平直。

  • 光影: 平衡,阴影和高光中都有细节。

本站文章均为手工撰写未经允许谢绝转载:夜雨聆风 » AI是否理解“美”?我写了个APP做了些测试

评论 抢沙发

7 + 7 =
  • 昵称 (必填)
  • 邮箱 (必填)
  • 网址
×
订阅图标按钮