文 / 乔安·杨(艺术顾问、艺术市场研究者)

最近让我印象很深的一篇AI论文,不是它又让模型多会做了一件事,而是它第一次认真回答了一个更微妙的问题:AI能不能学会“品味”?
这篇 arXiv 论文《AI Can Learn Scientific Taste》来自复旦大学、上海创智学院、清华大学和中南大学等机构合作。作者把“scientific taste”定义为两种能力的结合:一是 judgement capability,判断两项研究中哪一项更有潜在影响;二是 ideation capability,基于已有工作提出更值得继续做的后续研究。为此,团队用截至 2024 年的 210 万篇 arXiv 论文构建了 696,758 组按领域与时间匹配的论文对,训练出 Scientific Judge 与 Scientific Thinker 两个模型。
更有意思的是,这不是一个停留在概念层面的命题。在主测试集上,SciJudge-Qwen3-30B 的平均准确率达到 80.6%,高于 GPT-5.2-Thinking 的 72.7% 和 Gemini-3.0-Pro-Preview 的 75.7%;而在“时间外推”测试中,研究者还专门用 2025 年发表的 514 组论文对去检验模型是否能把这种判断迁移到未来,结果显示它确实具备跨时间泛化能力。
真正打动我的,不只是结果,而是它对“品味”这个词的处理方式。论文明确借用了休谟与康德的审美理论:休谟认为,品味标准并非来自任意个人偏好,而是来自“合格评判者”的共同判断;康德则把品味理解为一种面向共同体的 shared sense。也就是说,品味从来不是一种飘在空中的气质,它更像是一种经过长期比较、反复校正、并在共同体中逐渐稳定下来的判断能力。
这恰恰也是艺术市场最熟悉的逻辑。
在艺术管理和艺术市场研究里,价值从来不只是“作品本身好不好看”这么简单。布迪厄提醒我们,文化消费、审美判断和社会位置从来发生在“场域”之中,并与文化资本密切相关;Jens Beckert 则指出,在艺术这类市场中,质量并不完全内嵌于对象本身,而是在参与者之间的相互观察、话语协商与制度安排中被共同建构出来;Alain Quemin 延续 Raymonde Moulin 的问题意识进一步指出,艺术价值长期生成于“市场与博物馆的交界”,而当代收藏家、高端画廊与机构都在参与这种价值制造。换句话说,艺术世界里的“品味”,本来就不是神秘直觉,而是一套社会化、制度化、可被学习的比较机制。
所以,从艺术顾问的角度看,这篇论文最有启发的地方,不是“AI终于像人一样会审美了”,而是它把一个长期被浪漫化的能力,重新翻译成了三个可以训练的动作:比较、命名、预判。
所谓比较,是你能不能在两个看起来都不错的艺术家、两个都能成立的策展文本、两个都各有道理的品牌合作方案之间,说清楚哪个更强,强在哪里。
所谓命名,是你能不能把这种判断从“我就是觉得这个更好”,升级为“它在叙事密度、机构契合度、市场延展性和公共传播性上更完整”。
所谓预判,是你能不能不只停留在当下的选择,还能看出下一步该往哪里延伸,哪个方向更可能积累长期价值。
这也是为什么我一直觉得,在艺术行业里,最昂贵的能力从来不是执行,而是判断。把展签写完、把视觉做完、把活动方案列出来,这些工作当然重要;但真正稀缺的,是判断什么值得被写、什么值得被展示、什么值得被投入机构资源、收藏预算与传播注意力。
也正因此,我认为这项研究对普通人使用AI、尤其对创意与文化行业使用AI,有三个非常直接的启发。
第一,不要只让AI“生成”,要先让AI“比较”。
与其一上来就说“给我十个展览标题”“给我五版艺术家简介”,不如先让AI根据你给定的标准,对两个版本进行比较:哪个更符合机构调性?哪个更适合媒体传播?哪个更能兼顾学术性与公众理解?当“比较”先发生时,AI才真正进入你的判断框架。
第二,不要只做选择,要把理由反馈给AI。
很多人已经习惯从AI给出的多个版本里挑一个,但往往止于“我选这个”。可真正能训练系统、也训练自己的,是你继续多走一步:告诉它为什么。是因为这个版本更有记忆点,还是因为它更符合你的审美伦理、更适合目标受众、更有长期品牌一致性?反馈不是客气话,而是把隐性的品味外显化。
第三,不要把AI当成代笔工具,而要把它当成“初级研究同事”。
在策展、写作、收藏研究、艺术家项目梳理这些工作里,AI最好的角色不是替你拍板,而是陪你做高频比较、快速试错、辅助延展。你负责定义什么叫“更好”,它负责在你的标准之内加速搜索、组合与推演。真正应该被保留下来的,不是“让AI替我想”,而是“借AI让我更清楚我为什么这样想”。
当然,这篇论文本身也很克制。作者明确承认,科学品味并不等于全部价值判断;引用量只是共同体反馈的一种不完美代理,研究构思的评估目前也仍主要依赖强模型评审,而不是现实中的长期实验验证。论文同样强调,这类系统更适合辅助人类判断,而不是取代人类判断。这个限制,放到艺术领域尤其重要:无论是价格、机构背书、学术文本还是市场热度,都不可能单独穷尽艺术价值。
但也正因为如此,这项研究才更值得重视。它不是在说“以后只要把价值交给算法就好了”,而是在提醒我们:所谓品味,从来不是少数人的天赋神话,而是可被训练、可被复盘、可被共同体不断校准的能力。
在AI时代,执行会越来越便宜,生成会越来越泛滥;但“什么值得被生成”“什么值得被保留”“什么值得继续往下做”——这些问题,反而会变得更贵。
这,正是艺术顾问、策展人、收藏家、教育者,乃至每一个创意工作者,未来最核心的竞争力。
因为最后真正值钱的,不是你能让AI做多少事,而是你能不能告诉它:什么才值得做。
夜雨聆风