当AI开始学习“品味”:从一篇复旦论文,看见艺术市场里最昂贵的能力

文 / 乔安·杨（艺术顾问、艺术市场研究者）

最近让我印象很深的一篇AI论文，不是它又让模型多会做了一件事，而是它第一次认真回答了一个更微妙的问题：AI能不能学会“品味”？

这篇 arXiv 论文《AI Can Learn Scientific Taste》来自复旦大学、上海创智学院、清华大学和中南大学等机构合作。作者把“scientific taste”定义为两种能力的结合：一是 judgement capability，判断两项研究中哪一项更有潜在影响；二是 ideation capability，基于已有工作提出更值得继续做的后续研究。为此，团队用截至 2024 年的 210 万篇 arXiv 论文构建了 696,758 组按领域与时间匹配的论文对，训练出 Scientific Judge 与 Scientific Thinker 两个模型。

更有意思的是，这不是一个停留在概念层面的命题。在主测试集上，SciJudge-Qwen3-30B 的平均准确率达到 80.6%，高于 GPT-5.2-Thinking 的 72.7% 和 Gemini-3.0-Pro-Preview 的 75.7%；而在“时间外推”测试中，研究者还专门用 2025 年发表的 514 组论文对去检验模型是否能把这种判断迁移到未来，结果显示它确实具备跨时间泛化能力。

真正打动我的，不只是结果，而是它对“品味”这个词的处理方式。论文明确借用了休谟与康德的审美理论：休谟认为，品味标准并非来自任意个人偏好，而是来自“合格评判者”的共同判断；康德则把品味理解为一种面向共同体的 shared sense。也就是说，品味从来不是一种飘在空中的气质，它更像是一种经过长期比较、反复校正、并在共同体中逐渐稳定下来的判断能力。

这恰恰也是艺术市场最熟悉的逻辑。

在艺术管理和艺术市场研究里，价值从来不只是“作品本身好不好看”这么简单。布迪厄提醒我们，文化消费、审美判断和社会位置从来发生在“场域”之中，并与文化资本密切相关；Jens Beckert 则指出，在艺术这类市场中，质量并不完全内嵌于对象本身，而是在参与者之间的相互观察、话语协商与制度安排中被共同建构出来；Alain Quemin 延续 Raymonde Moulin 的问题意识进一步指出，艺术价值长期生成于“市场与博物馆的交界”，而当代收藏家、高端画廊与机构都在参与这种价值制造。换句话说，艺术世界里的“品味”，本来就不是神秘直觉，而是一套社会化、制度化、可被学习的比较机制。

所以，从艺术顾问的角度看，这篇论文最有启发的地方，不是“AI终于像人一样会审美了”，而是它把一个长期被浪漫化的能力，重新翻译成了三个可以训练的动作：比较、命名、预判。

所谓比较，是你能不能在两个看起来都不错的艺术家、两个都能成立的策展文本、两个都各有道理的品牌合作方案之间，说清楚哪个更强，强在哪里。

所谓命名，是你能不能把这种判断从“我就是觉得这个更好”，升级为“它在叙事密度、机构契合度、市场延展性和公共传播性上更完整”。
所谓预判，是你能不能不只停留在当下的选择，还能看出下一步该往哪里延伸，哪个方向更可能积累长期价值。

这也是为什么我一直觉得，在艺术行业里，最昂贵的能力从来不是执行，而是判断。把展签写完、把视觉做完、把活动方案列出来，这些工作当然重要；但真正稀缺的，是判断什么值得被写、什么值得被展示、什么值得被投入机构资源、收藏预算与传播注意力。

也正因此，我认为这项研究对普通人使用AI、尤其对创意与文化行业使用AI，有三个非常直接的启发。

第一，不要只让AI“生成”，要先让AI“比较”。
与其一上来就说“给我十个展览标题”“给我五版艺术家简介”，不如先让AI根据你给定的标准，对两个版本进行比较：哪个更符合机构调性？哪个更适合媒体传播？哪个更能兼顾学术性与公众理解？当“比较”先发生时，AI才真正进入你的判断框架。

第二，不要只做选择，要把理由反馈给AI。
很多人已经习惯从AI给出的多个版本里挑一个，但往往止于“我选这个”。可真正能训练系统、也训练自己的，是你继续多走一步：告诉它为什么。是因为这个版本更有记忆点，还是因为它更符合你的审美伦理、更适合目标受众、更有长期品牌一致性？反馈不是客气话，而是把隐性的品味外显化。

第三，不要把AI当成代笔工具，而要把它当成“初级研究同事”。
在策展、写作、收藏研究、艺术家项目梳理这些工作里，AI最好的角色不是替你拍板，而是陪你做高频比较、快速试错、辅助延展。你负责定义什么叫“更好”，它负责在你的标准之内加速搜索、组合与推演。真正应该被保留下来的，不是“让AI替我想”，而是“借AI让我更清楚我为什么这样想”。

当然，这篇论文本身也很克制。作者明确承认，科学品味并不等于全部价值判断；引用量只是共同体反馈的一种不完美代理，研究构思的评估目前也仍主要依赖强模型评审，而不是现实中的长期实验验证。论文同样强调，这类系统更适合辅助人类判断，而不是取代人类判断。这个限制，放到艺术领域尤其重要：无论是价格、机构背书、学术文本还是市场热度，都不可能单独穷尽艺术价值。

但也正因为如此，这项研究才更值得重视。它不是在说“以后只要把价值交给算法就好了”，而是在提醒我们：所谓品味，从来不是少数人的天赋神话，而是可被训练、可被复盘、可被共同体不断校准的能力。

在AI时代，执行会越来越便宜，生成会越来越泛滥；但“什么值得被生成”“什么值得被保留”“什么值得继续往下做”——这些问题，反而会变得更贵。

这，正是艺术顾问、策展人、收藏家、教育者，乃至每一个创意工作者，未来最核心的竞争力。

因为最后真正值钱的，不是你能让AI做多少事，而是你能不能告诉它：什么才值得做。