AI的创意,为什么总是「差不多就行」

AI的创意，为什么总是「差不多就行」

你有没有发现，让AI写一首诗，它给你的永远是那种「不难看但也不惊艳」的东西。让它设计一个Logo，它端出来的方案像是某个免费素材网站的第三页。这不是偶然，背后有一个被大多数人忽视的根本原因。

先做一个思想实验。你让一百个人各自写一个「有创意的故事开头」，然后把这一百个开头全部喂给一个系统，让它学习「什么叫有创意」。这个系统最终会学到什么？它会学到这一百个开头的最大公约数，而不是其中最离经叛道的那一个。这就是现代AI在创意任务上的宿命：它被训练去理解「大多数人认为好的东西」，而不是「真正打破常规的东西」。

创意的本质是离群，而AI的本质是归群

统计学上有个概念叫「均值回归」。AI的生成过程，本质上就是一种概率上的均值回归。当模型在生成下一个词、下一个像素、下一个旋律时，它做的事情是：在所有可能性里，选择那个「在训练数据中最受欢迎的选项」。这个机制在翻译、总结、问答上非常好用——你当然希望翻译结果是「大多数专业译者会选择的表达」。但创意恰恰相反。真正的创意，几乎从定义上就是统计学上的异常值。毕加索画《格尔尼卡》时，如果他的大脑在做均值回归，那幅画根本不会存在。

95%

大型语言模型在生成文本时，会倾向于选择条件概率最高的那条路径——这个倾向在创意任务中尤为致命

这里有个微妙之处值得停下来想一想。AI并不是「不能」输出奇怪的东西，它完全可以被调高「温度参数」（temperature），让输出变得更随机、更离奇。但随机不等于创意。把一首诗的词序随机打乱，它变奇怪了，但没有变有创意。真正的创意是有方向的偏离——它离开了主流，但离开得有道理，甚至离开得让人事后觉得「原来还可以这样」。这种「有方向的偏离」需要一种很难被量化、很难被训练的东西：对规则的深度理解，加上打破规则的胆量。

更深的问题：AI在为谁优化

AI的训练数据来自人类的集体产出，它的反馈信号来自人类的集体评价。这意味着它在优化的目标，是「让尽可能多的人觉得还不错」。这个目标在商业上非常合理，但它和创意的逻辑是对撞的。历史上真正改变一个领域的创意作品，在刚出现时往往只有极少数人看懂，甚至大多数人觉得难以接受。爵士乐在1920年代被主流媒体称为「噪音」，印象派画家的作品第一次参加官方沙龙时被集体拒绝。如果当时有一个AI被训练来评估「好的音乐」或「好的绘画」，它大概率会站在那个时代的多数人一边。

「

被大多数人立刻喜欢的东西，很少是真正改变了什么的东西

」

这不是说AI没有用。恰恰相反，AI在创意的「执行层」极其有价值——把一个已经确定了方向的创意快速实现出来，生成大量变体供人筛选，处理创意过程中那些枯燥的重复性工作。它是一个极其高效的创意执行工具，但它很难是一个创意来源。把它当来源用，就像让一个做过大量市场调研的品牌顾问给你设计一个「颠覆性的产品」——他给你的，大概率是当下最流行趋势的微调版本。

还有一个被忽视的因素：风险规避被写进了训练里

除了统计均值的问题，还有一层更隐蔽的机制在起作用。大型语言模型在训练阶段有一个叫做RLHF（人类反馈强化学习）的环节——简单说，就是让人类评估员给模型的输出打分，然后根据分数调整模型行为。评估员在打分时，面对一个「中规中矩的答案」和一个「大胆但可能出错的答案」，他们会更倾向于给前者打高分，因为前者更安全、更难被批评。这种系统性的风险规避通过训练过程被固化进了模型的「性格」里。结果就是：AI学会了在创意上保守，因为保守在历史评分数据里总是更安全的选择。

1统计机制：生成过程本质上在做概率均值回归，倾向于「大多数人认可的」而非「真正突破的」

2优化目标：训练目标是最大化广泛满意度，而真正的创意往往只被少数人第一时间理解

3反馈偏差：人类评估员在打分时系统性地偏向安全答案，这个偏差被固化进了模型行为

那我们能怎么办

有一些实践层面的应对方法正在被探索。比如让AI扮演「挑战者」角色——不是让它直接生成创意，而是让它对一个已有的创意方案提出反驳和质疑，用它的「博学」来帮人类发现盲点。又比如在提示词里明确要求它「输出一个大多数人会觉得不舒服但逻辑上成立的方案」，这种反向约束有时候能绕过它的保守倾向。还有一种思路是把AI和人类创意者的角色彻底分开：人类负责提出那个「离群的方向」，AI负责在这个方向上快速展开和执行。这种分工其实更接近创意行业的实际——好的创意总监给的是一个奇怪的方向，执行团队负责把它变成现实。

✦ 小结

AI的创意保守，不是bug，是训练机制的必然结果。它被设计来取悦最多的人，而真正的创意从来不是为了取悦最多的人。理解这一点之后，你对AI的期待会变得更准确：用它来执行，用它来扩展，用它来质疑——但别指望它给你那个「没人想到过」的方向。那个方向，还是得你自己来。

AI创意大语言模型创意思维人机协作