
AI的创意,为什么总是「差不多就行」
你有没有发现,让AI写一首诗,它给你的永远是那种「不难看但也不惊艳」的东西。让它设计一个Logo,它端出来的方案像是某个免费素材网站的第三页。这不是偶然,背后有一个被大多数人忽视的根本原因。
先做一个思想实验。你让一百个人各自写一个「有创意的故事开头」,然后把这一百个开头全部喂给一个系统,让它学习「什么叫有创意」。这个系统最终会学到什么?它会学到这一百个开头的最大公约数,而不是其中最离经叛道的那一个。这就是现代AI在创意任务上的宿命:它被训练去理解「大多数人认为好的东西」,而不是「真正打破常规的东西」。
创意的本质是离群,而AI的本质是归群
统计学上有个概念叫「均值回归」。AI的生成过程,本质上就是一种概率上的均值回归。当模型在生成下一个词、下一个像素、下一个旋律时,它做的事情是:在所有可能性里,选择那个「在训练数据中最受欢迎的选项」。这个机制在翻译、总结、问答上非常好用——你当然希望翻译结果是「大多数专业译者会选择的表达」。但创意恰恰相反。真正的创意,几乎从定义上就是统计学上的异常值。毕加索画《格尔尼卡》时,如果他的大脑在做均值回归,那幅画根本不会存在。
95%
大型语言模型在生成文本时,会倾向于选择条件概率最高的那条路径——这个倾向在创意任务中尤为致命
这里有个微妙之处值得停下来想一想。AI并不是「不能」输出奇怪的东西,它完全可以被调高「温度参数」(temperature),让输出变得更随机、更离奇。但随机不等于创意。把一首诗的词序随机打乱,它变奇怪了,但没有变有创意。真正的创意是有方向的偏离——它离开了主流,但离开得有道理,甚至离开得让人事后觉得「原来还可以这样」。这种「有方向的偏离」需要一种很难被量化、很难被训练的东西:对规则的深度理解,加上打破规则的胆量。
更深的问题:AI在为谁优化
AI的训练数据来自人类的集体产出,它的反馈信号来自人类的集体评价。这意味着它在优化的目标,是「让尽可能多的人觉得还不错」。这个目标在商业上非常合理,但它和创意的逻辑是对撞的。历史上真正改变一个领域的创意作品,在刚出现时往往只有极少数人看懂,甚至大多数人觉得难以接受。爵士乐在1920年代被主流媒体称为「噪音」,印象派画家的作品第一次参加官方沙龙时被集体拒绝。如果当时有一个AI被训练来评估「好的音乐」或「好的绘画」,它大概率会站在那个时代的多数人一边。
「
被大多数人立刻喜欢的东西,很少是真正改变了什么的东西
」
这不是说AI没有用。恰恰相反,AI在创意的「执行层」极其有价值——把一个已经确定了方向的创意快速实现出来,生成大量变体供人筛选,处理创意过程中那些枯燥的重复性工作。它是一个极其高效的创意执行工具,但它很难是一个创意来源。把它当来源用,就像让一个做过大量市场调研的品牌顾问给你设计一个「颠覆性的产品」——他给你的,大概率是当下最流行趋势的微调版本。
还有一个被忽视的因素:风险规避被写进了训练里
除了统计均值的问题,还有一层更隐蔽的机制在起作用。大型语言模型在训练阶段有一个叫做RLHF(人类反馈强化学习)的环节——简单说,就是让人类评估员给模型的输出打分,然后根据分数调整模型行为。评估员在打分时,面对一个「中规中矩的答案」和一个「大胆但可能出错的答案」,他们会更倾向于给前者打高分,因为前者更安全、更难被批评。这种系统性的风险规避通过训练过程被固化进了模型的「性格」里。结果就是:AI学会了在创意上保守,因为保守在历史评分数据里总是更安全的选择。
1统计机制:生成过程本质上在做概率均值回归,倾向于「大多数人认可的」而非「真正突破的」
2优化目标:训练目标是最大化广泛满意度,而真正的创意往往只被少数人第一时间理解
3反馈偏差:人类评估员在打分时系统性地偏向安全答案,这个偏差被固化进了模型行为
那我们能怎么办
有一些实践层面的应对方法正在被探索。比如让AI扮演「挑战者」角色——不是让它直接生成创意,而是让它对一个已有的创意方案提出反驳和质疑,用它的「博学」来帮人类发现盲点。又比如在提示词里明确要求它「输出一个大多数人会觉得不舒服但逻辑上成立的方案」,这种反向约束有时候能绕过它的保守倾向。还有一种思路是把AI和人类创意者的角色彻底分开:人类负责提出那个「离群的方向」,AI负责在这个方向上快速展开和执行。这种分工其实更接近创意行业的实际——好的创意总监给的是一个奇怪的方向,执行团队负责把它变成现实。
✦ 小结
AI的创意保守,不是bug,是训练机制的必然结果。它被设计来取悦最多的人,而真正的创意从来不是为了取悦最多的人。理解这一点之后,你对AI的期待会变得更准确:用它来执行,用它来扩展,用它来质疑——但别指望它给你那个「没人想到过」的方向。那个方向,还是得你自己来。
夜雨聆风