
AI没有制造音乐产业的偏见,它只是让偏见运行得快了很多。
这是近期Billboard一篇行业专栏的核心判断,也是当前AI与音乐产业公平性讨论里最值得认真对待的一个表述。
在版权诉讼和融资新闻占据所有头条的同时,一场更慢、更深的问题正在成形:AI系统正在以空前的速度,将音乐行业几十年积累的结构性偏差编码进未来。

01
从源头说起:
元数据是一切的地基
理解AI如何放大偏差,必须从元数据说起。
2026年初,电子音乐协会AFEM对22家音乐科技公司进行调查,半数公司将"跨数据库的元数据冲突"列为最大的单一结构性挑战,41%指出缺乏统一的艺术家和歌曲标识符。
这不是抽象的技术问题。一首歌从艺术家流向发行商、流媒体平台、版税收集机构,每次交接都可能出错。元数据出错意味着推荐出错、版税出错、训练数据出错——三错连锁。
这场系统性失修有过一次正面交锋。2014年,全球曲目数据库(Global Repertoire Database)试图统一各版权组织的数据标准,最终因治理分歧宣告失败。机构保护的是赋予它们权力的东西,这种张力从未消失。
问题没有被修复,就这样静静沉积在数据库里。元数据的缺失和错误多年来一直集中在可预见的地方:独立艺术家、非西方曲库,以及一切在主流厂牌管线之外发行的内容。
现在,这些沉积物被AI系统当作训练数据挖了出来。


02
训练数据的地图,
画的是谁的世界
AFEM同一份调查还揭示了另一个数字:29%的音乐科技公司因数据和版权基础设施缺陷被迫放弃原有产品方向,半数受访者表示超过50%的工程资源被用于打补丁,而非真正开发产品。一半的工程能力在给烂账擦屁股。
这种资源消耗在训练数据层面有直接的量化呈现。阿布扎比穆罕默德·本·扎耶德人工智能大学(MBZUAI)的研究团队分析了主流AI音乐生成模型的训练数据集,结论是:现有数据集中仅有5.7%来自非西方流派,94%来自西方流派。
另一项覆盖超过100万小时音频数据集的研究进一步印证了这个结构:全球南方——涵盖南亚、中东、非洲、拉丁美洲——在AI音乐训练数据中的存在感接近于缺席,全球北方占据了约86%的数据集时长。
偏差不只在数量层面,也体现在模型能力上。Suno、Udio等平台在生成非西方音乐时,往往仍依赖西方的调性和节奏结构。
生成印度古典或中东音乐时尤为明显,模型实际上是在用西方音乐语法翻译一种它从未真正学过的语言。对于习惯用AI工具创作中国风、民族风音乐的创作者来说,这不是提示词写得不够好,而是模型在源头上就没有充分学过这种音乐。


03
人气偏差:
强者愈强的飞轮
训练数据的地理和文化偏差,在推荐算法层面又叠加了一重:人气偏差(popularity bias)。
机制并不复杂:热门曲目被更频繁地推荐,带来更多播放量,进而更有可能被继续推荐。对独立艺术家、新兴场景和非西方音乐而言,飞轮朝反方向转。数据越少,能见度越低,推荐越少。
挪威卑尔根大学与MediaFutures的2024年调查确认,人气偏差是推荐系统中记录最完整、持续时间最久的算法不公平形式之一。
性别偏差在推荐层面有更具体的量化:多项研究显示,"平均而言,推荐列表的第一首曲目来自男性,接下来的六首也是。"这不是被动反映既有的行业失衡,而是在主动放大它。


04
修补措施的边界
行业和监管层面的回应已经出现。EU AI法案要求AI开发者公开训练数据使用情况,从8月2日起进入执法期。
2026年4月,Spotify基于DDEX元数据标准推出测试版,允许艺术家披露AI在其音乐中的使用情况;环球音乐开始在其目录中嵌入国际标准姓名标识符(ISNI)。
但这些措施解决的是透明度和归属问题,不是数据本身的结构性失衡。知道谁的音乐被用于训练,和确保训练数据本身足够多元,是两件完全不同的事。
前者正在被法规推动,后者目前几乎没有任何约束机制。


05
一个被遮蔽的问题
当前关于AI与音乐版权的讨论,几乎全部集中在授权和赔偿上:AI公司有没有取得授权,艺术家有没有被补偿。这两个问题都重要,但它们预设了一个前提:只要解决了授权和赔偿,问题就解决了。
这个前提是有缺陷的。
即便所有训练数据都经过完整授权、所有艺术家都获得了补偿,训练数据本身的构成:94%西方流派、性别严重失衡、独立艺术家系统性缺失,依然会被编码进模型,依然会决定推荐算法推什么、AI工具擅长生成什么,以及哪些音乐在AI时代更容易被听见。
授权解决的是法律问题。训练数据的构成,解决的才是公平问题。
而后者,几乎没有人在谈。




AI音乐研究院
推荐阅读


夜雨聆风