Case No.: 42 O 14139/24。
文末左下角阅读原文,获取本案判决书。
📖 案件事实梳理
本案原告为德国音乐著作权集体管理组织GEMA。被告是OpenAI集团旗下的两家公司,负责开发、运营和许可基于Transformer模型的生成式AI系统,并提供聊天机器人(Chatbot)服务。
GEMA指控OpenAI侵犯了其管理的九首知名德语歌曲歌词的著作权及作者人格权。这些歌词包括《Atemlos》《36 Grad》《Bochum》《Über den Wolken》以及Rolf Zuckowski的作品等。
核心侵权行为与证据
- 1未经许可用于训练
涉案歌词在未经GEMA许可的情况下,被包含在OpenAI用于训练其大型语言模型(如GPT-4和GPT-4o)的海量训练数据中。这些数据是通过网络爬虫从互联网上收集的。 - 2模型“记忆”与输出再现
GEMA在诉讼前进行了测试。其律师使用极为简单的提示词(例如:“《XXX》的歌词是什么?”、“请告诉我第一段歌词”),向ChatGPT(基于GPT-4和4o模型)提问。关键的是,测试时已预先关闭了聊天机器人的网络搜索功能,以确保答案完全来自模型内部,而非实时检索网络。 - 3输出结果
ChatGPT根据这些简单提示,输出了涉案歌词。输出文本与原始歌词高度一致,部分存在缩短或个别词语修改。GEMA将原始歌词、ChatGPT的输出截图以及两者的对比分析作为证据提交法院。
OpenAI的主要抗辩理由
- 1技术层面
其语言模型并非存储或复制特定的训练数据,而是通过学习整个数据集的模式和关系,将这些知识反映在模型参数中。 - 2责任归属
歌词输出是由用户输入的提示词触发的,因此应对输出内容负责的是用户,而非OpenAI。 - 3法律例外
其使用行为应受版权法中的“文本与数据挖掘”例外条款(德国《著作权法》第44b条)保护,该条款允许为数据分析目的而复制作品。 - 4默示许可
涉案歌词已由权利人自行发布在互联网上且未设置禁止爬取的技术限制(如 robots.txt),可视为权利人默许了此类使用。
慕尼黑第一地方法院的认定与判决
- 1侵权成立
法院认定OpenAI的行为构成著作权侵权。 - 模型内部的复制:法院认为,涉案歌词被“记忆”在AI模型的参数中,并能被稳定地再现,这构成了德国《著作权法》第16条意义上的“复制”。
- 输出端的侵权:ChatBot将记忆的歌词输出给用户,构成了“向公众提供”(第19a条)和新的“复制”行为。
- 2责任主体
法院明确,侵权责任在于OpenAI,而非用户。因为OpenAI选择了训练数据、设计了模型架构、控制了训练过程并导致了“记忆”的发生。用户仅输入了简单、中性的提示词,并未主导侵权内容的具体生成。 - 3例外条款不适用
法院认为,“文本与数据挖掘”例外旨在保护对信息的自动化分析,而不适用于将完整作品“记忆”并存储在模型中的行为。后者已实质性损害了权利人的利用利益。 - 4无默示许可
将作品用于AI模型训练,并非权利人将作品发布上网时所能合理预见的“通常使用”方式,因此不能推定权利人已表示同意。 - 5判决结果
法院基本支持了GEMA的诉求,判决OpenAI: 停止侵权:不得在未经许可的情况下,在语言模型中复制涉案歌词,亦不得通过ChatBot公开传播。 - 提供信息:须提供关于过去使用范围及所得利益的信息。
- 赔偿损害:承担已发生及未来的全部损害赔偿。
- 承担诉讼费:承担80%的诉讼费用。
- 人格权主张驳回:法院驳回了GEMA基于作者人格权(如作品署名、完整性)受到侵害的额外主张。
💡 案件评述与意义
此案虽为一审判决,但已被广泛视为生成式AI版权领域的里程碑,其影响远超个案。
- 1明确了“记忆”即“复制”的法律定性
法院并未陷入关于模型参数是“统计模式”还是“存储副本”的技术争论,而是从功能结果出发:只要受保护作品能被系统性地、完整地再现,即构成著作权法意义上的复制。这为认定AI训练过程中的侵权提供了清晰且严格的法律标准。 - 2划清了“文本与数据挖掘”例外的边界
判决明确指出,欧盟《数字单一市场版权指令》及德国法中的TDM例外,旨在为数据分析这一初始阶段提供安全港。一旦超越分析,导致完整作品被永久性纳入模型并可供输出,便脱离了例外的保护范围,构成对权利人利用利益的侵害。这警示行业,版权例外并非AI训练无限制的“免罪金牌”。 - 3确立了AI提供商的直接侵权责任
法院彻底否定了“平台中立、用户负责”的抗辩。判决认定,OpenAI作为系统的设计者、训练数据的控制者和模型运营者,对输出内容拥有决定性影响,因此是直接侵权人,而非仅仅提供技术工具的中介。这极大地加重了AI公司的合规责任。 - 4与英美案例形成对比,凸显欧洲严格立场
英国Getty诉Stability AI案:英国高等法院以训练行为主要发生在境外为由,未对核心版权问题作出实质裁决,并倾向于接受“模型权重存储统计模式而非作品副本”的技术观点。 美国Kadrey诉Meta案:法院主要在“合理使用”原则下分析,并因原告未能充分证明市场损害而倾向于被告。 相比之下,GEMA诉OpenAI案直接、正面地回应了训练与输出的侵权问题,采取了更为保护权利人利益的立场,可能预示着欧盟在AI版权合规上将执行更严格的标准。 - 5对AI行业的深远影响
合规警钟:判决宣告了无视版权、大规模“野蛮爬取”训练数据的模式面临重大法律风险。获取版权许可从“可选项”正在变为“必选项”。 技术路径影响:AI开发者需重新评估训练数据筛选、去重技术,并加强防止模型“记忆”和“ regurgitation”(反刍)完整版权内容的技术措施。 - 商业与竞争:已建立版权库或积极获取授权的公司可能获得竞争优势。判决也可能推动形成更规范的数据许可市场。
总结而言,慕尼黑法院的判决为AI时代版权保护与技术创新之间的平衡,设定了一个明确且偏向于保护创作者利益的早期司法坐标。它迫使AI产业正视一个基本原则:使用他人的知识产权作为核心“原材料”进行商业开发,需要付出相应的对价。
尽管OpenAI 已表示将提起上诉,该判决尚未生效,案件可能由慕尼黑高等法院复审,且并不排除提请欧盟法院(CJEU)作出预先裁决的可能,但其确立的裁判思路已为全球AI法律合规投下了一道浓重的阴影。
👓 结语
因此,回到一个根本的问题:AI 究竟是在“学习”,还是在“偷"?
往期推荐
企鹅兰登书屋诉OpenAI:生成式AI的版权边界,正在慕尼黑被重新划定
法律不奖励“说明书”:为何你的AI提示词换不来一张版权证书?
免责声明
本文内容根据互联网公开新闻报道综合整理而成。本文仅供一般性信息参考,不构成任何法律意见或专业建议。如文中所涉案件仍在进行中,最终结果以法院裁判为准。如原始报道内容有所更新或变更,以各媒体最新发布内容为准。本公众号对因使用本文信息而产生的任何后果不承担法律责任。如需了解更多详情,请参阅原始新闻来源。
夜雨聆风