生成式AI的训练是否具有Transformative?-从Sony v. Connectix案(2000)和 Apple v. Psystar案 (2011)谈起

在当前众多涉及生成式AI的诉讼案中，核心争议点之一在于：大规模使用未授权版权作品训练模型是否符合“合理使用”？

而在“合理使用”的四要素判断中，是否具有“转换性（Transformative)”占有重要权重。比如在Oracle v. Google的关于Java API的世纪诉讼中，最高院多数意见认为：Google对于Java API的使用”扩展了基于Android的智能手机的使用范围和功能，从而创建了一个可供程序员轻松使用的新平台-这是极具转换性的。

Oracle v. Google案结果被普遍地借鉴-在关于生成式AI的诉讼案中，被告均声称使用版权作品训练生成式AI模式是极具转换性的-模型的学习并非拷贝原作，而是学习原作中的“统计规律/模式”，并且，训练后的模型可以完成相当多的人类工作-这显然具有转换性。

另一方面，不认同模型的训练具有转换性的代表性言论可参见Britannica Inc v. OpenAI案原告起诉书67段：

“被告对原告受版权保护作品的滥用也不具有转换性。具有转换性的作品会添加新的内容，具有进一步的目的或不同的特性，通过新的表达、意义或信息改变原作。相反，ChatGPT 复制版权内容的表达、意义和信息，包括原告的内容，并将其重新包装提供给消费者。ChatGPT 并未增加任何新的表达、意义或信息”。

一篇檄文-Britannica Inc v. OpenAI案起诉书

原告基于这段文字指出：模型的训练并未体现出任何“创新”，而仅仅是把版权作品进行重新包装后再兜售。

生成式AI模型的训练是否具有转换性？这是一个待决问题。说它是目前此类诉讼中的核心问题也不为过。在大众认知中，“转换性”与“创新”基本可划等号。而在资本一直鼓吹AGI即将到来的喧嚣背景下，人们一般性地会认为今日的生成式AI是一种非常大的“创新”--尽管生成式AI的基底-深度学习的理论在上世纪90年代就已经成熟了。

从US目前已有判决的案件结果看，在Kardey v. Meta案中，法官认为Meta使用材料训练模型具有转换性；在Bartz v. Anthropic案中，法官认为Anthropic使用购买的二手纸质书籍构建的数据库训练Claude具有转换性；但是Anthropic使用下载的盗版书籍构建的数据库训练Claude不具有转换性-目前的结果远未达到共识。

而从上述原被告两方意见可以看出，类似于某些数学问题可以被转化处理一样：上述待决问题（模型训练是否具有转换性）可以被转化为另一个（更基本）的问题：生成式AI的训练过程究竟是对原作的压缩性拷贝【原告观点】，还是仅学习原作的抽象层（统计规律/模式）、而非表达层信息【被告观点】？

不幸的是，上述转换后的问题在如今仍属待决。业界和学界都在讨论它，但目前尚无共识。

本文简单介绍两个US版权史上的著名案件，并基于这两个案件从“创新程度”的角度对上述未决问题进行分析和讨论。

第一个案件：Sony v. Connectix (2000），该案由第九巡回上诉法院判决。

案情：

1998年，Connectix公司开发了虚拟游戏站（VGS)，这是一种应用软件，它可以使得人们在苹果电脑上玩Sony PS游戏。

为了实现这种PS游戏和苹果电脑之间的兼容，Connectix在开发VGS的过程中、在未获得Sony许可的情况下、基于反向工程获取并复制了Sony PlayStation硬件的BIOS代码。

很明显，Connectix的产品动了Sony的奶酪-Sony的游戏业务与苹果类似-它是软硬一体的。玩家在PlayStation上玩PS游戏是Sony的生态愿景。

Sony于1999年起诉Connectix，指控其侵犯版权和知识产权。

地区法院支持了Sony，对Connectix的产品发布了禁令。

Connectix不服，上诉至第九巡回上诉法院。

第九巡回上诉法院推翻了地区法院的判决，裁决的核心在于分析：Connectix公司对PlayStation的反向工程-获取并复制其中的BIOS代码是否符合 “合理使用”？

法院认为：在本案中，合理使用四要素-使用的目的和性质、受版权保护作品的性质、所用部分的数量和实质性、对潜在市场的影响上均有利于Connectix。

特别地，在关于“使用的目的和性质”-也就是所谓“转换性”上，法院认为：

Connectix使用Sony PlayStation的BIOS为Sony的游戏构建了一个新的平台-允许在Mac电脑上运行Sony PS游戏-使其成为Sony及其游戏市场上的合法竞争对手，这具有转换性。

法院还认为：Sony寻求控制运行其制作或授权游戏的硬件设备市场是可以理解的。然而，版权法并未赋予这种垄断权。

第二个案件：Apple Inc v. Psystar (2011)，该案同样由第九巡回上述法院判决。

案情：

Psystar是一家销售“开放计算机”的公司，所谓“开放计算机”是：在非苹果硬件上安装运行苹果Mac OS操作系统。

Psystar公司通过技术手段绕过了苹果的安装/验证机制，从而使得Mac OS可以运行于非苹果PC上。

2008年，Apple在加州北区地方法院起诉Psystar。Apple主张版权侵权、违反DMCA 1201等多项诉由。

2009年，地区法院作出了有利于苹果的简易判决并发布了禁令：Psystar的做法超出软件许可授权范围并侵权，绕过Apple的安全机制触发DMCA 1201责任，Psystar的合理使用抗辩未获支持。

【注: Alsup法官参与审理了此案，Alsup是对Bartz v. Anthropic案作出判决的法官。Anthropic基于判决选择以15亿USD和解】

论心不论迹？-Bartz v. Anthropic案中被告援引SEGA v. Accolade案的抗辩

Psystar向第九巡回上诉法院提起上诉。

2011年，第九巡回上诉法院在判决中整体上维持了地区法院对Apple有利的结论，包括版权与DMCA核心判断。

法院认为：Psystar的做法不符合“合理使用”-四要素都不符合。

在使用的目的和性质判断上，法院认为：Psystar没有创造新作品，而是把Mac OS系统安装在未经苹果授权的硬件基底-其它品牌的PC上进行商业销售-这种行为不具有转换性。

现在让我们横向比较这两个案件，它们初看上去非常相似：一家小公司试图打破大公司的硬件-软件一体化的生态“垄断”。前案是试图在苹果电脑上运行PS游戏；后案是试图在非苹果PC上运行MAC操作系统，并且两案的最终判决法院都是第九巡回上诉法院，但两案的结果却截然相反，为什么？

一种可能的理解方向是：在前案中，虽然Connectix在开发过程中为了实现兼容性未经许可地反向工程&复制了BIOS代码，但最终的产品VGS中并不包括这些BIOS代码-VGS自身是一个新东西。

但在后案中，Psystar把Mac OS拷贝到克隆机后进行售卖，Psystar没有创造出 “新东西”。Psystar售卖的产品-一种Hybrid的电脑中亦不包含创新成分。

现在让回到文初的问题，可以看出，对于这一待决问题原告们和被告们的两种观点【生成式AI模型的训练过程究竟是对原作的压缩性拷贝？还是仅学习原作的抽象层（统计规律/模式）、而非表达层信息？】，可以相当不错地映射至上述两个案例的判决结论。

原告观点类似于Apple v. Psystar结论：生成式AI的训练过程是对训练材料的压缩性拷贝（甚至完全拷贝），而生成式AI的输出不过是对其训练材料无创新性的复制性兜售。

被告观点类似于Sony v. Connectix案结论：生成式AI的训练过程并非是对训练材料的拷贝，而是学习训练材料中的抽象模式和统计规律-这种东西在US版权法意义下一般不可版权，并且生成式AI的输出并非仅是对其训练材料的拷贝，而是可以有很多新东西的-比如所谓的智能涌现。

哪种说法更接近事实呢？

上述两种观点都有证据支持。对前者，在诸如NYT v. OpenAI，Disney v. Midjourney等案中，原告的举证一目了然: 模型生成的文章、图像与原作几乎/就是一模一样。

生成式AI诉讼领域不断进化的进攻策略-Susana v. Apple案

对后者，在诸如AlphaGo与人类对弈时下出的黑37手, Alphafold对蛋白质构型的预测，甚至AIGC生成的各种奇形怪状的图像似乎也可以证明：模型可以生成超出其训练材料的“新”东西。

转了一圈又回到了最困难的灰色区域：模型的训练过程既不是完全地拷贝其训练材料，也不是仅学习训练材料中的非表达信息（统计规律和模式）；而是两者兼有。用数学语言说大概是：模型的训练过程不是无损压缩，而是一种有损信息转换过程。【注：关于模型训练过程的数学理解目前由有很多研究，但是同样尚无共识或精确证明，也许这个问题不会有解析解】

那这样灰色的模型训练过程是否具有转换性呢？笔者倾向于认为不具有。部分原因在于：转换性需要以目的为基础，而目的是人类具有、但机器所没有的。【注：这不是版权法意义上的解释】

在上述两个案例中，不管最终结果如何，目的都是明确的：在Mac上运行PS游戏/在非苹果PC上运行Mac OS。但目前的生成式AI不论有多少参数，被宣传有多么智能，其自身仍没有任何目的；而它们的任何输出，都必须以人类解释才能获取意义。

至于为什么人类可以有目的而目前的AI没有。一种可能的解释在于：人生有限。人类在对抗时间的努力中内禀地拥有了目的和意义。但目前的A(G)I概念中缺乏时间因素。而从物理学角度看，信息是不灭的-“硅基智能”看起来优于人类的永存性反过来恰是其最大的本征缺陷。

对AGI降临论的主要批评者之一Gray Macus在《Rebooting AI》一书中写道：

“具体来说，我们需要停止构建仅仅越来越擅长检测数据集中的统计模式的计算机系统（通常使用深度学习方法），而是开始构建从组装那一刻起就固有地掌握三个基本概念的计算机系统：时间、空间和因果关系”。

不朽计算与可朽计算

AI能感知时间吗？-从爱死机第一季《冰箱里的文明》谈起

/*本文完全由人类写就*/