AI 机器学习是否可以援引新加坡版权法下的 "合理使用"作为抗辩理由?

R
Rouse

Contributor

Rouse is an IP services business focused on emerging markets. We operate as a closely integrated network to provide the full range of intellectual property services, from patent and trade mark protection and management to commercialisation, global enforcement and anti-counterfeiting.
在之前的文章中,我们讨论了针对机器学习(machine learning)...
Indonesia Intellectual Property
To print this article, all you need is to be registered or login on Mondaq.com.

尽管目前尚不存在相关判例,但新加坡法院可能会支持特定条件下在机器学习中使用他人版权作品的行为构成“合理使用”。

背景

在之前的文章 中,我们讨论了针对机器学习(machine learning)行为可以援引新加坡《版权法》下的计算分析条款(computational analysis provision)作为使用他人版权作品的抗辩理由。在本文中,我们将进一步对机器学习是否还可以援引新加坡《版权法》中的合理使用条款作为抗辩理由进行说明和论证。在有可能援引计算分析条款作为辩护理由的情况下,将合理使用作为机器学习中使用版权作品的抗辩理由这一讨论可能在一定程度上仅能停留在纯学术讨论层面。即便如此,在机器学习的背景下考虑合理使用抗辩仍然是有益的,尤其是在有可行案例可以支撑该抗辩的情况下。

类似实践案例中对“合理使用”原则的适用

尽管目前尚不存在直接的判例,新加坡上诉法院的一些判决可能对我们了解新加坡法院如何将新加坡《版权法》第35 条中的原则适用于机器学习具有指导意义。

  • Global Yellow Pages (GYP) 诉 [2017] SGCA 28

在“GYP 诉 Promedia”一案中,原告主张被告侵害了其企业名录和黄页目录之作品的版权。具体而言,被告在制作企业名录的过程中从原告的企业名录和黄页目录中获取数据,然后将这些数据加入自己的数据库。为了更方便地使用原告上述作品中的数据,被告可能使用了影印、扫描等方式来获取数据。

新加坡上诉法院基于多个理由驳回了原告提起的版权侵权诉讼,其中就包括支持被告援引版权法第 35(2) 条下的合理使用抗辩。在本案中,原告认为被告的侵权行为是对原告的作品进行影印和扫描,该行为的目的是让被告能够随时查阅这些作品中的数据。

上诉法院在审理过程中需要判断的是被告为了完成其企业名录中的条目,而通过影印/扫描原告的电话黄页的方式“访问数据”的行为是否能够援引合理使用条款进行抗辩。在判决中,上诉法院最终基于合理使用判定被告胜诉,在论述合理使用(第 35(2) 条)是否适用时,该法院提出需要考量的因素包括: 

  • 使用的目的和性质,包括此类使用是属于商业性质还是出于非营利性的教育目的;
  • 作品或改编作品的性质;
  • 相较于整个作品或改编作品而言,复制部分在其中所占的比例,以及复制的内容是否不合理地构成其中的实质性部分;
  • 使用行为对作品或改编作品的潜在市场或价值的影响;以及
  • 在合理时间内以普通市场价格获得作品或改编作品的可能性。

下表列明了上诉法院在本案中对以上 5 个考量因素的具体解释,并基于此得出了支持被告援引第 35 条下的合理使用作为抗辩理由的结论:

  因素 法院认为
1 使用的目的和性质 被告进行复印/扫描的目的是为了方便员工比较或识别其数据库中未包含的名录,并在此基础上更新其数据库。这种活动属于商业研究附带的“内部活动”,并不会影响原告作品取得版权的基础,即“数据的特定排列”这一独创性内容。因此,这一因素并不影响对于合理使用的认定。
2 作品的性质 在本案中,原告的作品得到版权法保护的要求“非常高”,“只有在几乎完全复制了原告的黄页,并且完全按照原告的排列方式来进行复制的情况下,才能初步认定构成侵权。”因此,作品的性质因素也有利于法院得出被告的使用属于第 35(2)(b) 条下合理使用的结论。
3 使用部分在版权作品中所占的比例,或者是否构成版权作品的实质性部分 上诉法院认为,由于本案中版权保护的范围较窄,不应过度关注第 35(2)(c) 条有关复制部分是否构成整个作品的实质性部分的规定。
4 使用行为对版权作品潜在市场或价值的影响 法院“不认为根据第 35(2)(d) 条,这种使用行为会侵占原告作品的潜在市场。如果被告使用的是原告的企业名录的打印件,而不是进行了复印或扫描,那么初步看来,被告的行为不会侵犯原告任何版权。”
5 在合理时间内以普通市场价格获得作品的可能性 “由于原告的作品是免费的,因此被告(在使用时)并不需要征求原告的许可,特别是在被告想要使用的内容本就是不受版权保护的事实内容的情况下。”


合理使用原则的解释

上诉法院对“合理使用”原则的以下解释,可能对我们在涉及机器学习的相关案件中如何援引此原则作为抗辩理由具有指导意义:

  1. 使用的目的和性质–  “如果侵权作品的目的/用途与原作相同,法院将倾向于认为不属于合理使用。”如果使用作品的目的是进行商业性使用(这只是法院需要考虑的众多因素之一),法院将倾向于认为这种使用行为不属于合理使用。
  2. 作品的性质– 这部分讨论旨在评估案件所涉作品类型“是否比其他作品更接近版权意图保护内容的核心,从而对此类作品所进行的复制更难成立合理使用”。相较于基于事实的作品而言,合理使用原则较难适用于基于虚构的作品,因为基于虚构的作品受到版权保护的部分没有那么“薄弱”。
  3. 使用部分在版权作品中所占的比例,或者是否构成版权作品的实质性部分– 此因素的关注点在于被告所复制内容的数量与价值(即质量方面的重要性),以及这部分内容的数量与价值相对于复制的目的而言是否合理。
  4. 使用行为对版权作品潜在市场或价值的影响– 法院不仅会关注被控侵权行为造成的损害,还会考虑如果不对这种行为加以制止,是否会对版权作品的潜在市场(包括衍生作品的市场)造成重大不利影响。
  5. 在合理时间内以普通市场价格获得作品的可能性– 如果被告可以以合理的市场价格、商业条款而获得该作品,则法院不太可能作出该使用行为可以适用“合理使用”的认定。

法院对“合理使用”原则之解释在机器学习场景下的适用

  1. 使用的目的和性质– 即便此因素可能对商业性的机器学习网站不利,但根据以上案件中上诉法院对此因素的解释,此因素在对于合理使用的认定上并不具有决定性的影响力。
  2. 作品或改编行为的性质– 如果机器学习过程中从事实性内容的网站中抓取数据,法院可能据此做出对使用机器学习行为有利的认定,因为对于事实性信息的获取/复制行为,可能被认为更加偏离“版权意图保护的内容的核心”。相反,如果被使用的作品是基于虚构(而非基于事实)创作或属于艺术表达,则法院可能据此做出对被告不利的认定。
  3. 使用部分在版权作品中所占的比例,或者是否构成版权作品的实质性部分– 在机器学习过程中,对抓取的数据是不加区分的,但我们从上诉法院对这个因素的应用和解释中可以看到,其并不具有决定性的影响力。法院认定的关键依然在于版权作品的性质。
  4. 使用行为对版权作品潜在市场或价值的影响- 如果被使用的内容是基于事实、并可以从多个网站上获取的,比如,这些内容可以同时在维基百科、Quora或Reddit上找到,那么可以认为这种使用对版权作品价值的潜在损害并不显著。相反,如果这些内容为某个网站所独有,则法院可能依据此因素做出对被告不利的认定。
  5. 在合理时间内以普通市场价格获得作品的可能性– 按照上诉法院的解释来看,这个因素并不非常重要。与其类似的逻辑是,既然网站能够供人浏览,那么当然也可以通过人工操作下载网站上的内容。不过,如果网站条款中有禁止或限制数据抓取的规定,则法院可能依据此因素做出对版权人有利的认定。

综上所述,笔者认为,如果机器学习抓取数据的对象是基于事实的内容或信息,则有很大概率可以成功援引第 35 条下的“合理使用”作为抗辩理由。

关于第 2 个因素(作品或改编作品的性质),人工智能的开发者可以采取措施防止或是尽量减少输出内容由于与版权作品构成实质性相似而被认为侵权。比如,针对输出内容进行定向过滤。在这个层面上,如果开发者的输出过滤技术足够强大或足够有效,即能够防止对用户生成与原始训练数据基本相似的输出,那么第二个因素就有可能对开发者有利。

笔者向 perplexity.ai 输入了一个问题,并收到了以下回复:

问题 – 避免 AI 聊天机器人输出内容侵犯版权的措施

回复 -  采用技术手段对输出内容进行过滤,在输出内容被提供给用户之前,检测并屏蔽可能侵犯他人版权的内容。这方面的措施包括过滤掉从已知版权作品中逐字复制的段落。

向用户提供明确的指南和服务条款,并在其中规定输出内容不得用于商业目的或侵犯知识产权。要求用户确保遵守相关规定并对其行为负责。

不过,即使采取了以上措施,仍然存在无意中侵犯版权的风险,尤其是在训练数据无意中包含了版权材料的情况下。有关  AI  生成内容的法律格局目前仍在发展完善之中,政策制定者正在努力解决版权所有权与合理使用之间的边界问题。目前的研究方向是通过开发更强大的技术手段,以求减少因  AI  能力进步而带来的侵权风险。

笔者认为,上述措施,如果确实能够付诸实践的话,可能会成为新加坡法院在判断机器学习场景是否可以援引新加坡《版权法》下的“合理使用”制度作为抗辩理由时的重要考量因素,特别是在训练数据集本质上属于事实信息的情况下。不过,需要注意的是,对于机器学习行为是否能够解释为新加坡版权法下的“合理使用”的问题,不同主体的观点可能并不一致。

目前尚不明确以上论述的观点是否会在新加坡法院或邻国马来西亚(该国《版权法》中同样包含合理使用条款)法院得到支持。

有关机器学习是否可以援引“合理使用”作为辩护理由系列文章的第二部分,请点击

The content of this article is intended to provide a general guide to the subject matter. Specialist advice should be sought about your specific circumstances.

See More Popular Content From

Mondaq uses cookies on this website. By using our website you agree to our use of cookies as set out in our Privacy Policy.

Learn More