潜精研思 笔耕不辍

出版物/Publications更多分类

地址:北京市东城区建国门内大街26号新闻大厦7-8层

电话:86 10 8800 4488, 6609 0088

传真:86 10 6609 0016

邮编:100005

国枫视角

AIGC的著作权应归属于谁

发布时间:2023.04.21 来源: 浏览量:2727

一、AI是什么?


AI是“人工智能”英文名“Artificial Intelligence”的缩写。人工智能是指由人制造出来的机器所表现出来的智能,通常是指通过计算机程序来呈现人类智能的技术。[1]在我国法律语境下,人工智能是指基于算法、模型、规则生成文本、图片、声音、视频、代码等内容的技术。[2]笔者理解,AI的内涵是人类制造的机器所表现出来的智能,其外延则应该是这种智能在各领域中的具体运用表现,例如机器学习能力、自然语言处理能力、计算机视觉技术等。前述“自然语言处理能力”体现的代表应该非目前大火的ChatGPT莫属。此外,结合“机器学习能力”和“计算机视觉技术”的AI绘画也是当下普通网友关注较多的另一AI应用领域,其代表包括Stable Diffusion和Midjourney等等。



(一)关于ChatGPT


2023年初,ChatGPT开始活跃于国内网友的视野中,笔者也是从这个时候开始认识到它的存在、功能和使用方式,并进一步了解到它将如何深入到我们的学习、工作和生活当中,开始思考其可能会对我们造成什么样的影响。ChatGPT的“问世”历时非常短,从发布至今仅仅不到5个月,其中的几个重要时间节点包括:

1. 2022年11月30日,美国OpenAI发布其研发的聊天机器人程序ChatGPT,并介绍它可以以对话的方式进行交互,它的训练目标是在接收到提示后,提供详细的回答。[3]

2. 2023年1月23日,OpenAI宣布和微软正在扩展合作伙伴关系,包括将合作开发的OpenAI技术集成到如GitHub Copilot和Microsoft Designer的应用程序中。[4]

3. 2023年3月14日,OpenAI宣布已经创建GPT-4,它是一个大型多模态模型(可接受图像和文本输入,并进行文本输出),虽然在许多实际场景中比人类表现稍差,但在各种专业和学术基准测试中表现出与人类水平相当的性能,这是OpenAI在深度学习扩展方面的最新里程碑。笔者理解,GPT-4是ChatGPT的迭代升级版,且这个升级仅仅用了不到4个月的时间。[5]

4. 2023年3月16日,微软发布博客介绍了Microsoft 365 Copilot,直译即“Microsoft 365的副驾驶”。微软介绍,其会在Microsoft 365 Copilot中嵌入OpenAI的ChatGPT,使得每个人都可以通过自然语言使用Microsoft 365。[6]笔者理解,微软发布的这一消息和前述OpenAI在2023年1月23日发布的消息吻合,即OpenAI正在和微软进行深度合作,把ChatGPT的技术嵌入到我们日常使用的Microsoft 365中,使得我们今后可以使用自然语言操作Microsoft 365,让人类的自然语言可以直接成为生产力。



1.jpg

该图片来自Microsoft网站


介绍完ChatGPT的发布过程,我们来回答“ChatGPT是什么?”这一问题。如前所述,笔者理解,ChatGPT是AI外延的一种,其具备自然语言处理能力。而关于这个问题最好的回答方式,就是把这个问题直接抛给ChatGPT,并由其输出答案。具体而言,当我们在ChatGPT的对话框中输入“ChatGPT是什么?”后,其提供了以下答案:“ChatGPT是一个基于GPT-3.5架构的大型语言模型,由OpenAI开发和训练。它可以用于各种自然语言处理任务,如文本生成、问答系统、翻译和语言理解等。ChatGPT是一个聊天机器人,可以进行人机对话,回答用户提出的问题或与用户进行对话交流。”这就是与ChatGPT进行一次简单对话的过程,从这个过程中,我们可以直观地感受到,ChatGPT是一个可以使用自然语言与人类进行信息交互的AI,它不仅能够“理解”人类输入的自然语言文字内容,也能够使用同样的自然语言按照不同国家的语言表达习惯输出符合问答逻辑的文字。

2.jpg

该图片来自OpenAI网站


(二)关于Stable Diffusion


目前,Stable Diffusion的影响力和知名度暂时没有ChatGPT那么大,为减少阅读压力,我们直接来回答“Stable Diffusion是什么?”这一问题。如前所述,笔者理解,Stable Diffusion也是AI外延的一种,其具备机器学习能力和计算机视觉技术。根据Stable Diffusion自己的介绍,其是一种从文本到图像的扩散模型,能够根据输入的文本生成逼真的照片级图像。[7]同样的,为了更好地理解前述较为抽象的定义,笔者认为最好的方式还是直接完成一次与Stable Diffusion的交互操作。具体而言,当我们在输入框中输入指令“a cartoon style picture that is full of different kinds of planets”(充满不同种类行星的卡通风格图片),Stable Diffusion在几秒钟内根据输入文字所表达的内容生成了以下四张符合文字含义的图片。从这个操作过程中,我们可以直观地感受到,Stable Diffusion能够“理解”人类输入的自然语言文字内容,并且能够输出基本符合该等自然语言文字内容所表达含义的图片。


3.png

该图片来自Stable Diffusion网站


二、AIGC是什么?



AIGC是“人工智能生成内容”英文名“AI Generated Content”的缩写。根据上文对AI的介绍,ChatGPT、GPT-4以及Microsoft 365 Copilot都可以通过接收人类输入的自然语言而输出文字,Stable Diffusion则可以输出图片(目前我们无法确定Microsoft 365 Copilot是否可以输出图片或其他内容,但根据微软介绍,Copilot将会被引入到包括Word、Excel、PowerPoint在内的应用中[8],而我们至少知道PowerPoint是可以输出图片的,所以今后Microsoft 365 Copilot的输出内容大概率也会包含图片)。这些通过AI可能生成的文字、图片、音频、视频等就是AIGC。



三、著作权法律意义上的作品


(一)《伯尔尼公约》


在国际法层面,有关著作权的规定主要体现在《伯尔尼保护文学和艺术作品公约》(以下简称“《伯尔尼公约》”)。《伯尔尼公约》最早于1886年签订,最近的一次修订是在1979年。关于“作品”,《伯尔尼公约》并未对其内涵进行定义,仅通过列举的形式说明了公约所保护的作品包括文学艺术作品,以及对其进行的翻译、改编、汇编等。在该等举例说明中,《伯尔尼公约》提及“凡由于对材料的选择和编排而构成智力创作的”应得到相应的保护,以及“如果未以某种物质形式固定下来便不受保护。”[9]笔者理解,受限于时代的背景,《伯尔尼公约》并未也无法对“作品”作出十分全面的、能够涵盖所有存在于当今社会作品形态的定义,但根据其对于应得到保护和不应得到保护情况的举例说明,可以看出《伯尔尼公约》对“作品”的判断标准至少包括“是智力创作”和“能以某种物质形式固定”,这也是我国修改和完善著作权法的主要依据。关于“作者”,《伯尔尼公约》亦没有直接进行定义,仅规定本公约保护的内容适用于“作者为本同盟任何成员国国民者”的作品。[10]笔者理解,《伯尔尼公约》认为“作者”是身为其成员国国民的自然人。

(二)我国著作权法


在我国著作权法中,“作品”被定义为“指文学、艺术和科学领域内具有独创性并能以一定形式表现的智力成果”,例如文字作品、美术、建筑作品、摄影作品、计算机软件等。[11]一般情况下,“作者”是指创作作品的自然人,当作品由法人或者非法人组织主持创作、代表其意志创作、并由其承担责任时,该法人或者非法人组织视为作者。[12]笔者理解,我国著作权法基于《伯尔尼公约》的规定,在同样采用举例说明方式的同时,对“作品”的内涵进行了明确的定义。此外,我国著作权法还对“作者”的范围进行了扩大,除自然人外,特殊情况下的法人或者非法人组织也可以被视为作者。这是我国立法者从中国国情出发,在确立著作权主体为自然人的前提下,规定符合规定条件的法人和非法人单位享有著作权的表现。[13]

(三)WIPO


世界知识产权保护组织(以下简称“WIPO”)认为,版权(或作者权利)是一个法律术语,用于描述创作者对其文学和艺术作品拥有的权利。[14]“作品”一词在版权语境中是指范围广泛的智力创作,从小说到建筑、计算机程序等等。其保护仅适用于表达,而不适用于思想、程序、操作方法或数学概念本身。[15]可以看出,同样地,WIPO对作品的定义也主要在强调是“智力创作”,并也采用了正面和负面的列举方式,对属于作品和不属于作品的内容进行了举例说明,以此来丰富其对“作品”的定义。WIPO对“作品”做出的前述定义虽然不构成任何形式的法律渊源,但作为一个关于知识产权服务、政策、信息和合作的全球论坛和一个联合国机构[16],笔者认为其对“作品”的理解是值得用作理论研究和参考的。




(四)判断标准


结合以上法律渊源和国际机构的观点,笔者认为,简单来说,作品是一种“智力成果”,判断一件事物是否构成“作品”需要至少考虑以下几个因素:第一,其是否具有独创性?第二,其是否能以一定形式表现?第三,其创作主体是否为为适用法律所定义的“作者”?

关于前两个因素,笔者认为将其作为判断标准已是著作权保护领域达成的普遍共识,《伯尔尼公约》和我国著作权法的规定中也都包含了这两方面的含义,在此不再赘述。

关于第三个因素,即作品的创作主体,其本身并没有被直接纳入到我国著作权法对“作品”的定义中,笔者认为其原因有二:第一,受限于过往的认知,人们普遍认为,智力成果只能来自于主观意识的表达,而具有主观意识的主体只能是自然人,或是在特定情况下被视为作品代表了其意志的法人或者非法人组织,作品的创作主体是不言而喻的,甚至可以说,人们不认为存在第三种创作主体,因此不需要将创作主体纳入到判断“作品”的标准中;第二,如前所述,事实上,我国著作权法另行对“作者”进行了定义,虽然其本意可能在于进一步说明作品著作权的归属问题,但也从侧面印证了前述第一点的说法,即,如果一定要谈及一项作品的“作者”,那么其只能是自然人和法人或者非法人组织,这也相当于对“作品”的定义打了一个“补丁”。综上,笔者认为,“作者”作为存在于“作品”本身特性(即前两个因素)以外的因素,其之所以未能被纳入判断标准的原因,可能并非人们经过深思熟虑后认为作者是谁不重要,而可能是人们没有思考过“一个具备独创性的并可以以一定形式表现的作品可能并不是由一个具有主观意识的主体创作出来的”这一问题,而在当下这个AI野蛮生长的时代,我们人类需要开始考虑这个问题。

四、AIGC是否构成著作权法律意义上的“作品”?


根据上文的论述,判断AIGC是否构成著作权法律意义上“作品”需要至少就三个因素进行分析。如本文第二部分所述,目前大部分AIGC是以文字、图画的形式存在,所以对于AIGC“是否能以一定形式表现?”笔者认为答案是明显而肯定的,该问题也不是本文讨论的重点,在此不再赘述。以下仅就另外两个因素,即AIGC的独创性和创作主体展开讨论。

(一)AIGC的生成过程


在讨论AIGC的独创性和创作主体之前,我们需要先了解其生成过程。根据AI的种类、功能等的不同,每一种AIGC的生产过程和原理都不一样。以Stable Diffusion为例,作为一个图像绘制AI,其目前的绘图过程可以简单地描述为:①使用者向Stable Diffusion输入一组包含prompt(即“提示词”,下同)的文本;②Stable Diffusion的文本理解组件ClipText将接收到的文本进行编码生成文本特征信息;③将文本特征信息和一个初始化的多维数组输入给Stable Diffusion的图像信息创建器;④图像信息创建器将通过一个复杂的“扩散”过程将接收到的前述信息生成一个经过处理的信息数组,并输入给Stable Diffusion的图像解码器;⑤图像解码器使用接收到的信息数组绘制出最终的图像。[17]为方便理解,前述过程可以用如下图示表示。需要说明的是,作为一个非计算机专业的人员,前述关于Stable Diffusion原理的描述仅是笔者基于自行阅读相关资料而做出的简要总结,所以不能排除存在错误或者不准确的情况。



image.png


(二)AIGC的独创性


关于独创性,《伯尔尼公约》并未进行规定,我国著作权法也未对其做进一步的解释,但《伯尔尼公约》和我国著作权法在对“作品”进行规定时分别强调了“智力创作”和“智力成果”这一与“智力”有关的关键点。笔者认为,理解“独创性”也应该从是否具备“智力”因素出发,分别从“独”和“创”两个方面进行理解:关于“独”,可以理解为要求作品具有区别于其他同类工作成果的独特的审美意义;关于“创”,可以理解为作品系经创作得到。而笔者认为后者是判断AIGC是否具有独创性的关键。根据我国著作权法律的规定,“创作”是指直接产生作品的智力活动。[18]此外,WIPO认为:“The creativity protected by copyright law is creativity in the choice and arrangement of words, musical notes, colors, shapes and soon.”[19]结合二者,笔者认为“创作”的含义可分为两层:在主观上,作者应具有开展智力活动的意愿,例如做出了包含“choice”和“arrangement”在内的主观干预;在客观上,作者应实际开展了智力活动,这一智力活动可以直接产生具有独特审美意义的作品。


那么,Stable Diffusion所生成的图像是否具有独创性呢?关于“独”,单纯从图像本身来看,Stable Diffusion生成的大多数图像相比于人类绘制的图像有过之而无不及,一般情况下是肯定具有独特审美意义的。关于“创”,如前所述,笔者认为这是判断AIGC是否具有独创性的关键。根据上文介绍,Stable Diffusion图像绘制场景的参与者可能包括使用者、AI(假设可以赋予AI主体身份)以及撰写AI代码的程序员。在主观意愿上,AI以及撰写AI代码的程序员很明显不具备创作图像的主观意愿,只有使用者在积极地向AI输入prompt以期获得符合自身需求的图像。在客观能力上,笔者认为是AI以及撰写AI代码的程序员对最终可以生成一幅具备独特审美意义的图像做出了主要智力(此处“智力”包括人工智能)贡献,使用者的贡献则仅仅体现在对“prompt”的选择过程中。也就是说,在使用Stable Diffusion生成图像的过程中,“创作”的主观因素和客观因素产生了分离,其并未如传统的美术创作过程一样统一在一个主体身上,这是我们从未遇到过的情况,也是目前著作权保护立法中的空白区域。然而需要说明的是,笔者发现,虽然使用者的参与仅仅体现在向AI输入prompt这一环节,但prompt内容、数量、排序、组合等的不同也会导致生成的图像的美学程度不同。例如,同样是为了获得一张“像素风格的人形机器猫”图像,如果输入的prompt较为简单,则只能获得下列左边的图像,如果输入的prompt较为丰富,则可以获得下列右边的图像。所以,如果在将来AI的发展过程中,人类需要学习和输入的内容逐渐增多、丰富、完整,即人类的智力对生成内容的干预比例逐渐提高,那么AIGC具备独创性的程度也将随之提高。


4.png

图片来自Stable Diffusion网站。

左图由输入的prompt“pixel art, robot cat”生成;
右图由输入的prompt“pixel art humanoid robot cat, in the style of celeste and hyper light drifter”生成。

(三)AIGC的创作主体



关于创作主体,还是以Stable Diffusion为例,上文提及Stable Diffusion图像绘制场景的参与者可能包括使用者、AI以及撰写AI代码的程序员,笔者对于是否可以将前述三个主体认定为创作主体的观点如下:


1. AI

如本文第三、(四)部分所述,在我国著作权法和《伯尔尼公约》中均未出现认可第三种类型(除自然人和法人或者非法人组织以外)作者的情况。事实上,相关案例在美国法院已经存在。2011年至2018年期间,发生了一系列关于猕猴使用属于摄影师Slater的设备拍摄的“自拍”照片的版权争议。关于这些“自拍”照片的版权所有者存在三种观点:Slater认为他拥有其版权,因为他通过前往印度尼西亚,与一群野生猕猴结为朋友,并以这样的方式设置他的摄影设备,从而才获得这些“自拍”照片;PETA(美国善待动物组织)认为其版权属于猕猴;维基媒体基金会认为其版权应由创作者拥有,而猕猴作为非人类的创作者不能拥有版权,因此这些“自拍”照片属于公共领域。最终,在PETA对Slater发起的诉讼案件中,美国法院驳回了PETA的起诉,认为根据美国法律,猴子不能拥有版权。[20]此外,在美国版权局于2023年3月10发布的《版权登记指南:包含人工智能生成材料的作品》的第I部分(背景)中,美国版权局介绍,其已于2018年拒绝了一份关于“由在机器上运行的计算机算法自主创作的”视觉作品的登记申请,因为它“没有任何人类的创造性贡献”。在该指南的第II部分(人类作者的要求)中,美国版权局认为,版权只能保护人类创造的产物,这一点是公认的,宪法和版权法中使用的“作者”一词将非人类排除在外。[21]

笔者认可上述美国法院和美国版权局的观点,即至少在现行法律体系下,不宜将动物、AI认定为创作主体。除了尚未存在法律支持这一主要原因,笔者认为其根本原因在于,如果人类可以赋予动物或者AI某种权利,那人类就应该同样可以赋予其义务,然而我们并不能强制要求动物或者AI去承担未履行义务情况下的法律责任,所以向其赋予权利和义务的做法不仅没有法律意义,也没有现实意义。


2. 撰写AI代码的程序员

众所周知,AI能够拥有如此强大的功能离不开为其撰写代码的程序员,正是由于程序员在撰写代码过程中主动开展了大量庞杂的智力活动,才能得到可以自动生成图像或其他各种内容的强大AI。然而,如本文第四、(二)部分所述,在Stable Diffusion进行图像绘制的过程中,程序员亦不存在开展智力活动进行图像创作的主观意愿。因此,笔者认为,虽然每一张精美的图像系依靠Stable Diffusion生成,而Stable Diffusion又是依靠程序员撰写的精湛代码才得以存在,但程序员仍不能被认定为Stable Diffusion所生成图像的创作主体,他仅仅是Stable Diffusion代码的创作主体。事实上,程序员在创作AI过程中所作出的智力贡献已经在AI代码的计算机软件著作权保护环节得到保护,而无需在每一个AIGC的著作权保护环节进行重复保护。

3. 使用者

使用者是在AIGC生成过程中唯一存在创作主观意愿的主体,然而由于AI功能的过分强大,一般情况下,使用者在客观上需要开展的智力活动非常少。如本文第四、(一)部分介绍,在Stable Diffusion生成图像的过程中,使用者仅仅需要输入prompt。但又如本文第四、(二)部分介绍,对于同样一个图像生成目标,使用者输入prompt的丰富程度高低很可能直接影响到生成图像的美学价值,而美学价值是判断图像独创性的重要标准。因此,笔者认为,在使用者实际开展的智力活动对提升由Stable Diffusion所生成图像美学价值作出足够大的贡献的情况下,应认定使用者为创作主体。

(四)结  论


通过上述对Stable Diffusion生成图像过程的介绍,以及对其所生成的图像的独创性及创作者的分析,笔者认为,由于使用者在每一张图像生成过程中的参与度不同,所以每一张图像是否构成著作权法意义上“作品”的结论也不尽相同。然而需要说明的是,AI的种类是多样的,因此AIGC的种类也是多样的,不同种类的AIGC以及其生成过程都可能存在很大的差异,这些内容和生成过程的不同最终可能都会对AIGC是否具有独创性、以及判断AIGC的创作主体产生影响。所以,关于“AIGC是否构成著作权法律意义上的‘作品’”这个问题,我们需要根据具体情况进行具体分析,不宜一概而论。

五、结语


我们正处在“法律滞后、技术先行”的AI爆发元年,AI或许可以在几分钟的训练过程中习得人类在过去几十年、几百年甚至几千年所累积的智慧,但人类立法者仍然需要花费足够多的时间去理解AI的技术原理和实践AI的运行机制,才可能制定出既符合AI运行逻辑又不违背人类社会价值体系的法律。我们不得不承认,AIGC的著作权归属问题暂时落入了现行法律的空白区域,即便是对AI技术最为了解的AI本身,也无法确认AIGC著作权应归属于谁。例如,Stable Diffusion认为,人工智能生成的图像及其所产生版权问题是很复杂的,并且因司法管辖区而异,通过其在线创建的图像是完全开源的,属于适用CC0 1.0 Universal Public Domain Dedication的公共领域范畴。[22]OpenAI则表示,在使用者遵守使用条款的前提下,同意将ChatGPT输出内容的所有权利和利益转让给使用者,使用者可以用于任何包括商业用途在内的目的。[23]事实上,它们都没有对AIGC的著作权归属问题作出回答,而是将这个问题“放在了原地”,并继续前行。


[1] 维基百科.人工智能[EB/OL]. [2023-04-08]. https://zh.wikipedia.org/wiki/%E4%BA%BA%E5%B7%A5%E6%99%BA%E8%83%BD

[2] 《生成式人工智能服务管理办法(征求意见稿)》第二条。

[3] OpenAI. Introducing ChatGPT [EB/OL]. [2023-04-08]. https://openai.com/blog/chatgpt

[4] OpenAI. OpenAI and Microsoft extend partnership [EB/OL]. [2023-04-08]. https://openai.com/blog/openai-and-microsoft-extend-partnership

[5] OpenAI. GPT-4 [EB/OL]. [2023-04-08]. https://openai.com/research/gpt-4

[6] Jared Spataro. Introducing Microsoft 365 Copilot – your copilot for work [EB/OL]. [2023-04-08]. https://blogs.microsoft.com/blog/2023/03/16/introducing-microsoft-365-copilot-your-copilot-for-work/

[7] Stable Diffusion. Stable Diffusion Online [EB/OL]. [2023-04-08]. https://stablediffusionweb.com/#features

[8] Jared Spataro. Introducing Microsoft 365 Copilot – your copilot for work [EB/OL]. [2023-04-08]. https://blogs.microsoft.com/blog/2023/03/16/introducing-microsoft-365-copilot-your-copilot-for-work/

[9] BERNE CONVENTION FOR THE PROTECTION OF LITERARY AND ARTISTIC WORKS (AS AMENDED ON SEPTEMBER 28, 1979) Article 2

[10] BERNE CONVENTION FOR THE PROTECTION OF LITERARY AND ARTISTIC WORKS (AS AMENDED ON SEPTEMBER 28, 1979) Article 3 (1)

[11] 《中华人民共和国著作权法》第三条。

[12] 《中华人民共和国著作权法》第十一条。

[13] 宋木文. 一部基本符合国际公约又具中国特色的著作权法——中国版权立法修法二十年(3)[R/OL]. [2023-04-10]. https://www.ncac.gov.cn/chinacopyright/contents/12227/346682.shtml

[14] WIPO. What is copyright? [EB/OL]. [2023-04-08]. https://www.wipo.int/copyright/en/

[15] WIPO. What is a “work”? What can be protected using copyright? [EB/OL]. [2023-04-10]. https://www.wipo.int/copyright/en/faq_copyright.html

[16] WIPO. What is WIPO? [EB/OL]. [2023-04-10]. https://www.wipo.int/about-wipo/en/index.html

[17]杨婷、徐佳渝. 35张图,直观理解Stable Diffusion [R/OL]. [2023-04-12]. https://mp.weixin.qq.com/s?__biz=MzU2NjU3OTc5NA==&mid=2247560326&idx=2&sn=b2502ddc5bf4ad45439bac3239996fd9&chksm=fca9ebbbcbde62adae5b216da72bfd0f13429edc7b5e1683e68d0848719c5c51c8f2715aac47&scene=27. 原文:Jay Alammar. The Illustrated Stable Diffusion[R/OL]. [2023-04-12]. https://jalammar.github.io/illustrated-stable-diffusion/

[18] 《中华人民共和国著作权法实施条例》第三条。

[19] WIPO. WIPO Intellectual Property Handbook [R]. (2004): 40

[20] WIKIPEDIA. Monkey selfie copyright dispute [R/OL]. [2023-04-13]. https://en.wikipedia.org/wiki/Monkey_selfie_copyright_dispute

[21] U.S. Copyright Office, Library of Congress. Copyright Registration Guidance: Works Containing Material Generated by Artificial Intelligence [R/OL]. [2023-04-13]. https://www.federalregister.gov/documents/2023/03/16/2023-05321/copyright-registration-guidance-works-containing-material-generated-by-artificial-intelligence

[22] Stable Diffusion. Frequently asked questions [EB/OL]. [2023-04-13]. https://stablediffusionweb.com/#faq

[23] OpenAI. Terms of use [EB/OL]. [2023-04-13]. https://openai.com/policies/terms-of-use

image.png