开元体育自ChatGPT等大型语言模型在今年年初吸引关注以来,作家对其侵犯版权的控告已经上演多轮。今年7月,莎拉·西尔弗曼 (Sarah Silverman)、理查德·卡德雷 (Richard Kadrey)和克里斯托弗·戈尔登 (Christopher Golden)三位作家针对Meta公司旗下的大型语言模型LLaMA提起诉讼。同月,包括玛格丽特·阿特伍德、乔纳森·弗兰岑 (Jonathan Franzen)、阮清越(Viet Thanh Nguyen)等在内的多位知名作家在美国作家协会(Authors Guild)组织下也签署了一封联名信,呼吁微软、Meta(互联网公司)等公司停止他们在未经同意的情况下,使用作家们的作品用于训练OpenA等语言模型。除此之外,今年9月,亚马逊为旗下Kindle图书内容制定新规,要求自行出版商(Self-publishers)在使用人工智能生成内容时对读者作出告知。
使用大型语言模型的公司也对此作出过回应。据介绍,Meta利用一个叫Books3的AI工具数据集训练LLaMa。这个数据集还收纳了包括扎迪·史密斯、史蒂芬·金等知名作家的作品。8月,《大西洋月刊》也刊文指出,彭博社也将该数据集用于训练旗下语言模型BloombergGPT。不过,本月初,彭博社的发言人表示,该公司并未使用Books3训练BloombergGPT的商用版本。而在9月,Meta对诉讼的回应是他们使用受版权保护的文本来训练LLaMa是一种“合理使用”。最初创见Books3的人工智能开发人员肖恩·普雷瑟(Shawn Presser)曾在采访中表示,他创建该数据集的目的恰恰是为了让任何人都可以开发和训练生成式人工智能,从而避免大公司的技术垄断。