数千名作家联名写信敦促AI行业停止窃取图书

开济谈国际 2023-07-20 08:41:02

如果你要求 GPT-4 以卡门-马查多(Carmen Machado)、玛格丽特-阿特伍德(Margaret Atwood)或亚历山大-谢(Alexander Chee)的风格来写一段文字,它一定能完成得很好,这是有充分理由的:它很可能在训练过程中吸收了他们的所有作品,现在将他们的聪明才智用于自己的创作。但这些作家以及成千上万的其他作家对此并不满意。

阅读联名信全文:

https://actionnetwork.org/petitions/authors-guild-open-letter-to-generative-ai-leaders

在一封由 8500 多名小说、非小说和诗歌作者签署的公开信中,ChatGPT、Bard、LLaMa 等大型语言模型背后的科技公司被指责未经许可或补偿使用了他们的作品。

"这些技术模仿和复制了我们的语言、故事、风格和思想。数以百万计的受版权保护的书籍、文章、散文和诗歌为人工智能系统提供了'食物',这些无穷无尽的'大餐'没有产生任何账单,"信中写道。

尽管人工智能系统被证明能够引用和模仿相关作者的作品,但人工智能开发者并没有实质性地解决这些作品的出处问题。它们是根据从书店和评论中搜罗的样本进行训练的吗?每本书都是从图书馆借来的吗?又或者,它们只是下载了许多非法档案,比如 Libgen?

有一点是肯定的: 他们没有去出版商那里获得授权--毫无疑问,这是首选的方法,也可以说是唯一合法和合乎道德的方法,作者写道。

最高法院最近在沃霍尔诉戈德史密斯一案中的判决不仅明确指出,AI使用具有高度的商业性,这与合理使用相悖,而且没有法院会将复制非法来源的作品作为合理使用的借口。将我们的作品嵌入你们的系统后,生成式人工智能可能会损害我们的专业,因为基于我们作品的平庸的机器写作书籍、故事和新闻会充斥市场。

事实上,我们已经看到了这种情况的发生。最近,一些由人工智能生成的质量极低的作品登上了亚马逊的青年文学畅销书排行榜;出版商被大量生成的作品所淹没;每天,这个网站(以及不久之后的这篇文章)的内容都会被搜刮,以便被改编成用于搜索引擎优化的内容。

这些恶意行为者正在使用 OpenAI 和 Meta 等公司开发的工具、API 和代理,在这种情况下,这些公司本身也可以说是恶意行为者。毕竟,还有谁会在知情的情况下窃取数以百万计的作品来为新的商业产品提供动力呢?(当然,还有Google--但搜索索引与人工智能摄取有本质区别,而且Google图书至少还有一个借口,那就是它本来就是一个专用索引)。

公开信警告说,由于大规模出版的复杂性和狭小的利润空间,能够靠写作谋生的作者越来越少,这对他们来说是一种难以维持的局面,尤其是新作者,"特别是年轻作者和来自代表性不足的群体的声音"。

信中要求这些公司做到以下几点:

1. 获得在生成式人工智能程序中使用我们受版权保护的材料的许可。

2. 对过去和现在在生成式人工智能程序中使用我们作品的作家给予公平补偿。

3. 在人工智能输出中使用我们的作品时,无论根据现行法律这些输出是否侵权,都要公平地补偿作者。

没有任何法律威胁--正如作家协会首席执行官(也是签字人)玛丽-拉森伯格(Mary Rasenberger)对美国国家公共广播电台(NPR)所说:"诉讼是一笔巨大的开支。诉讼需要很长的时间"。现在,人工智能正在伤害作者。

哪家公司会第一个说"是的,我们的人工智能是建立在被盗作品的基础上的,我们很抱歉,我们会为此付出代价"?但这样做的动力似乎不大。大多数人并没有意识到,也不关心 LLM 是通过什么非法手段创造出来的,它们实际上可能包含并转录了受版权保护的作品。当生成的图像再现了艺术家的独特风格时,人们更容易看到这个(非常相似的)问题,也会有一些反弹。

但是,把乔治-桑德斯或戴安娜-加伯顿的所有作品作为人工智能的"食物",这种微妙的危害可能不会刺激那么多人采取行动--尽管有很多作者已经做好了斗争的准备。

0 阅读:27

开济谈国际

简介:感谢大家的关注