一名图书作者指控 Meta 非法下载大量盗版电子书,用于训练其 AI 模型。
泄露的电子邮件表明,Meta 承认下载了有争议的 LibGen 数据集,其中包含数千万本盗版书籍。
根据法庭文件,Meta 通过安娜档案(Annas Archive)下载了至少 81.7TB 的数据,其中 35.7TB 来自 Z-Library 和 LibGen。Meta 还被指控从 LibGen 额外下载了 80.6TB 的数据。
作者声称,Meta 的行为构成了非法下载,而这些数字可能只是其盗版行为的一小部分。
作者估计,这些盗版电子书库可能仅占 Meta 盗版版权作品总量的 0.008%,表明其盗版的规模可能远超目前所揭露的。
电子邮件还显示,Meta 员工意识到其行为的法律风险。2023 年 4 月,Meta 的研究工程师尼古拉·巴什科夫在邮件中表示:“用公司的笔记本电脑下载 BT 感觉不妥。”
到 2023 年 9 月,巴什科夫加大了抗议力度,并咨询了法律团队。他指出,使用 Torrent 意味着对文件进行“播种”,即对外共享内容,在法律上是不允许的。
但 Meta 仍决定继续,并试图通过将数据集下载到非 Meta 服务器来避免被追溯的风险。