为训练AI不择手段！Meta被曝下载数十TB盗版电子书

一名图书作者指控 Meta 非法下载大量盗版电子书，用于训练其 AI 模型。

泄露的电子邮件表明，Meta 承认下载了有争议的 LibGen 数据集，其中包含数千万本盗版书籍。

训练 AI 不择手段！Meta 被曝下载数十 TB 盗版电子书

根据法庭文件，Meta 通过安娜档案（Annas Archive）下载了至少 81.7TB 的数据，其中 35.7TB 来自 Z-Library 和 LibGen。Meta 还被指控从 LibGen 额外下载了 80.6TB 的数据。

作者声称，Meta 的行为构成了非法下载，而这些数字可能只是其盗版行为的一小部分。

作者估计，这些盗版电子书库可能仅占 Meta 盗版版权作品总量的 0.008%，表明其盗版的规模可能远超目前所揭露的。

电子邮件还显示，Meta 员工意识到其行为的法律风险。2023 年 4 月，Meta 的研究工程师尼古拉·巴什科夫在邮件中表示：“用公司的笔记本电脑下载 BT 感觉不妥。”

到 2023 年 9 月，巴什科夫加大了抗议力度，并咨询了法律团队。他指出，使用 Torrent 意味着对文件进行“播种”，即对外共享内容，在法律上是不允许的。

但 Meta 仍决定继续，并试图通过将数据集下载到非 Meta 服务器来避免被追溯的风险。

自变量发布QUANXTA Zero系列无本体数采方案，从具身模型反向定义数采基建

2026-07-021.6万阅读

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

为训练AI不择手段！Meta被曝下载数十TB盗版电子书

推荐关键词

24小时热搜

大家正在看

Meta研发超级感知AI眼镜支持持续录音自动抓拍

不用写代码！Meta上线新应用Pocket：AI一键做小游戏

苹果首款智能眼镜明年6月发布：无屏幕！类似Meta、华为

AI日报：Claude Cowork登陆网页和手机端；美国放行GPT-5.6；Meta超级智能实验室首发图像生成模型

做智驾十年，为何Momenta上市换锚？

Metix AI 完成550万美元种子轮融资

自变量发布QUANXTA Zero系列无本体数采方案，从具身模型反向定义数采基建

无需NVLink，百度百舸AI Infra工程优化拉满 Cosmos 3 训练吞吐

理想AI眼镜Livis升级：接入小红书Agent 逛街不用掏手机

百度智能云完成64B世界模型512卡训练验证支撑大模型高效Scale

Testin XAgent实战解析：大模型+视觉自愈如何重构自动化测试工程

蚂蚁灵波世界模型2.0正式发布！两大首创：小时级实时生成+Agent实时“陪玩”

中茵微电子亮相WAIC智能趋势论坛 AI ASIC芯片定制平台赋能工业AI落地

10万小时真实数据预训练！小米发布机器人基座模型Xiaomi-Robotics-1

AI日报：开源模型Kimi K3登场；Google Vids引入Gemini Omni模型；智谱AI冲击10亿美元ARR

PrimeDay之后，易仓WMS后台8000+海外仓的数据显示，订单数据变了！

支持影视飓风100小时荒岛直播！阿里升级Fun-ASR-Realtime实时识别：精度比肩离线模型

AI日报：Kimi K3登顶全球最大开源模型；小度AI手表Fit开售；我国启动大模型 IPv6 专项行动

AI时代CoWoS先进封装需求爆发，天贺电子抢占高阶塑封国产替代新机遇

苹果研发AI模型压缩技术：把270亿参数大模型装进iPhone

首页

IT业界

热点视频

站长资讯

好物榜

更多分类

更多主题

为训练AI不择手段！Meta被曝下载数十TB盗版电子书

推荐关键词

24小时热搜

大家正在看

Meta研发超级感知AI眼镜 支持持续录音自动抓拍

不用写代码！Meta上线新应用Pocket：AI一键做小游戏

苹果首款智能眼镜明年6月发布：无屏幕！类似Meta、华为

AI日报：Claude Cowork登陆网页和手机端；美国放行GPT-5.6；Meta超级智能实验室首发图像生成模型

做智驾十年，为何Momenta上市换锚？

Metix AI 完成550万美元种子轮融资

自变量发布QUANXTA Zero系列无本体数采方案，从具身模型反向定义数采基建

无需NVLink，百度百舸AI Infra工程优化拉满 Cosmos 3 训练吞吐

理想AI眼镜Livis升级：接入小红书Agent 逛街不用掏手机

百度智能云完成64B世界模型512卡训练验证 支撑大模型高效Scale

Testin XAgent实战解析：大模型+视觉自愈如何重构自动化测试工程

蚂蚁灵波世界模型2.0正式发布！两大首创：小时级实时生成+Agent实时“陪玩”

中茵微电子亮相WAIC智能趋势论坛 AI ASIC芯片定制平台赋能工业AI落地

10万小时真实数据预训练！小米发布机器人基座模型Xiaomi-Robotics-1

AI日报：开源模型Kimi K3登场；Google Vids引入Gemini Omni模型；智谱AI冲击10亿美元ARR

PrimeDay之后，易仓WMS后台8000+海外仓的数据显示，订单数据变了！

支持影视飓风100小时荒岛直播！阿里升级Fun-ASR-Realtime实时识别：精度比肩离线模型

AI日报：Kimi K3登顶全球最大开源模型；小度AI手表Fit开售；我国启动大模型 IPv6 专项行动

AI时代CoWoS先进封装需求爆发，天贺电子抢占高阶塑封国产替代新机遇

苹果研发AI模型压缩技术：把270亿参数大模型装进iPhone

Meta研发超级感知AI眼镜支持持续录音自动抓拍

百度智能云完成64B世界模型512卡训练验证支撑大模型高效Scale