站长之家 - 业界 2024-08-06 18:47

NVIDIA版Sora曝光!每天疯狂爬取80年时长视频

NVIDIA正紧锣密鼓地训练其未向公众发布的AI项目,内部代号为Cosmos

Cosmos项目专注于建立一个整合光学传输、物理和智能模拟的尖端视频模型,为下游应用提供支持,例如Omniverse 3D世界生成器、自动驾驶汽车系统和数字人产品。

泄露的内部文件显示,NVIDIA从Youtube和其他来源收集训练数据,以训练其AI产品。

为了获取训练视频,NVIDIA员工采用了开源的YouTube视频下载器yt-dlp,并通过刷新虚拟机IP地址来规避平台的反爬虫措施。

NVIDIA利用20到30台虚拟机,每天抓取相当于80年时长的视频,引发了有关版权法和平台服务条款的担忧。

对此,NVIDIA回应称其做法合法,但谷歌和奈飞均表示未与NVIDIA达成内容提取协议,并明确禁止在服务条款中抓取内容。

推荐关键词

24小时热搜

查看更多内容

大家正在看