首页 > 其他 > NVIDIA、苹果等巨头被曝偷数据!违规用超17万个视频训练AI

NVIDIA、苹果等巨头被曝偷数据!违规用超17万个视频训练AI

AI 视频 数据
138 2024-07-17

果粉控7月17日消息,据媒体报道,包括NVIDIA、苹果、Salesforce和Anthropic在内的多家科技巨头,被曝光涉嫌违规使用数据,用于训练其AI模型。

这些公司被发现使用了超过173536个YouTube视频的字幕数据,而这些数据的获取并未得到视频创作者的许可。

这些公司所使用的数据集名为“YouTube Subtitles”,由非营利组织EleutherAI创建,该数据集包含了来自超过48000个频道的视频文本。

其中不乏知名教育机构和媒体公司的内容,例如可汗学院、麻省理工学院、哈佛大学等,此外,一些广受欢迎的YouTube创作者,如MrBeast等的视频也被包括在内。

此前,EleutherAI发布了名为“Pile”的数据汇编,其中的大部分数据集都是对公众开放的,包括YouTube Subtitles。

不过值得注意的是,苹果在使用Pile数据集训练OpenELM模型时,并未直接下载数据,因此在技术层面上,是EleutherAI违反了YouTube的使用条款。

YouTube明确禁止未经授权从平台获取素材,同时这些数据不仅用于训练AI,还可能涉及到版权和隐私问题。

创作者们也对此表示震惊和不满,因为他们并未被告知自己的作品被用于商业目的,更遑论从中获得任何补偿。

NVIDIA、苹果等巨头被曝偷数据!违规用超17万个视频训练AI

【本文结束】如需转载请务必注明出处:果粉控

责任编辑:黑白

文章内容举报

关于我们 | 广告服务 | 联系我们 | 免责声明 | 网站地图 | 友情链接

湘ICP备19005331号-4 2018-2024 guofenkong.com 版权所有.

果粉控是专业苹果设备信息查询平台,提供最新的IOS系统固件下载和相关APP应用及游戏下载,绿色无毒,下载速度快。

联系邮箱:guofenkong@163.com