品玩7月17日讯,据 Wired 报道,包括苹果、英伟达等多家设计 AI 大模型业务的科技巨头正在使用未经授权的视频素材来训练大模型。
据报道,这些公司正在利用 YouTube上的视频素材来训练大模型,而这些行为并没有获得创作者的授权。而这违反了 YouTube 禁止从平台上未经许可抓取内容的规定。据悉,超过 17.3 万个来自 4.8 万个频道的 YouTube 视频字幕文件被用来训练人工智能模型,其中就包括苹果、英伟达、Salesforce 等硅谷巨头。
据报道,下载这些字幕文件的是一个名为 EleutherAI 的非营利组织,他们声称其目的是帮助开发者训练 AI 模型。虽然 EleutherAI 的初衷可能是为小型开发者和学术研究者提供训练材料,但该数据集也被苹果等科技巨头使用。
精彩评论