使用Reddit上的数据进行AI训练，该付费吗？_老虎社区_美港股上老虎 - 老虎社区

点赞
评论
收藏

使用Reddit上的数据进行AI训练，该付费吗？

小斯新报道
08-01

$Reddit(RDDT)$ 首席执行官Steve Huffman对 $微软(MSFT)$ 、Anthropic $谷歌(GOOG)$ 和Perplexity $英伟达(NVDA)$ 等公司未经许可抓取Reddit网站数据的批评。

在接受The Verge采访时表示，这些公司未经许可就使用Reddit的数据来训练他们的人工智能模型。特别指出："Microsoft、Anthropic和Perplexity的行为就好像互联网上所有内容都可以免费供他们使用一样。"

与此形成对比的是，一些科技公司在抓取数据之前已经与Reddit建立了合作关系。例如， $谷歌(GOOG)$ 今年早些时候与Reddit达成了一项价值约每年6000万美元的协议，允许Google访问Reddit的内容来训练其AI模型。

同样，OpenAI也在3月份与Reddit签订了协议，允许ChatGPT实时学习Reddit的内容。这一事件凸显了大型科技公司和内容平台之间在数据使用方面的紧张关系。

随着AI技术的快速发展，高质量的训练数据变得越来越重要。Reddit作为互联网上最大的开放式对话档案之一，其内容自然成为了AI公司觊觎的对象。

这种情况引发了几个值得讨论的问题：

数据所有权：在互联网时代，谁拥有用户生成内容的所有权？是平台还是用户本身？
公平使用：AI公司使用公开可访问的网络内容进行训练，是否应该被视为"公平使用"？
数据价值：Reddit要求对其数据使用进行补偿，这是否意味着用户生成内容的商业价值正在上升？
法律和伦理：在缺乏明确法律规定的情况下，如何平衡技术创新与内容创作者权益？
竞争优势：像Google和OpenAI这样与Reddit达成协议的公司，是否会在AI竞赛中获得不公平的优势？

这一事件可能会推动更多关于数据使用、AI训练和内容权益的讨论和立法。它也可能促使更多内容平台重新评估其数据策略，以及与科技巨头的关系。

当然，也可能对Reddit的业绩带来更多的提升，如果这些大科技公司都付费的话。

# 【赌概率】奥运期间80%概率上涨！本周反弹有望？

免责声明：上述内容仅代表发帖人个人观点，不构成本平台的任何投资建议。

点赞

举报

评论

推荐
最新

empty

暂无评论

热议股票

关于我们·老虎社区守则·老虎社区账号管理规范·老虎社区服务协议·老虎社区隐私政策

公司名称：北京至简风宜信息技术有限公司

违法和不良信息投诉：010-5681-3562（工作时间9:30-18:30）

邮箱：service@laohu8.com

老虎社区侵权投诉指引

中国互联网举报中心·北京互联网举报中心

网络谣言曝光台·扫黄打非举报中心

网络110报警服务

© 2018-2024 老虎社区版权所有

营业执照：91110105MA01A4U55R

ICP备：京ICP备18016422号

网安备：京公网安备11010502036490

qrcode

关注我们

{"i18n":{"language":"zh_CN"},"data":{"magic":2,"id":333721242439848,"tweetId":"333721242439848","gmtCreate":1722502548870,"gmtModify":1722502854109,"author":{"id":279327367386116,"idStr":"279327367386116","authorId":279327367386116,"authorIdStr":"279327367386116","name":"小斯新报道","avatar":"https://static.tigerbbs.com/7ae5ca6ae332a96f7211e19a07d9c529","vip":2,"userType":2,"introduction":"美股市场达人&IPO小司机","boolIsFan":false,"boolIsHead":false,"crmLevel":1,"crmLevelSwitch":0,"individualDisplayBadges":[],"fanSize":13036,"starInvestorFlag":false},"themes":[{"themeId":"87065a3407c54ec4b0801977fa20d549","categoryId":"954722eadb8644018a4a5056fc8176eb","name":"【赌概率】奥运期间80%概率上涨！本周反弹有望？","type":0,"rnLink":"https://laohu8.com/RN?name=RNTheme&page=/theme/detail&rndata={\"themeId\":87065a3407c54ec4b0801977fa20d549}&rnconfig={\"headerBarHidden\": true}","description":"自2000年悉尼奥运会开始至今，每次夏季奥运期间，美股的整体表现不错，6次有5次都是涨的，奥运期间的美股赚钱效应不错。本届巴黎奥运会，7月26日开幕，8月11日闭幕，【你觉得本周美股会迎来反弹吗？你有关注哪些奥运项目或者相关概念股吗？】","image":"https://static.tigerbbs.com/fc5b3e16d4d56e91485bcd74763fe855"}],"images":[{"img":"https://static.tigerbbs.com/c9f42050936ffa9777c40d0f6b6afb93","width":"840","height":"625"}],"coverImages":[{"img":"https://static.tigerbbs.com/c9f42050936ffa9777c40d0f6b6afb93","width":"840","height":"625"}],"title":"使用Reddit上的数据进行AI训练，该付费吗？","html":"<html><head></head><body><p> <a data-mention-id=\"RDDT\" class=\"teditor-mention\" data-mention-name=\"Reddit\" href=\"https://laohu8.com/S/RDDT\">$Reddit(RDDT)$</a> 首席执行官Steve Huffman对 <a data-mention-id=\"MSFT\" class=\"teditor-mention\" data-mention-name=\"微软\" href=\"https://laohu8.com/S/MSFT\">$微软(MSFT)$</a> 、Anthropic <a data-mention-id=\"GOOG\" class=\"teditor-mention\" data-mention-name=\"谷歌\" href=\"https://laohu8.com/S/GOOG\">$谷歌(GOOG)$</a> 和Perplexity <a data-mention-id=\"NVDA\" class=\"teditor-mention\" data-mention-name=\"英伟达\" href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$</a> 等公司未经许可抓取Reddit网站数据的批评。</p><p>在接受The Verge采访时表示，这些公司未经许可就使用Reddit的数据来训练他们的人工智能模型。特别指出：\"Microsoft、Anthropic和Perplexity的行为就好像互联网上所有内容都可以免费供他们使用一样。\"</p><p>与此形成对比的是，一些科技公司在抓取数据之前已经与Reddit建立了合作关系。例如， <a data-mention-id=\"GOOG\" class=\"teditor-mention\" data-mention-name=\"谷歌\" href=\"https://laohu8.com/S/GOOG\">$谷歌(GOOG)$</a> 今年早些时候与Reddit达成了一项价值约每年6000万美元的协议，允许Google访问Reddit的内容来训练其AI模型。</p><p>同样，OpenAI也在3月份与Reddit签订了协议，允许ChatGPT实时学习Reddit的内容。这一事件凸显了大型科技公司和内容平台之间在数据使用方面的紧张关系。</p><p>随着AI技术的快速发展，高质量的训练数据变得越来越重要。Reddit作为互联网上最大的开放式对话档案之一，其内容自然成为了AI公司觊觎的对象。</p><p>这种情况引发了几个值得讨论的问题：</p><ol start=\"1\" style=\"list-style-type: decimal;\"><li><p>数据所有权：在互联网时代，谁拥有用户生成内容的所有权？是平台还是用户本身？</p></li><li><p>公平使用：AI公司使用公开可访问的网络内容进行训练，是否应该被视为\"公平使用\"？</p></li><li><p>数据价值：Reddit要求对其数据使用进行补偿，这是否意味着用户生成内容的商业价值正在上升？</p></li><li><p>法律和伦理：在缺乏明确法律规定的情况下，如何平衡技术创新与内容创作者权益？</p></li><li><p>竞争优势：像Google和OpenAI这样与Reddit达成协议的公司，是否会在AI竞赛中获得不公平的优势？</p></li></ol><p>这一事件可能会推动更多关于数据使用、AI训练和内容权益的讨论和立法。它也可能促使更多内容平台重新评估其数据策略，以及与科技巨头的关系。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/c9f42050936ffa9777c40d0f6b6afb93\" tg-width=\"840\" tg-height=\"625\"></p><p>当然，也可能对Reddit的业绩带来更多的提升，如果这些大科技公司都付费的话。</p></body></html>","htmlText":"<html><head></head><body><p> <a data-mention-id=\"RDDT\" class=\"teditor-mention\" data-mention-name=\"Reddit\" href=\"https://laohu8.com/S/RDDT\">$Reddit(RDDT)$</a> 首席执行官Steve Huffman对 <a data-mention-id=\"MSFT\" class=\"teditor-mention\" data-mention-name=\"微软\" href=\"https://laohu8.com/S/MSFT\">$微软(MSFT)$</a> 、Anthropic <a data-mention-id=\"GOOG\" class=\"teditor-mention\" data-mention-name=\"谷歌\" href=\"https://laohu8.com/S/GOOG\">$谷歌(GOOG)$</a> 和Perplexity <a data-mention-id=\"NVDA\" class=\"teditor-mention\" data-mention-name=\"英伟达\" href=\"https://laohu8.com/S/NVDA\">$英伟达(NVDA)$</a> 等公司未经许可抓取Reddit网站数据的批评。</p><p>在接受The Verge采访时表示，这些公司未经许可就使用Reddit的数据来训练他们的人工智能模型。特别指出：\"Microsoft、Anthropic和Perplexity的行为就好像互联网上所有内容都可以免费供他们使用一样。\"</p><p>与此形成对比的是，一些科技公司在抓取数据之前已经与Reddit建立了合作关系。例如， <a data-mention-id=\"GOOG\" class=\"teditor-mention\" data-mention-name=\"谷歌\" href=\"https://laohu8.com/S/GOOG\">$谷歌(GOOG)$</a> 今年早些时候与Reddit达成了一项价值约每年6000万美元的协议，允许Google访问Reddit的内容来训练其AI模型。</p><p>同样，OpenAI也在3月份与Reddit签订了协议，允许ChatGPT实时学习Reddit的内容。这一事件凸显了大型科技公司和内容平台之间在数据使用方面的紧张关系。</p><p>随着AI技术的快速发展，高质量的训练数据变得越来越重要。Reddit作为互联网上最大的开放式对话档案之一，其内容自然成为了AI公司觊觎的对象。</p><p>这种情况引发了几个值得讨论的问题：</p><ol start=\"1\" style=\"list-style-type: decimal;\"><li><p>数据所有权：在互联网时代，谁拥有用户生成内容的所有权？是平台还是用户本身？</p></li><li><p>公平使用：AI公司使用公开可访问的网络内容进行训练，是否应该被视为\"公平使用\"？</p></li><li><p>数据价值：Reddit要求对其数据使用进行补偿，这是否意味着用户生成内容的商业价值正在上升？</p></li><li><p>法律和伦理：在缺乏明确法律规定的情况下，如何平衡技术创新与内容创作者权益？</p></li><li><p>竞争优势：像Google和OpenAI这样与Reddit达成协议的公司，是否会在AI竞赛中获得不公平的优势？</p></li></ol><p>这一事件可能会推动更多关于数据使用、AI训练和内容权益的讨论和立法。它也可能促使更多内容平台重新评估其数据策略，以及与科技巨头的关系。</p><p class=\"t-img-caption\"><img src=\"https://static.tigerbbs.com/c9f42050936ffa9777c40d0f6b6afb93\" tg-width=\"840\" tg-height=\"625\"></p><p>当然，也可能对Reddit的业绩带来更多的提升，如果这些大科技公司都付费的话。</p></body></html>","text":"$Reddit(RDDT)$ 首席执行官Steve Huffman对 $微软(MSFT)$ 、Anthropic $谷歌(GOOG)$ 和Perplexity $英伟达(NVDA)$ 等公司未经许可抓取Reddit网站数据的批评。 在接受The Verge采访时表示，这些公司未经许可就使用Reddit的数据来训练他们的人工智能模型。特别指出：\"Microsoft、Anthropic和Perplexity的行为就好像互联网上所有内容都可以免费供他们使用一样。\" 与此形成对比的是，一些科技公司在抓取数据之前已经与Reddit建立了合作关系。例如， $谷歌(GOOG)$ 今年早些时候与Reddit达成了一项价值约每年6000万美元的协议，允许Google访问Reddit的内容来训练其AI模型。 同样，OpenAI也在3月份与Reddit签订了协议，允许ChatGPT实时学习Reddit的内容。这一事件凸显了大型科技公司和内容平台之间在数据使用方面的紧张关系。 随着AI技术的快速发展，高质量的训练数据变得越来越重要。Reddit作为互联网上最大的开放式对话档案之一，其内容自然成为了AI公司觊觎的对象。 这种情况引发了几个值得讨论的问题： 数据所有权：在互联网时代，谁拥有用户生成内容的所有权？是平台还是用户本身？ 公平使用：AI公司使用公开可访问的网络内容进行训练，是否应该被视为\"公平使用\"？ 数据价值：Reddit要求对其数据使用进行补偿，这是否意味着用户生成内容的商业价值正在上升？ 法律和伦理：在缺乏明确法律规定的情况下，如何平衡技术创新与内容创作者权益？ 竞争优势：像Google和OpenAI这样与Reddit达成协议的公司，是否会在AI竞赛中获得不公平的优势？ 这一事件可能会推动更多关于数据使用、AI训练和内容权益的讨论和立法。它也可能促使更多内容平台重新评估其数据策略，以及与科技巨头的关系。 当然，也可能对Reddit的业绩带来更多的提升，如果这些大科技公司都付费的话。","highlighted":1,"essential":1,"paper":2,"likeSize":0,"commentSize":0,"repostSize":0,"favoriteSize":0,"link":"https://laohu8.com/post/333721242439848","repostId":0,"isVote":1,"tweetType":1,"viewCount":3246,"commentLimit":10,"likeStatus":false,"favoriteStatus":false,"reportStatus":false,"symbols":["NVDA","GOOG","MSFT","RDDT"],"verified":2,"subType":0,"readableState":1,"langContent":"CN","currentLanguage":"CN","warmUpFlag":false,"orderFlag":false,"shareable":true,"causeOfNotShareable":"","featuresForAnalytics":[],"commentAndTweetFlag":false,"andRepostAutoSelectedFlag":false,"upFlag":false,"length":1377,"xxTargetLangEnum":"ZH_CN"},"commentList":[],"hasMoreComment":false,"orderType":2}