我们使用联盟链接。它们让我们能够维持运营,而您无需承担任何费用。

Reddit 起诉 Perplexity, Oxylabs,另外两家网络数据提供商

互联网头版 就其数据“非法盗窃”提起诉讼。 

亚当·杜波依斯

10 月 22 日星期三,Reddit 启动 针对人工智能搜索引擎 Perplexity 提起的法律诉讼。该诉讼还提到了另外三家网络数据提供商: Oxylabs、SerpApi 和 AWMProxy。 

Reddit 在纽约联邦法院提起诉讼,指控这四家公司从谷歌搜索引擎中抓取 Reddit 内容。 

Reddit 对涉嫌违规行为的描述生动地将这三家网络抓取公司与 “银行劫匪闯入一辆载有现金的装甲卡车” 和困惑 “朝鲜黑客” 雇佣他们窃取平台的 “天上的吗哪”

提供的示例声称,在 2025 年 7 月的两周内,被告抓取了超过 30 亿个包含 Reddit 文本、图像、视频和 URL 的 Google 搜索引擎页面。

2025 年 7 月两周内谷歌数据抓取规模
这些数据是通过向谷歌发出的传票获得的。来源:Reddit 的诉讼。

Reddit 的论点是,尽管收到了勒令停止函,Perplexity 仍继续(甚至扩大)抓取平台数据,绕过了 Reddit 和谷歌建立的保护系统。为了证实其怀疑,Reddit 植入了一个只有谷歌爬虫才能访问的蜜罐页面。

换句话说,原告对Perplexity选择不像谷歌或OpenAI那样购买其数据感到不满,反而“不择手段地获取宝贵的版权内容”。Reddit声称,这损害了Perplexity的商业和声誉,违反了《数字千年版权法》的多项规定,导致不正当竞争、不当得利,甚至构成民事共谋。 

作为补偿,Reddit 请求法院阻止被告抓取 Google 和 Reddit 的数据,停止出售其数据,并赔偿 Reddit 所遭受的损失。 

困惑和 Oxylabs 对该诉讼做出了反应。 

讽刺的是,Perplexity 的回应 出现在Reddit上,说 “这是一个令人悲伤的例子,说明当公共数据成为上市公司商业模式的重要组成部分时会发生什么。”,并且诉讼 “这是 Reddit 与 Google 和 OpenAI 在训练数据谈判中展示实力”.

Oxylabs” 代表德纳斯·格里鲍斯卡斯 表示 震惊和失望 “因为 Reddit 没有尝试直接与我们交谈或传达任何潜在的担忧”。 He added that他补充说 “Oxylabs 提供合规访问公开信息的基础设施,我们要求每位客户合法使用我们的服务”。

我们认为 Reddit 的诉讼很奇怪。根据该平台的 自己的规则, Reddit 平台的大部分内容都是公开的,任何人都可以访问,即使没有账户也可以。这是有意为之。 此外,尽管 Reddit 获得了使用用户发布内容的许可,但其所有权仍属于用户。最后,Reddit 的声明涉及的信息甚至不在其平台上托管——那么,为什么不起诉谷歌将这些信息提供给其他人呢?

reddit 自称是一个公共平台
真的吗?资料来源:Reddit 的公共内容政策。

目前,美国法院对收集公共网络数据持积极态度。去年,X Corp. 在其 针对 Bright Data。然而,判例法仍未巩固,随意概括个别判决将是危险的。 

Reddit 已经限制内容访问一段时间了。2023 年,该平台 开始充电 API 访问,严重阻碍了其充满活力的第三方工具生态系统。后来,许多使用数据中心或 VPN IP 地址的用户无法在不登录的情况下打开网站。Reddit 的控制行为也延伸到了诉讼,当时该公司 起诉Anthropic另一家人工智能初创公司于今年早些时候。