人工智能

Reddit宣布起诉Perplexity等未经授权抓取数据训练AI模型

字号+作者:蓝点网 来源:蓝点网 2025-10-23 12:13 评论(创建话题) 收藏成功收藏本文

知名互联网论坛Reddit日前宣布对Perplexity、SerApi、OxyLabs、AWMProxy等公司提起法律诉讼,指控这些公司未经允许抓取Reddit论坛上的数据并进行非法使'...

知名互联网论坛Reddit日前宣布对Perplexity、SerApi、OxyLabs、AWMProxy等公司提起法律诉讼,指控这些公司未经允许抓取Reddit论坛上的数据并进行非法使用。UlI品论天涯网

UlI品论天涯网

此前Reddit已经起诉ClaudeAI模型开发商Anthropic指控后者未经授权抓取数据训练AI模型,对Reddit来说现在其海量帖子和用户数据就是最宝贵的财富,这可以出售给AI公司用来训练模型。UlI品论天涯网

Perplexity抓取数据主要是为了训练自己的人工智能模型,其他三家公司则侧重于抓取数据出售给其他AI公司,这也算是另类互联网掮客,通过各种技术手段突破网站限制非法抓取数据,然后再将其出售给AI公司。UlI品论天涯网

另外Perplexity还被发现不遵守robots.txt协议,也就是即便网站在文件中明确说明禁止其爬虫抓取,也会被Perplexity的爬虫忽略并继续抓取数据,robots.txt属于君子协定。UlI品论天涯网

目前Reddit已经向Perplexity发出停止令,要求后者停止未经授权抓取Reddit论坛中的任意内容,不过Perplexity称并未使用Reddit数据,但测试显示Perplexity的聊天机器人回答中仍然会继续引用Reddit的内容,显然Perplexity在说谎。UlI品论天涯网

不过Perplexity也给出自己的回应:Perplexity尚未收到诉讼通知,但我们将始终积极争取用户自由、公平获取公共知识的权利。我们始终秉承原则和负责任的态度,利用精准的人工智能提供事实回答,绝不容忍任何威胁开放性和公共利益的行为。UlI品论天涯网

本网除标明“PLTYW原创”的文章外,其它文章均为转载或者爬虫(PBot)抓取; 本文只代表作者个人观点,不代表本站观点,仅供大家学习参考。本网站属非谋利性质,旨在传播马克思主义和共产主义历史文献和参考资料。凡刊登的著作文献侵犯了作者、译者或版权持有人权益的,可来信联系本站删除。 本站邮箱[email protected]