知名互联网论坛Reddit日前宣布对Perplexity、SerApi、OxyLabs、AWMProxy等公司提起法律诉讼,指控这些公司未经允许抓取Reddit论坛上的数据并进行非法使用。
此前Reddit已经起诉ClaudeAI模型开发商Anthropic指控后者未经授权抓取数据训练AI模型,对Reddit来说现在其海量帖子和用户数据就是最宝贵的财富,这可以出售给AI公司用来训练模型。
Perplexity抓取数据主要是为了训练自己的人工智能模型,其他三家公司则侧重于抓取数据出售给其他AI公司,这也算是另类互联网掮客,通过各种技术手段突破网站限制非法抓取数据,然后再将其出售给AI公司。
另外Perplexity还被发现不遵守robots.txt协议,也就是即便网站在文件中明确说明禁止其爬虫抓取,也会被Perplexity的爬虫忽略并继续抓取数据,robots.txt属于君子协定。
目前Reddit已经向Perplexity发出停止令,要求后者停止未经授权抓取Reddit论坛中的任意内容,不过Perplexity称并未使用Reddit数据,但测试显示Perplexity的聊天机器人回答中仍然会继续引用Reddit的内容,显然Perplexity在说谎。
不过Perplexity也给出自己的回应:Perplexity尚未收到诉讼通知,但我们将始终积极争取用户自由、公平获取公共知识的权利。我们始终秉承原则和负责任的态度,利用精准的人工智能提供事实回答,绝不容忍任何威胁开放性和公共利益的行为。

相关文章

头条焦点
精彩导读
关注我们
【查看完整讨论话题】 | 【用户登录】 | 【用户注册】