Reddit, yapay zekâ laboratuvarı Perplexity’ye ve üç veri kazıma şirketine karşı dava açtı. Şirket, bu kurumların platformundaki içerikleri yasa dışı şekilde topladığını ve bunları yapay zekâ modellerini eğitmek için kullandığını iddia etti.
Reddit, Perplexity’yi Veri Güvenliğini İhlâl Etmekle Suçladı
Reddit’in New York Güney Bölgesi Mahkemesi’ne sunduğu dilekçede, davalı şirketlerin Reddit’in veri koruma önlemlerini aşarak kullanıcıların içeriklerini “endüstriyel ölçekte” kopyaladığı belirtildi. Reddit, söz konusu eylemlerin telif hakkı ihlali niteliğinde olduğunu savundu.
Reddit, Perplexity’nin içerik toplamak için dolaylı yollar kullandığını ve Google arama sonuçlarından dahi veri çektiğini iddia etti. Şirket, Perplexity’yi “veriye ulaşmak için her yolu deneyen bir siber saldırgan” olarak nitelendirdi. Reddit, OpenAI ve Google gibi firmaların veri kullanımında anlaşma yaparken Perplexity’nin bu yolu tercih etmediğini belirtti.
Dilekçede, Perplexity’nin teknolojisinin “devrimsel” olmadığını, yalnızca başka bir büyük dil modelini (LLM) kullanarak elde ettiği verileri işlediğini öne sürdü. Reddit, şirketin “retrieval-augmented generation” (RAG) yöntemiyle kendi içeriğini kopyalayıp farklı bir ürün gibi sunduğunu ileri sürdü.
Reddit, davada Perplexity’nin yasa dışı veri kazıma faaliyetlerini kanıtlamak için kendi oluşturduğu bir “test gönderi”yi delil olarak sundu. Şirket, yalnızca Google arama motoru tarafından görülebilen gizli bir gönderi paylaştı. Gönderinin içeriği birkaç saat içinde Perplexity’nin arama sonuçlarında yer aldı. Bu olay, Reddit’in iddialarını güçlendiren somut bir kanıt olarak değerlendirildi.
Reddit, Mayıs 2024’te Perplexity’ye gönderdiği “ihtar mektubu”nda şirketten robots.txt dosyasına uymasını istemişti. Perplexity’nin bunu kabul ettiğini belirten Reddit, buna rağmen platformdan yapılan alıntıların sayısının kırk kat arttığını söyledi.
Benzer bir şikâyetin daha önce Cloudflare tarafından da gündeme getirildiği hatırlatıldı. Cloudflare, Perplexity’nin robots.txt dosyalarını görmezden geldiğini ve güvenlik duvarlarını aşmak için gizli tarayıcılar kullandığını açıklamıştı. Reddit, mahkemeden Perplexity ve iş birliği yaptığı veri kazıma şirketlerinin faaliyetlerini durdurmasını istedi. Şirket ayrıca, izinsiz içerik kullanımı sonucu elde edilen tüm kazançların iadesini talep etti.
Perplexity, Reddit’in veri mücadelesinde hedef aldığı son yapay zekâ laboratuvarı oldu. Reddit, haziran ayında Anthropic’e karşı da benzer bir dava açmıştı. Şirket, o dönemde de izinsiz veri toplama faaliyetlerinin platformun kullanım şartlarını ihlâl ettiğini öne sürmüştü.