Reddit tuži Perplexity zbog rudarenja podataka: Ključne činjenice o slučaju

  • Reddit je u New Yorku podnio tužbu protiv Perplexityja i tri kompanije zbog navodnog neovlaštenog izvlačenja podataka.
  • Perplexity negira optužbe i brani pravičan pristup javnom znanju; SerpApi i Oxylabs također odbacuju optužbe.
  • Platforma već licencira sadržaj od Googlea i OpenAI-a; podnijela je obavijest o prethodnom suđenju i navodi 40 puta veći broj preporuka za Reddit.
  • Slučaj, koji se tiče litvanske kompanije Oxylabs, dotakao je Evropu i ponovo rasplamsao debatu o prikupljanju podataka i pravima unutar regulatornog okvira EU.

Reddit tuži Perplexity zbog rudarenja podataka

Društvena mreža sa sjedištem u San Franciscu podnijela je zahtjev federalna tužba u New Yorku protiv Perplexity AI i nekoliko firmi povezanih s prikupljanjem podataka s weba, tvrdeći da su pribavili sadržaj s Reddita bez dozvole za korištenje alata zasnovanih na umjetnoj inteligenciji.

Prema dokumentu, Perplexity ne bi imao licencu za korištenje materijala platforme, dok je Reddit postigao sporazume s drugim tehnološkim kompanijama poput Googlea i OpenAI-a; osim toga, nakon... zahtjev za prestanak i odustajanje Kompanija je prošle godine podnijela tvrdnju da se spominjanja Reddita u Perplexityjevom sistemu povećala četrdeset puta.

Šta se prijavljuje

Reddit tvrdi da bi razne usluge skrapinga imale zaobiđene mjere protiv ekstrakcije sa platforme i prikupljenih publikacija putem rezultata Google pretrage, opisujući praksu kao „ekonomiju pranja podataka“ u industrijskim razmjerima.

U tužbi se navodi da bi Perplexity koristio barem jednog od ovih provajdera za dobijanje sadržaja sa Reddita, umjesto pretplatite se na licencu sa samom platformom, i da bi ekstraktori imali maskirane identitete i lokacije kako bi zaobišli kontrole.

Ko su ti koji su uključeni?

Pored Perplexityja, parnica ukazuje na Oxylabs UAB (Litvanija), domeni AWMProxy (koju Reddit opisuje kao povezanu s bivšim ruskim botnetom) i startupu SerpApi (Teksas), što slučaj stavlja na mapu koja miješa aktere iz Sjedinjenih Država i Evrope.

Odgovor tuženih kompanija

Perplexity je izjavio da još nije formalno obaviješten i da će snažno braniti pravo korisnika na pristup slobodno i pravedno javnom znanju, ističući da njen pristup ima za cilj pružanje tačnih odgovora pomoću vještačke inteligencije na odgovoran način.

Glasnogovornik SerpApija je u potpunosti odbacio optužbe i izjavio da kompanija žestoko će se braniti na sudu; Oxylabs je, sa svoje strane, izrazio iznenađenje i razočarenje, tvrdeći da nije primio prethodni kontakt od Reddita i braneći svoje prikupljanje javnih podataka.

Što se tiče AWMProxyja, platforma navodi da to nije bilo moguće prikupiti komentare entiteta.

Pozadina i licencni ugovori

Ovaj pravni korak nadopunjuje još jedan front koji je otvorio Reddit: u junu je podnio sličnu tužbu protiv kompanije za vještačku inteligenciju Anthropic, postupak koji još uvijek u toku nakon što je prebačen u savezni sud.

Reddit naglašava da njegova zajednica, sastavljena od hiljada subreddita i više od 100 miliona dnevnih korisnika, ključni je izvor internetskih razgovora, zbog čega je potpisao licence s Googleom, OpenAI-jem i drugim firmama za obuku modela.

Na berzi, nakon što su saznali za pravni postupak, dionice Reddita su zatvorile sesiju sa pad od preko 4% u New Yorku, što odražava osjetljivost tržišta na sporove oko podataka u sektoru umjetne inteligencije.

Implikacije za Evropu i Španiju

Prisustvo kompanije Oxylabs sa sjedištem u EU uvodi evropski ugao u kontroverzu i stavlja debatu na korištenje javnih podataka, scraping i ograničenja autorskih prava prema pravu EU.

Pored američkog spora, evropski igrači – uključujući izdavače, platforme i developere – i dalje pažljivo prate kako se uspostavlja ravnoteža pristup informacijama javno dostupno uz zaštitu prava i uslove korištenja, u kontekstu obilježenom Direktivom o autorskim pravima i novim regulatornim okvirom za umjetnu inteligenciju.

Šta Reddit traži i sljedeći koraci

Kompanija traži finansijska kompenzacija neodređeno i zabrana kojom se Perplexityju zabranjuje korištenje podataka s Reddita, do donošenja sudske odluke o tome da li su prekršena bilo kakva prava i o obimu bilo kakvih zabrana.

Proceduralni rokovi i podobnost odbrane tek trebaju biti definirani, ali sve ukazuje na ovaj slučaj. postavit će presedan u oblasti u kojoj se sukobljavaju javni interes za informacijama, intelektualnim vlasništvom i potrebe za obukom sistema vještačke inteligencije.

Bitka između platformi s velikim repozitorijima ljudskih razgovora i kompanija za vještačku inteligenciju se intenzivira: s licenciranjem s jedne strane i odbacivanjem optužbi s druge, spor između Reddita i Perplexityja... ilustruje novu ploču gdje se pregovara o vrijednosti, dozvolama i ograničenjima online podataka.

Kako kupiti od ChatGPT-2
Vezani članak:
Kupovina putem ChatGPT-a: Kompletan vodič za korištenje umjetne inteligencije u vašoj online kupovini