
Harc az adatokért
A New York-i szövetségi bíróságon benyújtott kereset nemcsak a Perplexityt, hanem három további közreműködőt is megnevez: az Oxylabs nevű litván adatgyűjtőt, az orosz AWMProxy-t és a texasi SerpApi-t. Ezek a cégek a Reddit szerint elrejtették valódi kilétüket, helyüket, és úgy tettek, mintha hétköznapi felhasználók lennének, miközben valójában szisztematikusan másolták le a fórum tartalmait.
A Reddit egyébként több mint 100 000 tematikus közösséget üzemeltet, így az egyik legnagyobb és legaktívabb digitális beszélgetésgyűjteménynek számít. Az MI-fejlesztők számára felbecsülhetetlen értékű adathalmazt jelent, hiszen a nagy mennyiségű, moderált, emberi párbeszéd segíti az MI-k építését. Nem véletlen, hogy a Reddit már korábban is perelt hasonló okból; most éppen az Anthropic nevű MI-céggel is perben áll.
Álláspontok ütközése
A Perplexity visszautasítja a Reddit vádjait, sőt zsarolással és a nyílt internet elleni támadással vádolja a közösségi oldalt. Véleményük szerint ők nem tréningezik saját MI-jüket a Reddit tartalmaival, csak nyilvános hozzászólásokat összegzik és hivatkoznak rájuk, ezért szerintük felesleges licencdíjat fizetniük. Hasonlóan védekezik a SerpApi is, amely bírósági fellépést ígér.
A Reddit viszont azt állítja: folyamatosan kizárólag licencialapú szerződésekkel ad engedélyt MI-fejlesztőknek az adathozzáférésre (így tett például az OpenAI-jal és a Google-lel is). Szerintük a scraper-cégek ipari szinten fosztogatják a webet, majd a szerzett adatokat eladják az MI-re éhes vásárlóknak – miközben a Redditből származó tartalom vált a Perplexity leggyakrabban idézett forrásává.
Az aranybánya ára
A Reddit határozottan fogalmaz: az MI-cégek között versenyfutás zajlik a jó minőségű, emberi tartalomért, ami mára óriási üzlet lett. Tavaly például a Reddit vezetője elmondta, hogy már a vállalat bevételének közel 10%-át adják a Google- és OpenAI-licencszerződések – vagyis az adathasznosításból élnek meg. A Perplexity szerint viszont mindez csak azt mutatja, milyen messzire jutott a nyilvános adatok privatizálása.