
Számukra nincsenek tiltások
A Cloudflare kutatói saját tesztjeik során azt tapasztalták, hogy amikor a Perplexity hivatalos robotjai akadályba ütköztek, az MI egy rejtett, álruhás botot vetett be. Ez a bot cserélgette az IP-címeket, különböző internetes szolgáltatóktól indult, és így elkerülte a felismerést. Ilyen módszerekkel a Perplexity naponta több millió kérést küldött tízezer feletti weboldalhoz, könnyedén megkerülve a védelmi intézkedéseket.
Három évtizedes internetes normák sérültek
A robots.txt protokollt, amely az internetes etikett részének számít, 1994-ben vezették be, majd 2019-ben szabvánnyá nyilvánították. A szabály lényege, hogy a tulajdonos jelezheti: mely oldalakat tilos automatizált keresőknek elérniük. A Perplexity azonban mindezt teljesen figyelmen kívül hagyja, ráadásul más cégek is hasonlóan járnak el: a Reddit vezérigazgatója korábban a Microsoftot és az Anthropic nevű MI-céget is kritizálta, mert úgy viselkedtek, mintha minden internetes tartalom szabadon felhasználható lenne.
Tartalomlopás, válasz helyett csend
Számos médium – többek között a Forbes és a Vezeték Nélkül (Wired) – már azzal is megvádolta a Perplexity-t, hogy egész bekezdéseket, cikkeket emel át forrásmegjelölés nélkül. Nem egy esetben bizonyították, hogy a Perplexity manipulálta a robotazonosító kódját csak azért, hogy megkerülje a blokkolást. Mindezek után a Cloudflare bejelentette: megújítja szabályrendszerét, és már nem tekinti hivatalos keresőrobotnak a Perplexity-t, illetve zárol minden rejtett adatgyűjtést az oldalain.
A Perplexity képviselői továbbra sem reagáltak a vádakra.