A MI-kereső kijátssza a szabályokat: újabb botrányban a Perplexity

A Perplexity nevű MI-keresőmotor rendszeresen kijátssza azokat a korlátozásokat, amelyekkel a weboldalak próbálják megakadályozni az automatizált adatgyűjtést – derült ki a Cloudflare legújabb vizsgálatából. Miközben számos weboldal egyértelműen letiltotta a Perplexity botjait a robots.txt fájlban vagy tűzfalbeállításokkal, a kereső MI-szolgáltatása ennek ellenére is elérte és letöltötte a weboldalak tartalmát.

Számukra nincsenek tiltások

A Cloudflare kutatói saját tesztjeik során azt tapasztalták, hogy amikor a Perplexity hivatalos robotjai akadályba ütköztek, az MI egy rejtett, álruhás botot vetett be. Ez a bot cserélgette az IP-címeket, különböző internetes szolgáltatóktól indult, és így elkerülte a felismerést. Ilyen módszerekkel a Perplexity naponta több millió kérést küldött tízezer feletti weboldalhoz, könnyedén megkerülve a védelmi intézkedéseket.

Három évtizedes internetes normák sérültek

A robots.txt protokollt, amely az internetes etikett részének számít, 1994-ben vezették be, majd 2019-ben szabvánnyá nyilvánították. A szabály lényege, hogy a tulajdonos jelezheti: mely oldalakat tilos automatizált keresőknek elérniük. A Perplexity azonban mindezt teljesen figyelmen kívül hagyja, ráadásul más cégek is hasonlóan járnak el: a Reddit vezérigazgatója korábban a Microsoftot és az Anthropic nevű MI-céget is kritizálta, mert úgy viselkedtek, mintha minden internetes tartalom szabadon felhasználható lenne.

Tartalomlopás, válasz helyett csend

Számos médium – többek között a Forbes és a Vezeték Nélkül (Wired) – már azzal is megvádolta a Perplexity-t, hogy egész bekezdéseket, cikkeket emel át forrásmegjelölés nélkül. Nem egy esetben bizonyították, hogy a Perplexity manipulálta a robotazonosító kódját csak azért, hogy megkerülje a blokkolást. Mindezek után a Cloudflare bejelentette: megújítja szabályrendszerét, és már nem tekinti hivatalos keresőrobotnak a Perplexity-t, illetve zárol minden rejtett adatgyűjtést az oldalain.

A Perplexity képviselői továbbra sem reagáltak a vádakra.

2025, adrienne, arstechnica.com alapján