Az MI titkos botjaival játszanak a weboldalak türelmével

Az internet harmincéves története során sok minden megváltozott, de az átláthatóság mindvégig kulcsszerepet játszott a web fejlődésében. A megbízhatóság alapja, hogy a kereső- és MI-botok egyértelműen beazonosíthatók, világos céllal dolgoznak, és tiszteletben tartják a weboldalak preferenciáit, például a robots.txt utasításait. Jelentőséggel bír, hogy a legfrissebb tapasztalatok szerint a Perplexity MI keresőmotor ezzel szemben szándékosan leplezi valódi bottevékenységét, fittyet hányva a weboldalak védelmi beállításaira.

Hogyan buktak le a rejtőzködő MI-botok?

Gyakorlati tesztek során több weboldaltulajdonos jelezte, hogy bár a robots.txt fájllal és tűzfalszabályokkal kifejezetten tiltják a PerplexityBot és a Perplexity-User hozzáférését, a keresőmotor botjai mégis hozzáférnek a tiltott tartalmakhoz. Ellenőrzések igazolták, hogy az ismert botokat valóban blokkolták, ám a Perplexity továbbra is részletes válaszokat adott, amikor az új, teljesen titkos – még a keresők által sem indexelt – tesztdomainek tartalmáról kérdezték. Ebből nyilvánvalóvá vált, hogy a Perplexity MI más, leplezett módon szerzett információkat ezekről az elrejtett oldalakról.

Álcázott viselkedés: leplezett és álca-botok

A tesztelt domainokon minden automatizált hozzáférést tiltottak a robots.txt-ben, és további tűzfaltípusú szűrésekkel blokkolták minden ismert Perplexity-botot. Ennek ellenére azt tapasztalták, hogy amikor a deklarált botokat kizárták, a Perplexity által vezérelt robotok „véletlenszerűen” átlagos böngészőként (például Mac OS-re telepített Chrome böngészőként) jelentek meg az oldalak felé.

A teljesen bevallott Perplexity-User/1.0 user agent naponta 20–25 millió kéréssel dolgozik, miközben a leplezett Chrome-változat 3–6 millió kérést küld el naponta. Ezek a rejtőzködő botok különböző IP-címekről és szolgáltatói hálózatokról (ASN-ekről) férnek hozzá az oldalakhoz, minden egyes tiltás után rögtön más címről próbálkoznak, ezzel tovább nehezítve felismerésüket. Az ilyen típusú tevékenység tízezres nagyságrendű domainekre és napi több millió megkeresésre terjed ki.

Így próbálnak megfelelni a jól nevelt botok elvárásainak

Jelentőséggel bír, hogy a jóhiszemű, közösségi normák szerint működő botok mindig egyedileg azonosíthatók, transzparensek, és betartják a robots.txt utasításait – ahogy például az OpenAI rendszerei teszik. Világos céljuk van, külön botot használnak minden feladathoz, tiszteletben tartják az oldal tulajdonosának döntéseit, és elérhető kapcsolattartást biztosítanak hiba esetén.

Ezt jól példázza a ChatGPT esetenkénti lekérdezése is. Amikor a ChatGPT-User botot blokkolták, valóban leállt a további adatfeldolgozással, és nem jelentek meg új, ismeretlen botok a hálózaton. Amennyiben a robots.txt korlátozást eltávolították, de helyette egy tiltó oldallal találkozott a bot, akkor sem próbált meg áthatolni – egyáltalán nem kísérelte meg megkerülni a védelmet. Ugyanakkor a Perplexity eszközei trükközéssel, álca-botokkal próbáltak továbbra is hozzájutni az adatokhoz.


Hogyan védekezhetsz a rejtett MI-botok ellen?

Az azonosított álca-botokat fejlett botszűrő rendszerek képesek felismerni és blokkolni. Akik ilyen rendszert használnak, vagy megfelelő tiltószabályokat állítanak be, eleve védettek. Azok, akik nem akarnak minden forgalmat kizárni, dönthetnek úgy is, hogy csak bizonyos esetekben kérnek visszaigazolást, így a valódi felhasználók előtt nem zárják be minden kaput. Jelentőséggel bír, hogy a Cloudflare többek között speciális azonosítókat vezetett be, amelyek segítségével minden ügyfelük – még az ingyenes felhasználók is – egyszerűen megvédhetik oldalaikat a Perplexity által irányított álca-botok ellen.

Mi következik most az álca-botok ügyében?

Az elmúlt hónapban több mint két és fél millió weboldal döntött úgy, hogy teljesen letiltja az MI-alapú tanulást, aktívan kihasználva a robots.txt vagy speciális MI-tartalomvédelmi lehetőségeket. Az új védelmi funkciók elterjedése jelentősen megváltoztatja a botok világát, de várható, hogy a tiltásokat kijátszani próbáló technikák is fejlődni fognak. A Perplexity-féle példák azt mutatják, hogy a rosszindulatú botüzemeltetők eszköztára gyorsan igazodik a kihívásokhoz, ezért a védelmi oldalnak is folyamatosan fejlődnie kell.

A Cloudflare és más iparági szereplők jelenleg együtt dolgoznak az IETF és egyéb szervezetek szakértőivel, hogy világos, mindenki által betartható etikai és technikai normákat dolgozzanak ki a botok számára. Ennek eredményeként a jövőben a weboldal-tulajdonosok nagyobb kontrollt kapnak adataik felett, miközben remélhetőleg sikerül megfékezni a MI által vezérelt, titkos adatgyűjtő botok terjedését.

2025, adminboss, blog.cloudflare.com alapján

Legfrissebb posztok

MA 20:49

A botrány az OpenAI-nál: jönnek a reklámok a ChatGPT-be?

💥 A ChatGPT felhasználói az utóbbi hetekben bosszankodhattak, amikor a népszerű csevegőalkalmazás váratlanul népszerűsített bizonyos szolgáltatásokat...

MA 20:18

Az MI csiszolja a diákok írását, de a jegyeken nem segít

A brit Warwicki Egyetem csaknem 5000 hallgatói dolgozatot vizsgált tíz éven át, és azt találta, hogy 2022 óta, a ChatGPT megjelenése nyomán a diákok írása sokkal kifinomultabb, formálisabb és pozitívabb lett – miközben a jegyek gyakorlatilag nem változtak...

MA 20:02

A fordulat: az európai felhasználók visszavágnak a célzott reklámoknak

Az Instagram és a Facebook felhasználói az Európai Unióban hamarosan korlátozhatják, mennyi személyes adat alapján jelenjenek meg nekik hirdetések...

MA 19:49

Az Amazon MI-kollégákkal csábít, miközben tömegesen leépít

Az Amazon éves re:Invent konferenciáján Las Vegasban új munkahelyi jövőképet festett: az MI-ügynökök mostantól nem pusztán eszközök, hanem igazi kollégák lehetnek – miközben a cég újabb jelentős létszámleépítést hajt végre...

MA 19:34

Az újabb leminősítés padlóra küldte a Tesla részvényeit

📈 A Tesla részvényei 3%-ot estek hétfő reggel, miután a Morgan Stanley új elemzője, Andrew Percoco leminősítette a vállalat papírjait, visszavéve korábbi optimista álláspontját...

MA 19:19

Az olcsó óriás e-bringa: mire képes a Lectric XPress 750?

Nem mindennapi öröm, ha egy e-bike tényleg képes jól kiszolgálni a magasabb bicikliseket is...

MA 19:02

Az arany ára elszállt: ékszertulajdonosok, most figyeljenek!

💎 Az elmúlt évben az arany és más nemesfémek ára soha nem látott magasságokba emelkedett, ami az ékszerek értékét is jelentősen megdobta...

MA 18:49

A Paramount bekebelezné a teljes Warner Bros. Discoveryt

📦 A Paramount most 38 400 milliárd forint összegű, agresszív felvásárlási ajánlattal próbálja megszerezni a teljes Warner Bros...

MA 18:33

A bélflóra titkos fegyvere: a TMA és a cukorbetegség

🧠 Érdemes megvizsgálni, milyen fontos szerepet játszik az egészséges emésztőrendszer a cukorbetegség megelőzésében és kezelésében...

MA 18:18

A dugódíj véget vet a káosznak: fellélegezhet Manhattan

Lényeges, hogy a New York-i dugódíj 2025 eleji bevezetése látványos változásokat hozott a város életébe...

MA 16:34

Az igazi sokk: távozik Buffett befektetési jobbkeze

💸 Warren Buffett, a Berkshire Hathaway legendás vezére idén visszavonul, ennek előkészítéseként jelentős átalakításokat hajt végre a cégnél...

MA 16:18

A Tejútrendszer nem ütközésből született: kettős kémiai lenyomat árulkodik

🌌 Rejtélyes kémiai mintázatok bukkantak fel a Tejútrendszer csillagai között: két jól elkülöníthető csillagcsoport létezik, amelyek vas- és magnéziumtartalma jelentősen eltér...

MA 15:34

Az oroszok megint szigorítanak: tiltólistára kerül a FaceTime

Az orosz hatóságok újabb szintre emelték az online kommunikáció ellenőrzését: csütörtökön bejelentették, hogy korlátozzák az Apple videóhívó szolgáltatását, a FaceTime-ot...

MA 15:18

Az MI-böngészők tiltólistán: veszélyben az adataink

Egyre több szervezet kerül szembe az úgynevezett ügynökjellegű böngészőkkel, amelyek már messze túlmutatnak a megszokott böngészési élményen...

MA 15:02

A szárazság végezhetett az igazi hobbitokkal

🧙 A Homo floresiensis, ismertebb nevén a hobbit, egy kis termetű, ősi emberfaj képviselője, amely körülbelül 50 ezer évvel ezelőtt tűnt el a Föld színéről...

MA 14:49

A tűzoltás hanggal: víz nélkül is legyőzi a lángokat?

A heves erdőtűz gyorsan terjed a száraz bokrok között, és megközelíti a házakat, de az egyik otthon makacsul ellenáll a lángoknak...

MA 14:34

A Tesla új frissítése: túrázz a Mikulással, MI-vel

Megérkezett a Tesla 2025-ös ünnepi frissítése, amely minden eddiginél több újdonságot ígér...

MA 14:17

Az első olvadéksó-üzemanyag forradalmasítja az atomreaktorokat

Az amerikai Idaho Nemzeti Laboratórium előállította a világ első kloridalapú, olvadt sóból készült üzemanyagát gyorsreaktorokhoz...

MA 14:02

Az éghajlati válság házhoz jön – és végre észbe kapunk

🏖 A kommunikáció apró módosítása, például ha megemlítik a lakóhelyedet egy figyelmeztetésben, drámai módon növelheti a felkészülési hajlandóságot a természeti katasztrófákkal szemben...