Az MI titkos botjaival játszanak a weboldalak türelmével

Az internet harmincéves története során sok minden megváltozott, de az átláthatóság mindvégig kulcsszerepet játszott a web fejlődésében. A megbízhatóság alapja, hogy a kereső- és MI-botok egyértelműen beazonosíthatók, világos céllal dolgoznak, és tiszteletben tartják a weboldalak preferenciáit, például a robots.txt utasításait. Jelentőséggel bír, hogy a legfrissebb tapasztalatok szerint a Perplexity MI keresőmotor ezzel szemben szándékosan leplezi valódi bottevékenységét, fittyet hányva a weboldalak védelmi beállításaira.

Hogyan buktak le a rejtőzködő MI-botok?

Gyakorlati tesztek során több weboldaltulajdonos jelezte, hogy bár a robots.txt fájllal és tűzfalszabályokkal kifejezetten tiltják a PerplexityBot és a Perplexity-User hozzáférését, a keresőmotor botjai mégis hozzáférnek a tiltott tartalmakhoz. Ellenőrzések igazolták, hogy az ismert botokat valóban blokkolták, ám a Perplexity továbbra is részletes válaszokat adott, amikor az új, teljesen titkos – még a keresők által sem indexelt – tesztdomainek tartalmáról kérdezték. Ebből nyilvánvalóvá vált, hogy a Perplexity MI más, leplezett módon szerzett információkat ezekről az elrejtett oldalakról.

Álcázott viselkedés: leplezett és álca-botok

A tesztelt domainokon minden automatizált hozzáférést tiltottak a robots.txt-ben, és további tűzfaltípusú szűrésekkel blokkolták minden ismert Perplexity-botot. Ennek ellenére azt tapasztalták, hogy amikor a deklarált botokat kizárták, a Perplexity által vezérelt robotok „véletlenszerűen” átlagos böngészőként (például Mac OS-re telepített Chrome böngészőként) jelentek meg az oldalak felé.

A teljesen bevallott Perplexity-User/1.0 user agent naponta 20–25 millió kéréssel dolgozik, miközben a leplezett Chrome-változat 3–6 millió kérést küld el naponta. Ezek a rejtőzködő botok különböző IP-címekről és szolgáltatói hálózatokról (ASN-ekről) férnek hozzá az oldalakhoz, minden egyes tiltás után rögtön más címről próbálkoznak, ezzel tovább nehezítve felismerésüket. Az ilyen típusú tevékenység tízezres nagyságrendű domainekre és napi több millió megkeresésre terjed ki.

Így próbálnak megfelelni a jól nevelt botok elvárásainak

Jelentőséggel bír, hogy a jóhiszemű, közösségi normák szerint működő botok mindig egyedileg azonosíthatók, transzparensek, és betartják a robots.txt utasításait – ahogy például az OpenAI rendszerei teszik. Világos céljuk van, külön botot használnak minden feladathoz, tiszteletben tartják az oldal tulajdonosának döntéseit, és elérhető kapcsolattartást biztosítanak hiba esetén.

Ezt jól példázza a ChatGPT esetenkénti lekérdezése is. Amikor a ChatGPT-User botot blokkolták, valóban leállt a további adatfeldolgozással, és nem jelentek meg új, ismeretlen botok a hálózaton. Amennyiben a robots.txt korlátozást eltávolították, de helyette egy tiltó oldallal találkozott a bot, akkor sem próbált meg áthatolni – egyáltalán nem kísérelte meg megkerülni a védelmet. Ugyanakkor a Perplexity eszközei trükközéssel, álca-botokkal próbáltak továbbra is hozzájutni az adatokhoz.


Hogyan védekezhetsz a rejtett MI-botok ellen?

Az azonosított álca-botokat fejlett botszűrő rendszerek képesek felismerni és blokkolni. Akik ilyen rendszert használnak, vagy megfelelő tiltószabályokat állítanak be, eleve védettek. Azok, akik nem akarnak minden forgalmat kizárni, dönthetnek úgy is, hogy csak bizonyos esetekben kérnek visszaigazolást, így a valódi felhasználók előtt nem zárják be minden kaput. Jelentőséggel bír, hogy a Cloudflare többek között speciális azonosítókat vezetett be, amelyek segítségével minden ügyfelük – még az ingyenes felhasználók is – egyszerűen megvédhetik oldalaikat a Perplexity által irányított álca-botok ellen.

Mi következik most az álca-botok ügyében?

Az elmúlt hónapban több mint két és fél millió weboldal döntött úgy, hogy teljesen letiltja az MI-alapú tanulást, aktívan kihasználva a robots.txt vagy speciális MI-tartalomvédelmi lehetőségeket. Az új védelmi funkciók elterjedése jelentősen megváltoztatja a botok világát, de várható, hogy a tiltásokat kijátszani próbáló technikák is fejlődni fognak. A Perplexity-féle példák azt mutatják, hogy a rosszindulatú botüzemeltetők eszköztára gyorsan igazodik a kihívásokhoz, ezért a védelmi oldalnak is folyamatosan fejlődnie kell.

A Cloudflare és más iparági szereplők jelenleg együtt dolgoznak az IETF és egyéb szervezetek szakértőivel, hogy világos, mindenki által betartható etikai és technikai normákat dolgozzanak ki a botok számára. Ennek eredményeként a jövőben a weboldal-tulajdonosok nagyobb kontrollt kapnak adataik felett, miközben remélhetőleg sikerül megfékezni a MI által vezérelt, titkos adatgyűjtő botok terjedését.

2025, adminboss, blog.cloudflare.com alapján


Legfrissebb posztok

Az Apple most már tényleg komolyan veszi az MI-t

MA 23:51

Az Apple most már tényleg komolyan veszi az MI-t

Az Apple vezetése összehívta minden dolgozóját, hogy megerősítse: a cég kitart a mesterséges intelligencia (MI) fejlesztése mellett, hiába vannak késések és problémák. Tim Cook vezérigazgató szerint az Apple...

Az új Exchange biztonsági rés: hétfőig mindenki javítsa!

MA 22:51

Az új Exchange biztonsági rés: hétfőig mindenki javítsa!

⚠ Az amerikai szövetségi ügynökségeknek hétfő reggelig kötelező biztonsági frissítést végrehajtaniuk a Microsoft Exchange szervereken, miután egy súlyos sebezhetőséget (CVE-2025-53786) fedeztek fel. Ez az előírás a Szövetségi Polgári Végrehajtó...

Az alabamai patak partra mosta a dinoszaurusz fogát

MA 22:29

Az alabamai patak partra mosta a dinoszaurusz fogát

Egy fényes, különös kövületet találtak Alabama egyik patakjában, amelyről kiderült, hogy egy hatalmas dinoszauruszhoz, egy hadrosaurushoz tartozó fog – annak ellenére, hogy ez a faj inkább szárazföldi volt,...


MA 22:25

Az orrszarvúk sorsa: van remény, de sok a rossz hír

A súlyosan veszélyeztetett fekete orrszarvú állománya kismértékben emelkedett: Afrikában 6 195-ről 6 788-ra nőtt. Ugyanakkor a fehér orrszarvúak száma csökkent, 15 942-ről 15 752 egyedre. Afrika továbbra is...


MA 21:54

A Microsoft elszólta magát: itt a GPT-5, Mini és Nano

Az OpenAI ma 10:00 PT szerint élőben jelenti be a GPT-5-öt, de egy, idő előtt kikerült és gyorsan eltávolított Microsoft-oldal már hivatalosan megerősítette: még ma érkezik — ez...


MA 20:29

A holdkutatás hidegzuhanya: elnémult a Lunar Trailblazer

A NASA ma közölte, hogy a Lunar Trailblazer küldetése idő előtt véget ért: a kis holdszonda az üzembe helyezés után elhallgatott, és az irányítók nem tudták helyreállítani a...


MA 20:04

Az AirTag négyes csomag most 28 800 Ft az Amazonon

Augusztus 7-én az Amazonon 79,99 dollárért (kb. 28 800 Ft) kapható az Apple AirTag négyes csomag, a szokásos 99 dollár (kb. 35 640 Ft) helyett, ami 19%-os kedvezményt...


MA 19:54

A vegyi szennyezés: az új klímaválság

Az ipari gazdaság több mint 100 millió, a természetben nem létező „új vegyi entitást” hozott létre, ezek közül 40–350 ezer közé tehető a kereskedelmi forgalomban és a gyártásban...

Az okos sebkötöző, amely visszaállítja a véráramlást cukorbetegségben

MA 19:00

Az okos sebkötöző, amely visszaállítja a véráramlást cukorbetegségben

🩺 A cukorbetegség egyik legkegyetlenebb szövődménye a lábszárfekély, amely drasztikusan rontja a beteg életminőségét. Ezek a sebek gyakran nem gyógyulnak, mivel rossz a vérkeringés, és a hibás érképződés miatt...