Az MI titkos botjaival játszanak a weboldalak türelmével

Az internet harmincéves története során sok minden megváltozott, de az átláthatóság mindvégig kulcsszerepet játszott a web fejlődésében. A megbízhatóság alapja, hogy a kereső- és MI-botok egyértelműen beazonosíthatók, világos céllal dolgoznak, és tiszteletben tartják a weboldalak preferenciáit, például a robots.txt utasításait. Jelentőséggel bír, hogy a legfrissebb tapasztalatok szerint a Perplexity MI keresőmotor ezzel szemben szándékosan leplezi valódi bottevékenységét, fittyet hányva a weboldalak védelmi beállításaira.

Hogyan buktak le a rejtőzködő MI-botok?

Gyakorlati tesztek során több weboldaltulajdonos jelezte, hogy bár a robots.txt fájllal és tűzfalszabályokkal kifejezetten tiltják a PerplexityBot és a Perplexity-User hozzáférését, a keresőmotor botjai mégis hozzáférnek a tiltott tartalmakhoz. Ellenőrzések igazolták, hogy az ismert botokat valóban blokkolták, ám a Perplexity továbbra is részletes válaszokat adott, amikor az új, teljesen titkos – még a keresők által sem indexelt – tesztdomainek tartalmáról kérdezték. Ebből nyilvánvalóvá vált, hogy a Perplexity MI más, leplezett módon szerzett információkat ezekről az elrejtett oldalakról.

Álcázott viselkedés: leplezett és álca-botok

A tesztelt domainokon minden automatizált hozzáférést tiltottak a robots.txt-ben, és további tűzfaltípusú szűrésekkel blokkolták minden ismert Perplexity-botot. Ennek ellenére azt tapasztalták, hogy amikor a deklarált botokat kizárták, a Perplexity által vezérelt robotok „véletlenszerűen” átlagos böngészőként (például Mac OS-re telepített Chrome böngészőként) jelentek meg az oldalak felé.

A teljesen bevallott Perplexity-User/1.0 user agent naponta 20–25 millió kéréssel dolgozik, miközben a leplezett Chrome-változat 3–6 millió kérést küld el naponta. Ezek a rejtőzködő botok különböző IP-címekről és szolgáltatói hálózatokról (ASN-ekről) férnek hozzá az oldalakhoz, minden egyes tiltás után rögtön más címről próbálkoznak, ezzel tovább nehezítve felismerésüket. Az ilyen típusú tevékenység tízezres nagyságrendű domainekre és napi több millió megkeresésre terjed ki.

Így próbálnak megfelelni a jól nevelt botok elvárásainak

Jelentőséggel bír, hogy a jóhiszemű, közösségi normák szerint működő botok mindig egyedileg azonosíthatók, transzparensek, és betartják a robots.txt utasításait – ahogy például az OpenAI rendszerei teszik. Világos céljuk van, külön botot használnak minden feladathoz, tiszteletben tartják az oldal tulajdonosának döntéseit, és elérhető kapcsolattartást biztosítanak hiba esetén.

Ezt jól példázza a ChatGPT esetenkénti lekérdezése is. Amikor a ChatGPT-User botot blokkolták, valóban leállt a további adatfeldolgozással, és nem jelentek meg új, ismeretlen botok a hálózaton. Amennyiben a robots.txt korlátozást eltávolították, de helyette egy tiltó oldallal találkozott a bot, akkor sem próbált meg áthatolni – egyáltalán nem kísérelte meg megkerülni a védelmet. Ugyanakkor a Perplexity eszközei trükközéssel, álca-botokkal próbáltak továbbra is hozzájutni az adatokhoz.


Hogyan védekezhetsz a rejtett MI-botok ellen?

Az azonosított álca-botokat fejlett botszűrő rendszerek képesek felismerni és blokkolni. Akik ilyen rendszert használnak, vagy megfelelő tiltószabályokat állítanak be, eleve védettek. Azok, akik nem akarnak minden forgalmat kizárni, dönthetnek úgy is, hogy csak bizonyos esetekben kérnek visszaigazolást, így a valódi felhasználók előtt nem zárják be minden kaput. Jelentőséggel bír, hogy a Cloudflare többek között speciális azonosítókat vezetett be, amelyek segítségével minden ügyfelük – még az ingyenes felhasználók is – egyszerűen megvédhetik oldalaikat a Perplexity által irányított álca-botok ellen.

Mi következik most az álca-botok ügyében?

Az elmúlt hónapban több mint két és fél millió weboldal döntött úgy, hogy teljesen letiltja az MI-alapú tanulást, aktívan kihasználva a robots.txt vagy speciális MI-tartalomvédelmi lehetőségeket. Az új védelmi funkciók elterjedése jelentősen megváltoztatja a botok világát, de várható, hogy a tiltásokat kijátszani próbáló technikák is fejlődni fognak. A Perplexity-féle példák azt mutatják, hogy a rosszindulatú botüzemeltetők eszköztára gyorsan igazodik a kihívásokhoz, ezért a védelmi oldalnak is folyamatosan fejlődnie kell.

A Cloudflare és más iparági szereplők jelenleg együtt dolgoznak az IETF és egyéb szervezetek szakértőivel, hogy világos, mindenki által betartható etikai és technikai normákat dolgozzanak ki a botok számára. Ennek eredményeként a jövőben a weboldal-tulajdonosok nagyobb kontrollt kapnak adataik felett, miközben remélhetőleg sikerül megfékezni a MI által vezérelt, titkos adatgyűjtő botok terjedését.

2025, adminboss, blog.cloudflare.com alapján

Legfrissebb posztok

MA 09:44

Az elit tíz: a világ leggazdagabbjai újrarendezve

💰 A decemberi Forbes-lista szerint továbbra is az informatika, a közösségi média és a mesterséges intelligencia uralja a világ leggazdagabb embereinek rangsorát...

MA 20:01

A tini hacker rács mögött: 64 millió ellopott adat

Spanyol rendőrök Barcelonában elfogtak egy 19 éves fiatalt, aki kilenc különböző cég rendszereibe tört be, majd 64 millió ember személyes adatait próbálta eladni az interneten...

MA 19:49

Jön az új chipgyártó, vége az MI energiazabálásnak?

⚡ Érdekes felvetés, hogy az MI gyors fejlődése nemcsak hatékonysági, hanem egyre inkább energiagazdálkodási kihívás elé állítja a világot...

MA 19:33

Az ősi csillagok átírják a Tejútrendszer történetét

⭐ Felmerül a kérdés, hogy mennyire ismerjük valójában saját galaxisunk, a Tejút, történetét...

MA 19:02

Az Instacart trükkös árazása: ki fizet többet ugyanazért?

Egy friss kutatás döbbenetes eredményeket hozott az Instacart árképzéséről: a felhasználók ugyanabból az üzletből származó, ugyanazon termékre akár öt különböző árat is láthattak...

MA 18:50

Az MI-lázban most éri meg igazán videókártyát venni

Érdekes felvetés, hogy a mesterséges intelligencia iránti kirobbanó kereslet néhány hónapon belül alaposan felhajthatja a videókártyák árait...

MA 18:34

Az űrbe költöznek az adatszerverek – forradalom vagy vakvágány?

🚀 Például egyre többen foglalkoznak azzal a gondolattal, hogy a nagy teljesítményű adatközpontokat a Föld helyett az űrben helyezzék el...

MA 18:18

Az univerzum rejtett rendje: áttörés a fraktális káosz feltárásában

🌈 Az univerzum felszínes rendjével szemben ott lüktet a káosz: véletlenek, apró kilengések formálnak mindent, a hatalmas galaxisoktól a leghétköznapibb jégvirágig...

MA 17:49

Leállt a Microsoft Copilot – pórul jártak az európai felhasználók

⚠ Az elmúlt órákban jelentős hiba akadályozta Európa-szerte a Microsoft Copilot MI-asszisztens használatát, így a felhasználók nem érhetik el sem a copilot...

MA 17:33

Az év animációs szenzációja: jön a Zootropolis 2 streamingre

🐶 Zootropolis 2 (Zootopia 2), a Disney nagysikerű animációs filmjének folytatása, várhatóan 2026 elején érkezik meg az otthonokba...

MA 16:50

Kínába csempészték az Nvidia GPU-kat: 60 milliárdos botrány

📦 Az amerikai hatóságok ismét komoly, Kínához köthető csempészési hálózatot számoltak fel, amelyen keresztül exportkorlátozás alá eső MI-chipeket szállítottak volna Kínába és más tiltott országokba...

MA 16:34

Az Android-nyomkövetők hadat üzennek az AirTagnek

🔎 Az Apple AirTag népszerűségét látva hamarosan új nyomkövető eszközök jelennek meg Androidra...

MA 16:20

A Meta zsonglőrködik: a Llama után érkezik az Avocado-káosz

🥑 Meta, a Facebook anyavállalata az elmúlt évben jelentős irányváltáson ment keresztül a mesterséges intelligencia fejlesztésében...

MA 16:02

Újabb vágás: a Standard Chartered tovább farag a bitcoin-előrejelzésén

📈 A Bitcoin árfolyamának emelkedése elakadt, különösen a gyenge negyedik negyedéves teljesítmény után...

MA 15:49

Az Intel és a Tata óriási dobásra készül Indiában

🚀 Az Intel új szövetséget kötött az indiai óriásvállalattal, a Tatával, és közösen vizsgálják majd a chipgyártás lehetőségeit India első félvezetőgyárában...

MA 15:17

A Google új MI-alkalmazása már vásárlásra is csábít

🛒 A Google MI-alapú próbafülke-alkalmazása, a Doppl új felfedező hírfolyammal bővült, ahol bárki azonnal be is szerezheti a kiválasztott ruhákat...

MA 15:02

A mesterséges intelligencia már átírja a nyelvünket?

Egyre több moderátor és kutató aggódik amiatt, hogy az emberek beszéde feltűnően hasonlít az MI által generált nyelvezethez...

MA 14:50

Az ausztrál lucernát tizedelő levéltetvek rejtett genetikai titkai

🐛 A levéltetvek régóta keserítik meg a kiskerttulajdonosok és a gazdálkodók életét...

MA 14:35

Az MI miatt elszáll a RAM ára – te is megérzed

💸 Első pillantásra úgy tűnt, hogy a memóriapiac áremelkedése csupán a PC-játékosokat érinti, ám ez a hullám hamarosan végigsöpör a teljes technológiai iparon...