Az MI titkos botjaival játszanak a weboldalak türelmével

Az internet harmincéves története során sok minden megváltozott, de az átláthatóság mindvégig kulcsszerepet játszott a web fejlődésében. A megbízhatóság alapja, hogy a kereső- és MI-botok egyértelműen beazonosíthatók, világos céllal dolgoznak, és tiszteletben tartják a weboldalak preferenciáit, például a robots.txt utasításait. Jelentőséggel bír, hogy a legfrissebb tapasztalatok szerint a Perplexity MI keresőmotor ezzel szemben szándékosan leplezi valódi bottevékenységét, fittyet hányva a weboldalak védelmi beállításaira.

Hogyan buktak le a rejtőzködő MI-botok?

Gyakorlati tesztek során több weboldaltulajdonos jelezte, hogy bár a robots.txt fájllal és tűzfalszabályokkal kifejezetten tiltják a PerplexityBot és a Perplexity-User hozzáférését, a keresőmotor botjai mégis hozzáférnek a tiltott tartalmakhoz. Ellenőrzések igazolták, hogy az ismert botokat valóban blokkolták, ám a Perplexity továbbra is részletes válaszokat adott, amikor az új, teljesen titkos – még a keresők által sem indexelt – tesztdomainek tartalmáról kérdezték. Ebből nyilvánvalóvá vált, hogy a Perplexity MI más, leplezett módon szerzett információkat ezekről az elrejtett oldalakról.

Álcázott viselkedés: leplezett és álca-botok

A tesztelt domainokon minden automatizált hozzáférést tiltottak a robots.txt-ben, és további tűzfaltípusú szűrésekkel blokkolták minden ismert Perplexity-botot. Ennek ellenére azt tapasztalták, hogy amikor a deklarált botokat kizárták, a Perplexity által vezérelt robotok „véletlenszerűen” átlagos böngészőként (például Mac OS-re telepített Chrome böngészőként) jelentek meg az oldalak felé.

A teljesen bevallott Perplexity-User/1.0 user agent naponta 20–25 millió kéréssel dolgozik, miközben a leplezett Chrome-változat 3–6 millió kérést küld el naponta. Ezek a rejtőzködő botok különböző IP-címekről és szolgáltatói hálózatokról (ASN-ekről) férnek hozzá az oldalakhoz, minden egyes tiltás után rögtön más címről próbálkoznak, ezzel tovább nehezítve felismerésüket. Az ilyen típusú tevékenység tízezres nagyságrendű domainekre és napi több millió megkeresésre terjed ki.

Így próbálnak megfelelni a jól nevelt botok elvárásainak

Jelentőséggel bír, hogy a jóhiszemű, közösségi normák szerint működő botok mindig egyedileg azonosíthatók, transzparensek, és betartják a robots.txt utasításait – ahogy például az OpenAI rendszerei teszik. Világos céljuk van, külön botot használnak minden feladathoz, tiszteletben tartják az oldal tulajdonosának döntéseit, és elérhető kapcsolattartást biztosítanak hiba esetén.

Ezt jól példázza a ChatGPT esetenkénti lekérdezése is. Amikor a ChatGPT-User botot blokkolták, valóban leállt a további adatfeldolgozással, és nem jelentek meg új, ismeretlen botok a hálózaton. Amennyiben a robots.txt korlátozást eltávolították, de helyette egy tiltó oldallal találkozott a bot, akkor sem próbált meg áthatolni – egyáltalán nem kísérelte meg megkerülni a védelmet. Ugyanakkor a Perplexity eszközei trükközéssel, álca-botokkal próbáltak továbbra is hozzájutni az adatokhoz.


Hogyan védekezhetsz a rejtett MI-botok ellen?

Az azonosított álca-botokat fejlett botszűrő rendszerek képesek felismerni és blokkolni. Akik ilyen rendszert használnak, vagy megfelelő tiltószabályokat állítanak be, eleve védettek. Azok, akik nem akarnak minden forgalmat kizárni, dönthetnek úgy is, hogy csak bizonyos esetekben kérnek visszaigazolást, így a valódi felhasználók előtt nem zárják be minden kaput. Jelentőséggel bír, hogy a Cloudflare többek között speciális azonosítókat vezetett be, amelyek segítségével minden ügyfelük – még az ingyenes felhasználók is – egyszerűen megvédhetik oldalaikat a Perplexity által irányított álca-botok ellen.

Mi következik most az álca-botok ügyében?

Az elmúlt hónapban több mint két és fél millió weboldal döntött úgy, hogy teljesen letiltja az MI-alapú tanulást, aktívan kihasználva a robots.txt vagy speciális MI-tartalomvédelmi lehetőségeket. Az új védelmi funkciók elterjedése jelentősen megváltoztatja a botok világát, de várható, hogy a tiltásokat kijátszani próbáló technikák is fejlődni fognak. A Perplexity-féle példák azt mutatják, hogy a rosszindulatú botüzemeltetők eszköztára gyorsan igazodik a kihívásokhoz, ezért a védelmi oldalnak is folyamatosan fejlődnie kell.

A Cloudflare és más iparági szereplők jelenleg együtt dolgoznak az IETF és egyéb szervezetek szakértőivel, hogy világos, mindenki által betartható etikai és technikai normákat dolgozzanak ki a botok számára. Ennek eredményeként a jövőben a weboldal-tulajdonosok nagyobb kontrollt kapnak adataik felett, miközben remélhetőleg sikerül megfékezni a MI által vezérelt, titkos adatgyűjtő botok terjedését.

2025, adminboss, blog.cloudflare.com alapján


Legfrissebb posztok

MA 20:30

Az Amazon új atomreaktora felforgatja a felhőszolgáltatásokat

Az Amazon hatalmas összegeket fektet be egy nukleáris energiát hasznosító létesítménybe, hogy MI- és felhőszolgáltatásait zöldebb módon biztosítsa...



MA 20:01

Az új Mac mini M4 lenyomja az árakat: csak 183 ezer forint

🚀 Az Apple Mac mini M4 most mindössze 183 000 forintért (499 USD-ért) vihető haza a Best Buy-nál, ami az egyik legjobb ár-érték arányú asztali géppé teszi a kategóriájában...



MA 19:59

Az MI-szexting nem kímél – a digitális vágy új kora

🔥 Az MI-szexting forradalma berobbant – és egyre kevesebb a fék rajta...

MA 19:01

Az elveszett egyiptomi erőd óriási meglepetései a Sínai-sivatagban

Egy lenyűgözően épen maradt, 3500 éves egyiptomi katonai erődöt tártak fel régészek a Sínai-félsziget északi részén, nem messze a Földközi-tengertől...



MA 18:59

Miért érezzük magunkat reggel kómásnak, mi az agy ébredésének titka

😴 Reggeli ébredéskor hajlamosak vagyunk azt hinni, hogy az agy egyszerűen felkapcsol egy kapcsolót, amikor megszólal az ébresztőóra...

MA 18:01

A texaszi új app-áruház törvény: főhet a feje a techóriásoknak

Texas január 1-jétől életbe lépteti új app-áruház törvényét, amely minden felhasználótól életkor-igazolást követel, mielőtt alkalmazást tölthetne le vagy alkalmazáson belüli vásárlást hajthatna végre...

MA 17:58

Az univerzum élesebben látszik a James Webb távcsővel

A James Webb űrtávcső új szintre emelte a kozmosz megfigyelését, de a maximális felbontást egy apró, intelligens eszköz, az apertúramaszk-interferométer (AMI) hozta el...

MA 17:31

Az Apophis aszteroida-missziót az utolsó pillanatban sikerült megmenteni

A NASA OSIRIS-APEX küldetése, amelyet a kormányzati megszorítások miatt le akartak állítani, váratlanul 20 millió dollár (kb...

MA 16:59

Az arany ára elképesztően magasra szökött, mi áll a háttérben

Az elmúlt hetekben az arany ára történelmi csúcsot döntött, amikor a New York-i tőzsdén csütörtökön 4 326 USD-ig, vagyis mintegy 1 232 540 forintig emelkedett unciánként...

MA 16:29

Az MI-s Reddit-válaszok veszélyeztetik az egészségedet

A Reddit “Családorvoslás” (Family Medicine) aloldalán egy moderátor figyelmeztetett: az MI-alapú Reddit-válaszok automatikusan felelnek a posztokra, de gyakran súlyosan veszélyes félretájékoztatást terjesztenek...



MA 16:03

Az MI a leépítések bűnbakja, valódi veszély vagy csak kifogás

Az utóbbi években világszerte egyre több vállalat döntött létszámcsökkentés mellett, miközben a mesterséges intelligenciára (MI) hivatkoznak, mint elsődleges okra...

MA 16:00

Forradalmasítják a MI-portrék a munkaerőpiacot, új arcok jelennek meg

Az álláskeresők egyre nagyobb arányban cserélik le drága stúdiófotóikat olcsó, percek alatt elkészülő MI-alapú portrékra...

MA 15:30

Az első csillagszívverés, amit egy űrbéli robbanás rejtett el

🛰 A csillagászoknak most először sikerült észlelniük egy újszülött csillag szabályos pulzálását egy hatalmas kozmikus robbanás közepette...



MA 15:00

Az éghajlat csak fokozódik: Rekordszintű a szén-dioxid 2024-ben

2024-ben soha nem látott magasságba emelkedett a légköri szén-dioxid szintje, újabb komoly figyelmeztetést adva a globális felmelegedésre...



MA 14:58

Az új Linux-őrület: Menekülés a Windows 10-ről

A Windows 10 végleges búcsúja után tömegek keresnek új otthont számítógépüknek...



MA 14:30

Meglepő, hogyan alakítja át álmaink a memóriánkat

Az éjszakai alvás nem csupán pihenés, hanem szinte laboratóriumi munka a memóriánknak: az egyes alvásfázisok szerint átrendeződnek az emlékek, így néhány részlet elhalványul, míg mások általános tudássá állnak össze...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 10/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...



szombat 23:59

Az Apple lenyúlta a Forma–1-et az amerikai nézőknek

Az Apple 750 millió dollárt, vagyis átszámítva mintegy 275 milliárd forintot fizetett azért, hogy a következő öt évben kizárólag az Apple TV közvetíthesse a Forma–1-es futamokat az Egyesült Államokban...

szombat 23:30

Az MI-vel készült óravázlatok unalmasak és elavultak

Az MI, mint az oktatás forradalmasításának egyik ígéretes eszköze, gyorsan elnyerte a tanárok figyelmét...