Az MI titkos botjaival játszanak a weboldalak türelmével

Az internet harmincéves története során sok minden megváltozott, de az átláthatóság mindvégig kulcsszerepet játszott a web fejlődésében. A megbízhatóság alapja, hogy a kereső- és MI-botok egyértelműen beazonosíthatók, világos céllal dolgoznak, és tiszteletben tartják a weboldalak preferenciáit, például a robots.txt utasításait. Jelentőséggel bír, hogy a legfrissebb tapasztalatok szerint a Perplexity MI keresőmotor ezzel szemben szándékosan leplezi valódi bottevékenységét, fittyet hányva a weboldalak védelmi beállításaira.

Hogyan buktak le a rejtőzködő MI-botok?

Gyakorlati tesztek során több weboldaltulajdonos jelezte, hogy bár a robots.txt fájllal és tűzfalszabályokkal kifejezetten tiltják a PerplexityBot és a Perplexity-User hozzáférését, a keresőmotor botjai mégis hozzáférnek a tiltott tartalmakhoz. Ellenőrzések igazolták, hogy az ismert botokat valóban blokkolták, ám a Perplexity továbbra is részletes válaszokat adott, amikor az új, teljesen titkos – még a keresők által sem indexelt – tesztdomainek tartalmáról kérdezték. Ebből nyilvánvalóvá vált, hogy a Perplexity MI más, leplezett módon szerzett információkat ezekről az elrejtett oldalakról.

Álcázott viselkedés: leplezett és álca-botok

A tesztelt domainokon minden automatizált hozzáférést tiltottak a robots.txt-ben, és további tűzfaltípusú szűrésekkel blokkolták minden ismert Perplexity-botot. Ennek ellenére azt tapasztalták, hogy amikor a deklarált botokat kizárták, a Perplexity által vezérelt robotok „véletlenszerűen” átlagos böngészőként (például Mac OS-re telepített Chrome böngészőként) jelentek meg az oldalak felé.

A teljesen bevallott Perplexity-User/1.0 user agent naponta 20–25 millió kéréssel dolgozik, miközben a leplezett Chrome-változat 3–6 millió kérést küld el naponta. Ezek a rejtőzködő botok különböző IP-címekről és szolgáltatói hálózatokról (ASN-ekről) férnek hozzá az oldalakhoz, minden egyes tiltás után rögtön más címről próbálkoznak, ezzel tovább nehezítve felismerésüket. Az ilyen típusú tevékenység tízezres nagyságrendű domainekre és napi több millió megkeresésre terjed ki.

Így próbálnak megfelelni a jól nevelt botok elvárásainak

Jelentőséggel bír, hogy a jóhiszemű, közösségi normák szerint működő botok mindig egyedileg azonosíthatók, transzparensek, és betartják a robots.txt utasításait – ahogy például az OpenAI rendszerei teszik. Világos céljuk van, külön botot használnak minden feladathoz, tiszteletben tartják az oldal tulajdonosának döntéseit, és elérhető kapcsolattartást biztosítanak hiba esetén.

Ezt jól példázza a ChatGPT esetenkénti lekérdezése is. Amikor a ChatGPT-User botot blokkolták, valóban leállt a további adatfeldolgozással, és nem jelentek meg új, ismeretlen botok a hálózaton. Amennyiben a robots.txt korlátozást eltávolították, de helyette egy tiltó oldallal találkozott a bot, akkor sem próbált meg áthatolni – egyáltalán nem kísérelte meg megkerülni a védelmet. Ugyanakkor a Perplexity eszközei trükközéssel, álca-botokkal próbáltak továbbra is hozzájutni az adatokhoz.


Hogyan védekezhetsz a rejtett MI-botok ellen?

Az azonosított álca-botokat fejlett botszűrő rendszerek képesek felismerni és blokkolni. Akik ilyen rendszert használnak, vagy megfelelő tiltószabályokat állítanak be, eleve védettek. Azok, akik nem akarnak minden forgalmat kizárni, dönthetnek úgy is, hogy csak bizonyos esetekben kérnek visszaigazolást, így a valódi felhasználók előtt nem zárják be minden kaput. Jelentőséggel bír, hogy a Cloudflare többek között speciális azonosítókat vezetett be, amelyek segítségével minden ügyfelük – még az ingyenes felhasználók is – egyszerűen megvédhetik oldalaikat a Perplexity által irányított álca-botok ellen.

Mi következik most az álca-botok ügyében?

Az elmúlt hónapban több mint két és fél millió weboldal döntött úgy, hogy teljesen letiltja az MI-alapú tanulást, aktívan kihasználva a robots.txt vagy speciális MI-tartalomvédelmi lehetőségeket. Az új védelmi funkciók elterjedése jelentősen megváltoztatja a botok világát, de várható, hogy a tiltásokat kijátszani próbáló technikák is fejlődni fognak. A Perplexity-féle példák azt mutatják, hogy a rosszindulatú botüzemeltetők eszköztára gyorsan igazodik a kihívásokhoz, ezért a védelmi oldalnak is folyamatosan fejlődnie kell.

A Cloudflare és más iparági szereplők jelenleg együtt dolgoznak az IETF és egyéb szervezetek szakértőivel, hogy világos, mindenki által betartható etikai és technikai normákat dolgozzanak ki a botok számára. Ennek eredményeként a jövőben a weboldal-tulajdonosok nagyobb kontrollt kapnak adataik felett, miközben remélhetőleg sikerül megfékezni a MI által vezérelt, titkos adatgyűjtő botok terjedését.

2025, adminboss, blog.cloudflare.com alapján


Legfrissebb posztok

szerda 15:59

Most már flörtölnek a mesterséges intelligenciák, és pénzt is termelnek

😉 Az OpenAI vezérigazgatója, Sam Altman nemrégiben bejelentette, hogy a ChatGPT hamarosan képes lesz felnőtt felhasználók számára erotikus tartalmakat is létrehozni, miután a vállalat szerinte már orvosolta a mesterséges intelligenciával folytatott beszélgetések okozta mentális egészségi kockázatokat...

MA 18:01

A texaszi új app-áruház törvény: főhet a feje a techóriásoknak

Texas január 1-jétől életbe lépteti új app-áruház törvényét, amely minden felhasználótól életkor-igazolást követel, mielőtt alkalmazást tölthetne le vagy alkalmazáson belüli vásárlást hajthatna végre...

MA 17:58

Az univerzum élesebben látszik a James Webb távcsővel

A James Webb űrtávcső új szintre emelte a kozmosz megfigyelését, de a maximális felbontást egy apró, intelligens eszköz, az apertúramaszk-interferométer (AMI) hozta el...

MA 17:31

Az Apophis aszteroida-missziót az utolsó pillanatban sikerült megmenteni

A NASA OSIRIS-APEX küldetése, amelyet a kormányzati megszorítások miatt le akartak állítani, váratlanul 20 millió dollár (kb...



MA 16:59

Az arany ára elképesztően magasra szökött, mi áll a háttérben

Az elmúlt hetekben az arany ára történelmi csúcsot döntött, amikor a New York-i tőzsdén csütörtökön 4 326 USD-ig, vagyis mintegy 1 232 540 forintig emelkedett unciánként...

MA 16:29

Az MI-s Reddit-válaszok veszélyeztetik az egészségedet

A Reddit “Családorvoslás” (Family Medicine) aloldalán egy moderátor figyelmeztetett: az MI-alapú Reddit-válaszok automatikusan felelnek a posztokra, de gyakran súlyosan veszélyes félretájékoztatást terjesztenek...

MA 16:03

Az MI a leépítések bűnbakja, valódi veszély vagy csak kifogás

Az utóbbi években világszerte egyre több vállalat döntött létszámcsökkentés mellett, miközben a mesterséges intelligenciára (MI) hivatkoznak, mint elsődleges okra...

MA 16:00

Forradalmasítják a MI-portrék a munkaerőpiacot, új arcok jelennek meg

Az álláskeresők egyre nagyobb arányban cserélik le drága stúdiófotóikat olcsó, percek alatt elkészülő MI-alapú portrékra...

MA 15:30

Az első csillagszívverés, amit egy űrbéli robbanás rejtett el

🛰 A csillagászoknak most először sikerült észlelniük egy újszülött csillag szabályos pulzálását egy hatalmas kozmikus robbanás közepette...

MA 15:00

Az éghajlat csak fokozódik: Rekordszintű a szén-dioxid 2024-ben

2024-ben soha nem látott magasságba emelkedett a légköri szén-dioxid szintje, újabb komoly figyelmeztetést adva a globális felmelegedésre...



MA 14:58

Az új Linux-őrület: Menekülés a Windows 10-ről

A Windows 10 végleges búcsúja után tömegek keresnek új otthont számítógépüknek...

MA 14:30

Meglepő, hogyan alakítja át álmaink a memóriánkat

Az éjszakai alvás nem csupán pihenés, hanem szinte laboratóriumi munka a memóriánknak: az egyes alvásfázisok szerint átrendeződnek az emlékek, így néhány részlet elhalványul, míg mások általános tudássá állnak össze...

APP
MA 09:11

APPok, Amik Ingyenesek MA, 10/19

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

szombat 23:59

Az Apple lenyúlta a Forma–1-et az amerikai nézőknek

Az Apple 750 millió dollárt, vagyis átszámítva mintegy 275 milliárd forintot fizetett azért, hogy a következő öt évben kizárólag az Apple TV közvetíthesse a Forma–1-es futamokat az Egyesült Államokban...



szombat 23:30

Az MI-vel készült óravázlatok unalmasak és elavultak

Az MI, mint az oktatás forradalmasításának egyik ígéretes eszköze, gyorsan elnyerte a tanárok figyelmét...

szombat 23:01

Az OpenAI leállította a Martin Luther King deepfake videókat

🚫 Az OpenAI felfüggesztette a Martin Luther King Jr.-ról mesterséges intelligenciával készült videók létrehozását Sora nevű alkalmazásában, miután több tiszteletlen klip is megjelent a platformon...

szombat 22:59

Az ázsiai fizika legendája: Yang Chen Ning 103 évesen elhunyt

A modern fizika egyik legnagyobb alakja, Yang Chen Ning 103 éves korában hunyt el Pekingben...



szombat 22:30

Az új Windows-frissítés mindenkit kiborított – de itt a javítás

🙁 Az utóbbi Windows-biztonsági frissítések súlyos hibát okoztak: sem a Windows 11-en, sem a Windows Server 2025 rendszeren nem lehetett HTTP/2 kapcsolattal elérni a localhost (127...

szombat 22:01

Az olvadó permafroszt újra felkorbácsolja a klímaaggodalmakat

🌨 A sarkvidéki örökfagy világa most új veszélyforrást rejt: a globális felmelegedés több tízezer éves baktériumokat éleszt fel...