2025. 07. 02., 17:52

Az MI botok lenyúlják a netet, kattintás nélkül

Az MI botok lenyúlják a netet, kattintás nélkül
Az internetes tartalomgyártók éveken át örömmel fogadták a keresőmotorok feltérképező robotjait (crawlers), hiszen ezek hajtották a forgalmat az oldalakra. A keresőmotor indexelte a publikált információkat, a felhasználók pedig a keresések során rátaláltak a tartalomra. A weboldalak üzemeltetői ebből pénzt csináltak, mivel a teljes anyaghoz továbbra is rá kellett kattintani. A MI-alapú botok működése azonban gyökeresen eltér ettől. Ezek a botok nem egyszerűen indexelnek: végigolvasnak mindent, majd a begyűjtött adatokat saját rendszerük betanítására használják. Ennek eredményeképpen a felhasználó a MI-től kapja meg a lényeget – gyakran úgy, hogy soha be sem lép a forrásoldalra. Bár előfordulhat, hogy a MI hivatkozik a forrásra, de a kattintó felhasználók aránya elenyésző ahhoz képest, ahányszor egy MI bot végigpásztáz egy weboldalt.

Hogyan mérhető mindez?

A leggyakrabban keresett tartalom továbbra is a HTML oldalakból áll, ezért az elemzések során azt nézik, hogy az adott MI vagy keresőmotorhoz tartozó „user agentek” mennyi HTML-t kérnek le, illetve a hozzájuk köthető hivatkozással (Referer mezővel) hányan érkeznek egy-egy oldalra. Ez a két adat összevethető, így számszerűsíthető, hogy egy adott platform mennyi átkattintást generál a saját botjai által végzett feltérképezéshez képest.

A rendszer különböző botokat különböztet meg attól függően, hogy azok csak adatgyűjtésre (például MI tanításához) keresnek, vagy egy konkrét felhasználói kérés kiszolgálására töltik le az adatokat. Az ilyen botok neve eltérhet (például lehet AIBot és AIBot-User), de összesítve egy platformhoz tartoznak.

Amikor egy felhasználó ténylegesen rákattint egy keresőben vagy MI válaszban található linkre, az oldalkérés fejléce tartalmazni fogja a forrást (Referer). Az elemzés során ezért platformonként összesítik, hogy egy adott forrás mennyi átkattintást generál.

Kinek mi a mérlege?

A legbeszédesebb adat, hogy a főbb MI botok és keresők között milyen arány figyelhető meg a feltérképezés (crawl) és az átkattintás (referral) között. 2025. június 19-26. között például a Claude nevű rendszer mögött álló Anthropic 70 900 oldallekérésre (!) mindössze egyetlen átkattintást generált. A Mistral esetében viszont 0,1:1 az arány, vagyis tízszer annyi átkattintást küldtek vissza, mint ahányszor feltérképezték a webet.

Fontos: ezek az adatok némileg torzíthatnak. Az MI platformok saját alkalmazásai által generált forgalomhoz gyakran nem tartozik Referer mező, így a webes eszközökön alapuló elemzések lehet, hogy túlbecsülik az arányt, de azt nem lehet tudni, mennyivel.

Az arányok időről időre változnak. Az említett időszakban például a DuckDuckGo és a Yandex keresők 6%-os növekedést, a Google viszont 19,4%-os visszaesést mutattak feltérképezési aktivitásban. A Google esetében ez részben annak köszönhető, hogy június 24-től visszaesett a GoogleBot aktivitása. A Yandex eközben hullámszerű növekedést produkált a keresőbotjával. Az ilyen trendeket jól mutatják a Cloudflare Radar idősoros adatbázisai.

Trendek az átkattintások terén

Négy hét adatai alapján egyértelmű, hogy az átkattintási forgalom (referral) királya továbbra is a Google. Az oldal látogatói nagyjából egyenletes, napszakonként ismétlődő mintázattal kattintanak át a keresőből. Az elemzésből kizárták a Google ASN-ből érkező forgalmat, amely jellemzően előtöltésből (prefetch) származik, azaz nem tényleges felhasználói interakció eredménye.

Más keresőknél is kimutathatók ezek a diurnális mintázatok, de nagyságrendekkel kevesebb forgalmat generálnak, mint a Google. Ezzel szemben az MI platformok, még összeadva is, elenyésző mennyiségű átkattintást hoznak – szinte eltörpül a keresőkhöz képest.


Bot aktivitás változásai

A feltérképezési aktivitás is könnyen nyomon követhető: például június folyamán a Google botok lekérési aránya csökkenni kezdett, többször hullámzóan. Az OpenAI GPT Botja pedig több időszakban szinte teljesen leállt tartalomgyűjtéssel.

Az MI botok jelentős tartalomhasználata egyre kevesebb kattintást hoz. Míg korábban a keresők úgy küldték a látogatókat, hogy szinte minden feltérképezést látogatás követett, mára ez felborult. A botok egyre gyakrabban olvassák le a tartalmat, miközben a forrás weboldalak látogatottsága nem nő, vagy csökken.

Mit lehet ez ellen tenni?

A tartalomszolgáltatók számára az új arányok fenyegetést jelentenek, hiszen a beérkező látogatók nélkül nehéz bevételt termelni. Ezért egyre többen védik a saját anyagaikat, például blokkolják azokat az MI botokat, amelyek csak tanításra viszik el az adatokat. Az irányított, szelektív hozzáférés mindkét fél számára igazságosabbá teheti az értékcserét, de minden tartalomtulajdonosnak ajánlott felülvizsgálnia, mely MI botoknak enged hozzáférést.

Egy kis bónusz: Bot-adatbázis mindenkinek

A Cloudflare Radar megújította a hitelesített botok (Verified Bots) listáját. Az új könyvtárban kártyákon jelennek meg a botok adatai: név, leírás, tulajdonos, kategória és kérésalapú rangsor. Lehet keresni névre, tulajdonosra vagy leírásra, illetve szűrni például Monitoring & Analytics botokra.

Ha egy adott bot nevére kattintasz, részletes profilt kapsz róla: metaadatok, user agent minták, blokkolási lehetőségek, illetve forgalmi trendek az adott időszakban. Az adatok API-n keresztül is elérhetők, és a jövőben folyamatosan bővülnek.

2025, adminboss, blog.cloudflare.com alapján

  • Te szerinted etikus, ha egy MI bot felhasználja a tartalmat úgy, hogy nem irányít vissza látogatókat az eredeti oldalra?
  • Te mit tennél, ha a saját oldalad adatait ilyen arányban használnák fel MI rendszerek?


Legfrissebb posztok

szombat 21:45

Valóban gamerek irányítják ezentúl az amerikai légiforgalmat?

Az Egyesült Államokban súlyos légiforgalmi irányítóhiány alakult ki, ezért a Szövetségi Légügyi Hatóság (FAA) szokatlan megoldáshoz folyamodott: mostantól célzottan videójáték-rajongók jelentkezését várják...

szombat 21:23

Az óriási kriptocsalást leleplezték: több mint 20 ezer áldozat.

Több mint 20 000 kriptovaluta-csalás áldozatát sikerült azonosítani egy nemzetközi rendőrségi akció során Kanadában, az Egyesült Királyságban és az Egyesült Államokban...

szombat 21:01

Az amerikai levegőben is kimutatták az új mérget

🚨 Egy kutatócsoport Oklahomában végzett terepmunkája során olyan váratlan eredményre jutott, amire senki sem számított...

szombat 20:56

Az új robotok már a pénztárcádat is hizlalják

2026-ban a robotika elképesztő sebességgel fejlődik, különösen a robotok kézügyessége terén...

szombat 20:45

A Rockstar újabb botránya: hackerek zsarolják a GTA-fejlesztőket

A Rockstar Games ismét célkeresztbe került, ezúttal a hírhedt ShinyHunters nevű hackercsoport tört be a cég felhőalapú szervereire...

szombat 20:01

A Linux böngészőkirálya: Chrome vagy Firefox?

Most jön a nagy kérdés: böngészőt választani olyan, mint kedvenc kávézót keresni egy egyetemi negyedben – mindegyiknek van valami erőssége...

szombat 19:56

Az újabb csapás: a bitcoinbányászok naponta 7 millió forintot buknak érménként

A bitcoinbányászok számára sosem volt ennyire nehéz a helyzet: az átlagos előállítási költség egyetlen bitcoin esetén már 32 millió forint (88 000 USD), miközben a piaci ár épp csak eléri a 25 millió forintot (69 200 USD)...

szombat 19:13

A bíróságon vallhat ellened a chatbotod – az MI-doki?

🕵 Egy lényeges szempont, hogy az egészségi állapotunkkal kapcsolatos titkaink védelme mindig fontos volt: az orvosok, ügyvédek és pszichológusok titoktartási kötelezettsége biztosítja, hogy bizalommal forduljunk hozzájuk...

szombat 19:01

Az agy csapdái: így születnek a döntéseink

🧠 A nap minden percében választanunk kell: sütit vagy fánkot egy pékségben, vagy épp azt, melyik útvonalon menjünk haza...

szombat 18:56

Az évszázad áttörése: a vízben stabil karbén forradalmasíthatja a kémiát

⚡ Egy 67 éves, sokak által “őrültnek” tartott elmélet nyert bizonyítást: kaliforniai kutatók stabilizálták az egyik legreaktívabb szerves molekulát vízben, és ezzel fényt derítettek arra, mire képes valójában a B1-vitamin (tiamin) az élő szervezetekben...

szombat 18:45

A korai elhízás egész életre rányomja bélyegét az egészségre

💉 A kutatások szerint nemcsak az számít, mennyi a testsúlyunk, hanem az is, hogy mikor kezdünk el hízni életünk során...

szombat 17:01

Az első Merkúr-rover: túlélés a Nap perzselő szomszédságában

☉ Miközben a Mars felszínén már több rover is rendületlenül kutat évek óta, könnyű elfelejteni, mennyire összetett feladat lenne hasonlót megvalósítani más bolygókon...

szombat 16:56

Az új XChat: Elon Musk üzenőappja, amitől leesik az állad

Végre megjelenik az XChat, az X (korábbi Twitter) csevegője, és már előrendelhető iPhone-okra és iPadekre is...

szombat 16:45

A megfizethető, 8 portos 10GbE switch, ami végre működik

💻 A YuanLey YS100-0602T egy pénztárcabarát, de meglepően sokat tudó 8 portos 10GbE switch, ami sokak számára első ránézésre ismerős lehet – nem véletlenül, hiszen a hardveres alapok szinte teljesen megegyeznek a SICSOLINK modelljével...

szombat 16:25

Az MI és az adatközpontok visszahozzák a gázt és a csővezetékeket

Ki gondolta volna, hogy az Egyesült Államokban ismét reneszánszukat élik a földgázvezetékek...

szombat 15:45

Az új hővezető fém felforgatja a fizika törvényeit

Felmerül a kérdés, hogy véget érhet-e a réz egyeduralma az elektronikában és az energiarendszerekben...

szombat 15:35

Az államok visszavágnak a megfigyelőkamerák és rendszámolvasók ellen

A rendszámfelismerő kamerák és más fejlett megfigyelési rendszerek ma már alapvető eszközei lettek a helyi rendőrségeknek, de számos amerikai államban egyre többen próbálnak törvényi úton gátat szabni a személyes adatok tömeges gyűjtésének...

szombat 15:12

A bélbaktériumok diktálnak: ezért kívánsz bizonyos ételeket

A bélrendszerünkben több milliárdnyi mikroba él, amelyek kulcsszerepet játszanak nemcsak az emésztésben és az immunrendszer működésében, hanem talán abban is, hogy milyen ételeket kívánunk meg...

szombat 14:57

Az MI padlóra küldi a bölcsészeket, de jön a szakmunkások kora

Az MI korszakában rengeteg kérdés felmerül azzal kapcsolatban, milyen munkák maradnak, és kik húzzák a rövidebbet...

szombat 14:46

Az MI-forradalom: közeleg a hackerek legveszélyesebb fegyvere?

🛡 A mesterséges intelligencia fejlődésével nemcsak a védelmi rendszerek, hanem a kibertámadások is új szintre léphetnek...

szombat 14:24

Az Artemis II hazatérése: kényes hőpajzs, biztos kezekben

🚀 A NASA Artemis II missziójának legizgalmasabb pillanata közeleg: az űrhajó rövidesen visszatér a Földre, és az Orion kapszula rekordot döntő legénysége landol a Csendes-óceánban...

szombat 13:56

Az MI megszabadít a monotóniától – de tényleg kell nekünk?

💡 Fontos kérdés, hogy tényleg jót tesz-e nekünk, ha az MI eltünteti a mindennapi unalmas feladatokat a munkahelyen...

szombat 13:34

Az átvert HWMonitor: pofátlan trükközés a CPUID részéről

Amilyen menő dolog, amikor egy komoly rendszerfigyelő appot akarsz letölteni a CPUID oldaláról, olyan kellemetlen volt most szembesülni azzal, hogy a letöltési linkek egy sunyi kis malware-t kínáltak a kíváncsi felhasználóknak...

szombat 13:23

Az új Google Wallet végre használható, nem csak ígéret

A Google régóta várt frissítése végre elérhetővé vált, alapjaiban alakítva át a Google Wallet alkalmazást...

szombat 13:03

Az Android új ásza: érkezik a villámgyors Gemini Nano 4

Android-telefonokon hamarosan bemutatkozik egy mindeddiginél gyorsabb és okosabb MI, amely megváltoztathatja, ahogyan az eszközeinken dolgoztatunk MI-modelleket...

szombat 12:45

Az Artemis II történelmi visszatérése: rekordok dőlnek, bravúrok születnek

Az Orion űrkapszula és négyfős legénysége tíz nap után sikeresen visszatért a Földre egy rekorddöntő, Holdat megkerülő küldetést követően...

szombat 12:34

Az első öregedésgátló kutyatabletta a küszöbön – tovább élhet a kedvenced?

🐶 Felmerül a kérdés, hogy valóban több évet is kaphatunk közös életünkhöz házi kedvencünkkel – legalábbis egy San Franciscó-i startup, a Loyal szerint ez hamarosan lehetséges lesz...

szombat 11:45

A Pókember-szabály az MI-adatok világában: a felelősség az első

🦁 A modern MI-ügynökök igazi akadálya nem is maga a gépi tanulás, hanem az alapul szolgáló adatok minősége és elérhetősége...

szombat 11:13

Visszatértünk a Holdra: a négy űrhajós már itthon

Egy rendkívüli utazás végén péntek este biztonságban visszatért a Földre az első emberes Hold-misszió csaknem 54 év után...