Az MI botok lenyúlják a netet, kattintás nélkül

Az MI botok lenyúlják a netet, kattintás nélkül
Az internetes tartalomgyártók éveken át örömmel fogadták a keresőmotorok feltérképező robotjait (crawlers), hiszen ezek hajtották a forgalmat az oldalakra. A keresőmotor indexelte a publikált információkat, a felhasználók pedig a keresések során rátaláltak a tartalomra. A weboldalak üzemeltetői ebből pénzt csináltak, mivel a teljes anyaghoz továbbra is rá kellett kattintani. A MI-alapú botok működése azonban gyökeresen eltér ettől. Ezek a botok nem egyszerűen indexelnek: végigolvasnak mindent, majd a begyűjtött adatokat saját rendszerük betanítására használják. Ennek eredményeképpen a felhasználó a MI-től kapja meg a lényeget – gyakran úgy, hogy soha be sem lép a forrásoldalra. Bár előfordulhat, hogy a MI hivatkozik a forrásra, de a kattintó felhasználók aránya elenyésző ahhoz képest, ahányszor egy MI bot végigpásztáz egy weboldalt.

Hogyan mérhető mindez?

A leggyakrabban keresett tartalom továbbra is a HTML oldalakból áll, ezért az elemzések során azt nézik, hogy az adott MI vagy keresőmotorhoz tartozó „user agentek” mennyi HTML-t kérnek le, illetve a hozzájuk köthető hivatkozással (Referer mezővel) hányan érkeznek egy-egy oldalra. Ez a két adat összevethető, így számszerűsíthető, hogy egy adott platform mennyi átkattintást generál a saját botjai által végzett feltérképezéshez képest.

A rendszer különböző botokat különböztet meg attól függően, hogy azok csak adatgyűjtésre (például MI tanításához) keresnek, vagy egy konkrét felhasználói kérés kiszolgálására töltik le az adatokat. Az ilyen botok neve eltérhet (például lehet AIBot és AIBot-User), de összesítve egy platformhoz tartoznak.

Amikor egy felhasználó ténylegesen rákattint egy keresőben vagy MI válaszban található linkre, az oldalkérés fejléce tartalmazni fogja a forrást (Referer). Az elemzés során ezért platformonként összesítik, hogy egy adott forrás mennyi átkattintást generál.

Kinek mi a mérlege?

A legbeszédesebb adat, hogy a főbb MI botok és keresők között milyen arány figyelhető meg a feltérképezés (crawl) és az átkattintás (referral) között. 2025. június 19-26. között például a Claude nevű rendszer mögött álló Anthropic 70 900 oldallekérésre (!) mindössze egyetlen átkattintást generált. A Mistral esetében viszont 0,1:1 az arány, vagyis tízszer annyi átkattintást küldtek vissza, mint ahányszor feltérképezték a webet.

Fontos: ezek az adatok némileg torzíthatnak. Az MI platformok saját alkalmazásai által generált forgalomhoz gyakran nem tartozik Referer mező, így a webes eszközökön alapuló elemzések lehet, hogy túlbecsülik az arányt, de azt nem lehet tudni, mennyivel.

Az arányok időről időre változnak. Az említett időszakban például a DuckDuckGo és a Yandex keresők 6%-os növekedést, a Google viszont 19,4%-os visszaesést mutattak feltérképezési aktivitásban. A Google esetében ez részben annak köszönhető, hogy június 24-től visszaesett a GoogleBot aktivitása. A Yandex eközben hullámszerű növekedést produkált a keresőbotjával. Az ilyen trendeket jól mutatják a Cloudflare Radar idősoros adatbázisai.

Trendek az átkattintások terén

Négy hét adatai alapján egyértelmű, hogy az átkattintási forgalom (referral) királya továbbra is a Google. Az oldal látogatói nagyjából egyenletes, napszakonként ismétlődő mintázattal kattintanak át a keresőből. Az elemzésből kizárták a Google ASN-ből érkező forgalmat, amely jellemzően előtöltésből (prefetch) származik, azaz nem tényleges felhasználói interakció eredménye.

Más keresőknél is kimutathatók ezek a diurnális mintázatok, de nagyságrendekkel kevesebb forgalmat generálnak, mint a Google. Ezzel szemben az MI platformok, még összeadva is, elenyésző mennyiségű átkattintást hoznak – szinte eltörpül a keresőkhöz képest.


Bot aktivitás változásai

A feltérképezési aktivitás is könnyen nyomon követhető: például június folyamán a Google botok lekérési aránya csökkenni kezdett, többször hullámzóan. Az OpenAI GPT Botja pedig több időszakban szinte teljesen leállt tartalomgyűjtéssel.

Az MI botok jelentős tartalomhasználata egyre kevesebb kattintást hoz. Míg korábban a keresők úgy küldték a látogatókat, hogy szinte minden feltérképezést látogatás követett, mára ez felborult. A botok egyre gyakrabban olvassák le a tartalmat, miközben a forrás weboldalak látogatottsága nem nő, vagy csökken.

Mit lehet ez ellen tenni?

A tartalomszolgáltatók számára az új arányok fenyegetést jelentenek, hiszen a beérkező látogatók nélkül nehéz bevételt termelni. Ezért egyre többen védik a saját anyagaikat, például blokkolják azokat az MI botokat, amelyek csak tanításra viszik el az adatokat. Az irányított, szelektív hozzáférés mindkét fél számára igazságosabbá teheti az értékcserét, de minden tartalomtulajdonosnak ajánlott felülvizsgálnia, mely MI botoknak enged hozzáférést.

Egy kis bónusz: Bot-adatbázis mindenkinek

A Cloudflare Radar megújította a hitelesített botok (Verified Bots) listáját. Az új könyvtárban kártyákon jelennek meg a botok adatai: név, leírás, tulajdonos, kategória és kérésalapú rangsor. Lehet keresni névre, tulajdonosra vagy leírásra, illetve szűrni például Monitoring & Analytics botokra.

Ha egy adott bot nevére kattintasz, részletes profilt kapsz róla: metaadatok, user agent minták, blokkolási lehetőségek, illetve forgalmi trendek az adott időszakban. Az adatok API-n keresztül is elérhetők, és a jövőben folyamatosan bővülnek.

2025, adminboss, blog.cloudflare.com alapján

  • Te szerinted etikus, ha egy MI bot felhasználja a tartalmat úgy, hogy nem irányít vissza látogatókat az eredeti oldalra?
  • Te mit tennél, ha a saját oldalad adatait ilyen arányban használnák fel MI rendszerek?


Legfrissebb posztok

hétfő 21:00

Az Instagram felrobbant: Kylie Jenner ismét bikiniben pózol

A hétfői rosszkedvre itt a tökéletes ellenszer: Kylie Jenner újabb bikinis szelfivel lepte meg követőit, és elképesztően néz ki...

MA 10:30

Az óriáscégek milliókat mozgósítanak Hongkong legsúlyosabb tűzvésze után

Több mint ötvenen vesztették életüket Hongkongban, amikor egy lakótelepen pusztító tűz csapott fel...

MA 10:15

A Pokémon Go Tour Kalosba repít – jön a nagy kaland

🏃 2026-ban a Pokémon Go játékosai a Kalos régióban kalandozhatnak, ahol eddig sosem látott meglepetések várnak...

MA 09:57

A norvégok új szuperszámítógépe meleg vízben fürdeti a lazacokat

Norvégiában befejezték az ország legnagyobb teljesítményű szuperszámítógépének, az Oliviának az építését, amely nemcsak a tudományos kutatást lendíti fel, hanem a helyi lazacfarmok vizét is fűti majd...

MA 09:43

Az EU rákényszeríti a Google-t: jön az AirDrop-támogatás

A Google nemrégiben bejelentette, hogy a Pixel 10 mobilokon bevezeti az AirDrop-szerű fájlmegosztás támogatását – ezúttal úgy, hogy ehhez nincs szükség az Apple együttműködésére...

MA 09:36

Az új ShadowV2 botnet az AWS-leállást lovagolta meg

Egy új, Mirai-alapú botnet, a ShadowV2 most először tűnt fel, és főként a D-Link, a TP-Link, valamint más gyártók sebezhető IoT-eszközeit támadta meg...

MA 09:30

Az olcsó kínai MI-lázba dől a külföldi tőke

📈 A kínai MI- és robotikacégek újabban a globális befektetők kedvencei lettek...

MA 09:23

Az immunrendszer kijátszható: egereken meggyógyították az 1-es típusú diabéteszt

Tipikus eset, amikor egy kitartó kutatócsoport egy aprósággal írhatja át a gyógyítás szabályait...

MA 09:16

Az ősi lábnyomok bizonyítják: Lucy mellett egy ismeretlen rokon élt

👣 Megvizsgálják, hogy a 15 évvel ezelőtt Etiópiában talált, megkövesedett lábfej valójában egy rejtélyes emberi rokonhoz tartozik-e, aki egy időben élt a híres Lucyval...

MA 09:08

A Stranger Things új évadától összeomlott a Netflix

A Netflix nézői rövid kimaradást tapasztaltak szerda este, amikor a szolgáltató elindította a régóta várt A furcsa dolgok (Stranger Things) ötödik, egyben utolsó évadát...

MA 09:02

A vércsék veszik fel a harcot a seregélyek ellen a cseresznyéért

A michigani cseresznyeültetvényeken hónapokkal a betakarítás után is izgalommal várják a következő szezont – de nemcsak a termés miatt...

MA 08:49

Az Amazon drónja internetkimaradást okozott: elvágott egy kábelt Texasban

Az Amazon drónos csomagszállítási programja ismét a figyelem középpontjába került, miután egy Waco városában történt incidens során az egyik MK30-as drón szétvágott egy internetkábelt...

MA 08:43

Az újabb londoni kibertámadás teljes káoszba taszította a várost

🖥 London három kerületének – köztük a Királyi Kensington és Chelsea, valamint a Westminster – önkormányzati informatikai rendszereit bénította meg egy friss kibertámadás...

MA 08:36

Rekordbírság: 540 milliót fizet a Comcast adatvédelmi botrány miatt

A Comcastra 540 millió forintos (1,5 millió USD) bírságot szabtak ki az Amerikai Távközlési Hatóság (FCC) vizsgálata után, miután 2024 februárjában egy adatkezelési partnerénél történt incidens során közel 270 ezer ügyfél személyes adata szivárgott ki...

MA 08:29

Az újabb leépítési hullám: embereket küld el a Redwood Materials

💀 A Redwood Materials, amely nemrég 126 milliárd forintnyi tőkét vont be (350 millió USD), most mégis a dolgozók 5 százalékától válik meg...

MA 08:23

Az ízületi gyulladás évekkel a tünetek előtt lopakodik be

A reumás ízületi gyulladás (RA) sokáig csendben, fájdalom és merevség nélkül indul...

MA 08:15

A bizonyíték megvan: életveszélyes villámlás a Marson

⚡ Számtalan elmélet után már bizonyított tény, hogy a Marson is van villámlás...

MA 08:01

A rendszerösszeomlás sem törte meg a Furcsa dolgok-lázat

🔥 A Netflix rövid időre összeomlott, amikor egyszerre rengetegen próbálták nézni a Furcsa dolgok (Stranger Things) ötödik évadának első négy epizódját...

MA 07:59

Az App Store szigorodik, és pénzügyi fordulat jön: ez változik most

💳 Az év vége felé közeledve az App Store számos jelentős változást jelentett be, amelyek sok fejlesztő, felhasználó és szülő életét befolyásolhatják...