Amit a webedből a mesterséges intelligencia robotok valóban keresnek

Amit a webedből a mesterséges intelligencia robotok valóban keresnek
Az elmúlt évtizedekben a keresőmotorok egyfajta szimbiózist alakítottak ki a weboldalak üzemeltetőivel: ha jól szerepelt a tartalmad a találati listákon, cserébe hozzád irányították a forgalmat, így reklámbevételekre is szert tehettél. Azonban ebbe a modellbe az utóbbi néhány évben markánsan beavatkoztak az MI platformok. A nyilvánosan elérhető nagy nyelvi modellek (például a ChatGPT) és az általuk kínált összefoglaló válaszok egyre inkább kiszorítják a hagyományos keresést – a felhasználók gyakran már eszük ágában sincs átkattintani az eredeti forráshoz, nemhogy ott reklámokra kattintani. Az MI továbbra is igényli a weboldalak tartalmát, annak letöltésére ugyanúgy igényt tart, viszont cserébe már nem hoz látogatókat.

Honnan jön az MI-forgalom, és mi a célja?

Lényeges hangsúlyozni, hogy az MI képzési célú letöltőrobotjai (MI-botok) fokozott intenzitással pásztázzák az internetet, gyakran figyelmen kívül hagyva a robots.txt direktívákat, amelyek más, „hagyományos” keresőrobotokat visszatartanak. Az MI platformok főként két céllal járják a webet: egyrészt adatot gyűjtenek a modellek tanításához, másrészt már működő MI-alapú keresők katalógusát töltik fel, vagy éppen konkrét felhasználói kérésre kutatnak információ után.

Az MI-robotok tevékenysége négy fő cél köré csoportosul: Képzés (Training), Keresés (Search), Felhasználói művelet (User action) és Nem deklarált (Undeclared – amikor nincs információ a működtetőtől) kategóriákban mérhető. A legfrissebb adatok szerint a képzési célú forgalom felel az MI-botok aktivitásának mintegy 80 százalékáért, amely meglehetősen hektikus: a napi vagy heti ciklusokban nincs egyértelmű ismétlődés. Ezzel szemben a felhasználói műveletekből származó, illetve a nem deklarált célú forgalomban jelentkeznek ciklikus mintázatok, de ezek együttesen is alig érik el az 5 százalékot.

Kiemelt botok és forgalmi mintázatok

Ha részletesebben nézzük, a ChatGPT-User bot felelt júliusban az ilyen célú kérések közel háromnegyedéért – tipikus „kérdezz-felelek” mintázatot mutatva: a napi aktivitás hullámzása jól látható a grafikonokon, és a hónap során is folyamatosan nő az ilyen aktivitások száma. Ha a ChatGPT-Usert kivesszük a képből, a Perplexity-User hasonló aktivitást mutat. Az adatelemzés lehetőséget ad arra, hogy ne csak botok, de konkrét felhasználási cél (például tanítás, keresés stb.) szerint is vizsgáljuk az adatokat akár hónapról hónapra, vagy visszamenőleg is.

Ágazati különbségek: kit mennyire „harapnak le” a botok?

Érdemes megvizsgálni, hogy az MI-robotok tevékenységének intenzitása hogyan oszlik meg az iparágak szerint: kihez hány letöltés után jutnak vissza humán látogatók?
Az AI Insights szekcióban iparági bontásban is láthatóvá vált, hogy egyes ágazatokban mennyit köszönhetsz az MI-botoknak – vagy éppen mennyire érezheted, hogy egyszerűen „elszippantják” a tartalmadat. Az adatok alapján például augusztus első hetében – amikor nincs kiválasztott ágazat vagy cél – a ClaudeBot és a GPTBot generálja az összes MI-alapú letöltés közel felét, a Meta-ExternalAgent pedig az öt legaktívabb robot közül az egyetlen, amelynél egyáltalán felfedezhető valamiféle mintázat.

Az arányok egészen eltérőek, ha kiválasztod a Hírek és kiadványok (News and Publications) szektort. Itt sokkal kiegyenlítettebb a top 5 robot forgalmának eloszlása: a ChatGPT-User 14,9 százalékos, a GPTBot 17,4 százalékos részesedéssel bír. Ráadásul a crawl-to-refer arány is alacsonyabb: az Anthropic botja 2 500:1, az OpenAI-nál 152:1, a Perplexitynél 32,7:1 – vagyis átlagosan ennyi robotforgalomból lesz egy visszairányított humán látogatás.

A Számítástechnika és elektronika (Computer and Electronics) ágazatban újabb sorrend alakul ki: GPTBot az első helyen, Amazonbot a másodikon; együtt a teljes forgalom több mint 40 százalékát adják. Az arányok itt is alacsonyak: az Anthropicknál „csak” 8 800:1, az OpenAI-nál 401,7:1, Perplexitynél 88:1.

A részletes Data Explorer felületen pedig teljesen személyre szabottan vizsgálhatók ezek az arányok, akár egy adott vertikumon, azon belül pedig konkrét iparág szerint is. Például a pénzügyi (Finance) vertikumban, a kriptovaluta (Cryptocurrency) ágazatban a teljes letöltési forgalom háromnegyede négy bothoz köthető, és ebből 80 százalék tanítási célú.


Mit tehetsz most és mi várható?

Összefoglalva megállapítható, hogy az MI-botok és feltérképező robotok forgalma ma már teljesen átszövi az internetes tartalomszolgáltatók életét, és már messze túlmutat a puszta gépi tanuláson. Jelenleg zajlik a szabványok kidolgozása arra vonatkozóan, hogyan jelezheti egy weboldal, hogy milyen módon használhatják fel vagy tiltják le adatait az automatizált rendszerek. Fontos hangsúlyozni, hogy ezek a szabványok ugyan már formálódnak, de iparági bevezetésük és alkalmazásuk még időt vesz igénybe. Addig is érdemes figyelemmel kísérni a MI Insights oldal legfrissebb elemzéseit, ahol naprakész információkat találhatsz az MI-botok aktivitásáról és az iparági trendekről.

2025, adminboss, blog.cloudflare.com alapján

Legfrissebb posztok

MA 08:36

A RansomHouse új titkosító trükkökkel riogatja az áldozatokat

Az ismert RansomHouse zsarolóvírus-csoport nemrég komoly fejlesztéseken esett át: eddigi egyszerű titkosítási eljárása helyett most egy összetettebb, többrétegű titkosítási módszert alkalmaz...

MA 08:29

A műanyagválság elharapózik – ideje lépniük a kormányoknak!

A műanyagszennyezés világszerte egyre csak nő, miközben a globális műanyag-egyezményről szóló tárgyalások évek óta elakadtak...

MA 08:15

A mesterséges intelligencia már a hosszú feladatokat is viszi – Közel az áttörés?

Az elmúlt hat évben az MI-k képességei exponenciálisan nőttek: ma már olyan feladatok nagy részét is képesek megoldani, amelyek egy embernek napokat vagy heteket igényelnek...

MA 07:50

A NASA az űrből kapta lencsevégre a különleges üstököst

🚀 Felmerül a kérdés, hogy mi történik, ha egy rejtélyes vándorüstökös a Naprendszer közelébe sodródik, és csak űrszondával lehet megfigyelni...

MA 07:36

Az olcsó 2,5 GbE switch: aranybánya vagy zsákutca?

A Tenda SE105 egy 5 portos, ventilátor nélküli 2,5 GbE switch, amely erősen hasonlít a BrosTrend S2-re...

MA 07:29

A Sony–Honda első villanyautójában már távolról is fut a PS5

Sony és Honda közös vállalata, a Sony Honda Mobility bemutatta első közös elektromos autóját, az Afeelát, amely egy különleges extrát kap: az utazók távolról játszhatnak PlayStation 5 (PS5) és PlayStation 4 (PS4) játékokat az autó beépített kijelzőjén keresztül...

MA 07:23

A csoda, ami megmentette Christmas Valleyt a lángoktól

✨ 2021 augusztusában hihetetlen szerencsével menekült meg a Christmas Valley és Meyers közössége a hatalmas Caldor-tűz elől a Lake Tahoe-medencében...

MA 07:15

Az MI-kamerák áldás vagy átok: hol a határ?

Érdemes megvizsgálni, milyen mértékben segíthetik a mesterséges intelligenciával támogatott kamerák a rendőrségi munkát, miközben komoly adatvédelmi aggályokat is felvetnek...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 12/21

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Buffer Editor – Code Editor (iPhone/iPad)A Buffer Editor egy korszerű, mobil eszközökre fejlesztett kód- és szövegszerkesztő, amely ideális társ lehet mindennapi programozáshoz vagy jegyzeteléshez útközben...

MA 07:08

A visszavont indie díjak botránya: minden, amit tudni érdemes

🚨 A Clair Obscur: Expedition 33 fejlesztői alig ünnepelhették a frissen elnyert Év Játéka és Legjobb Debütáló Játék díjat az Indie Game Awards-on, mert a szervezők hamar visszavonták mindkét elismerést...

MA 07:02

Az egyházelhagyás súlyosabb következményekkel jár, mint hinnénk

Az utóbbi évtizedekben drámaian emelkedett a reménytelenséghez, kábítószer-túladagoláshoz, öngyilkossághoz vagy alkoholos májbetegséghez köthető halálesetek száma – a jelenség korántsem pusztán az opioidválságnak köszönhető...

MA 06:57

Az űrben már egymásnak esnek a katonai műholdak

Az amerikai USA–270 megfigyelőműhold éppen két, újonnan felbocsátott kínai űreszközt közelített meg 35 400 kilométeres magasságban, amikor az egyik kínai műhold váratlanul lelassított...

MA 06:44

Az XRP 2026-ban ismét eléri az 1100 forintos csúcsot?

2025 utolsó hónapjaira a vezető kriptovaluták számára gyenge év körvonalazódott. Ezek közül az XRP látta talán a leglátványosabb fordulatot: nyáron rövid időre 3,56 dollárig (kb...

MA 06:37

Az összefonódott kvantumdrónok forradalmasíthatják a katasztrófakezelést

🤖 Ha ma információt osztasz meg, legyen az e-mail, üzenet vagy bármilyen adat, az áthalad az interneten, ahol elkaphatják vagy lehallgathatják...

MA 06:29

A memóriák árrobbanása még sokáig velünk marad

📈 Az utóbbi években szinte hihetetlen magasságokba emelkedtek a memóriaárak, és a jelek szerint a közeljövőben sem várható fordulat...

MA 06:22

A filléres Steam Deck LCD-nek végleg befellegzett

😞 A legolcsóbb Steam Deck, a 256 GB-os LCD-modell, már nem kapható a Valve amerikai áruházában, és a gyártását is leállították...

MA 06:15

Az Apple 2025: három diadal, három nagy bukta

2025 újabb viharos évet hozott a techiparban, amelyet a gyorsan fejlődő MI és Donald Trump elnök vámjai által okozott gazdasági bizonytalanság is fűtött...

MA 06:05

Történelmi események a mai napon (December 21.)

Röviden: pápaválasztás, városostrom, sorsfordító csaták és sötét ipari katasztrófák jelölték ezt a napot...

MA 06:01

Az OpenAI áttörése: a ChatGPT most már szinte emberi

🚀 A ChatGPT mostantól személyre szabhatóbb, mint valaha. Az OpenAI legújabb frissítése lehetővé teszi, hogy mindenki beállítsa, mennyire legyen melegszívű vagy lelkes a bot – és akár azt is megmondhatod neki, hogy kevesebb emojit használjon...