Amit a webedből a mesterséges intelligencia robotok valóban keresnek

Amit a webedből a mesterséges intelligencia robotok valóban keresnek
Az elmúlt évtizedekben a keresőmotorok egyfajta szimbiózist alakítottak ki a weboldalak üzemeltetőivel: ha jól szerepelt a tartalmad a találati listákon, cserébe hozzád irányították a forgalmat, így reklámbevételekre is szert tehettél. Azonban ebbe a modellbe az utóbbi néhány évben markánsan beavatkoztak az MI platformok. A nyilvánosan elérhető nagy nyelvi modellek (például a ChatGPT) és az általuk kínált összefoglaló válaszok egyre inkább kiszorítják a hagyományos keresést – a felhasználók gyakran már eszük ágában sincs átkattintani az eredeti forráshoz, nemhogy ott reklámokra kattintani. Az MI továbbra is igényli a weboldalak tartalmát, annak letöltésére ugyanúgy igényt tart, viszont cserébe már nem hoz látogatókat.

Honnan jön az MI-forgalom, és mi a célja?

Lényeges hangsúlyozni, hogy az MI képzési célú letöltőrobotjai (MI-botok) fokozott intenzitással pásztázzák az internetet, gyakran figyelmen kívül hagyva a robots.txt direktívákat, amelyek más, „hagyományos” keresőrobotokat visszatartanak. Az MI platformok főként két céllal járják a webet: egyrészt adatot gyűjtenek a modellek tanításához, másrészt már működő MI-alapú keresők katalógusát töltik fel, vagy éppen konkrét felhasználói kérésre kutatnak információ után.

Az MI-robotok tevékenysége négy fő cél köré csoportosul: Képzés (Training), Keresés (Search), Felhasználói művelet (User action) és Nem deklarált (Undeclared – amikor nincs információ a működtetőtől) kategóriákban mérhető. A legfrissebb adatok szerint a képzési célú forgalom felel az MI-botok aktivitásának mintegy 80 százalékáért, amely meglehetősen hektikus: a napi vagy heti ciklusokban nincs egyértelmű ismétlődés. Ezzel szemben a felhasználói műveletekből származó, illetve a nem deklarált célú forgalomban jelentkeznek ciklikus mintázatok, de ezek együttesen is alig érik el az 5 százalékot.

Kiemelt botok és forgalmi mintázatok

Ha részletesebben nézzük, a ChatGPT-User bot felelt júliusban az ilyen célú kérések közel háromnegyedéért – tipikus „kérdezz-felelek” mintázatot mutatva: a napi aktivitás hullámzása jól látható a grafikonokon, és a hónap során is folyamatosan nő az ilyen aktivitások száma. Ha a ChatGPT-Usert kivesszük a képből, a Perplexity-User hasonló aktivitást mutat. Az adatelemzés lehetőséget ad arra, hogy ne csak botok, de konkrét felhasználási cél (például tanítás, keresés stb.) szerint is vizsgáljuk az adatokat akár hónapról hónapra, vagy visszamenőleg is.

Ágazati különbségek: kit mennyire „harapnak le” a botok?

Érdemes megvizsgálni, hogy az MI-robotok tevékenységének intenzitása hogyan oszlik meg az iparágak szerint: kihez hány letöltés után jutnak vissza humán látogatók?
Az AI Insights szekcióban iparági bontásban is láthatóvá vált, hogy egyes ágazatokban mennyit köszönhetsz az MI-botoknak – vagy éppen mennyire érezheted, hogy egyszerűen „elszippantják” a tartalmadat. Az adatok alapján például augusztus első hetében – amikor nincs kiválasztott ágazat vagy cél – a ClaudeBot és a GPTBot generálja az összes MI-alapú letöltés közel felét, a Meta-ExternalAgent pedig az öt legaktívabb robot közül az egyetlen, amelynél egyáltalán felfedezhető valamiféle mintázat.

Az arányok egészen eltérőek, ha kiválasztod a Hírek és kiadványok (News and Publications) szektort. Itt sokkal kiegyenlítettebb a top 5 robot forgalmának eloszlása: a ChatGPT-User 14,9 százalékos, a GPTBot 17,4 százalékos részesedéssel bír. Ráadásul a crawl-to-refer arány is alacsonyabb: az Anthropic botja 2 500:1, az OpenAI-nál 152:1, a Perplexitynél 32,7:1 – vagyis átlagosan ennyi robotforgalomból lesz egy visszairányított humán látogatás.

A Számítástechnika és elektronika (Computer and Electronics) ágazatban újabb sorrend alakul ki: GPTBot az első helyen, Amazonbot a másodikon; együtt a teljes forgalom több mint 40 százalékát adják. Az arányok itt is alacsonyak: az Anthropicknál „csak” 8 800:1, az OpenAI-nál 401,7:1, Perplexitynél 88:1.

A részletes Data Explorer felületen pedig teljesen személyre szabottan vizsgálhatók ezek az arányok, akár egy adott vertikumon, azon belül pedig konkrét iparág szerint is. Például a pénzügyi (Finance) vertikumban, a kriptovaluta (Cryptocurrency) ágazatban a teljes letöltési forgalom háromnegyede négy bothoz köthető, és ebből 80 százalék tanítási célú.


Mit tehetsz most és mi várható?

Összefoglalva megállapítható, hogy az MI-botok és feltérképező robotok forgalma ma már teljesen átszövi az internetes tartalomszolgáltatók életét, és már messze túlmutat a puszta gépi tanuláson. Jelenleg zajlik a szabványok kidolgozása arra vonatkozóan, hogyan jelezheti egy weboldal, hogy milyen módon használhatják fel vagy tiltják le adatait az automatizált rendszerek. Fontos hangsúlyozni, hogy ezek a szabványok ugyan már formálódnak, de iparági bevezetésük és alkalmazásuk még időt vesz igénybe. Addig is érdemes figyelemmel kísérni a MI Insights oldal legfrissebb elemzéseit, ahol naprakész információkat találhatsz az MI-botok aktivitásáról és az iparági trendekről.

2025, adminboss, blog.cloudflare.com alapján

Legfrissebb posztok

MA 07:15

Az MI-kamerák áldás vagy átok: hol a határ?

Érdemes megvizsgálni, milyen mértékben segíthetik a mesterséges intelligenciával támogatott kamerák a rendőrségi munkát, miközben komoly adatvédelmi aggályokat is felvetnek...

APP
MA 07:12

APPok, Amik Ingyenesek MA, 12/21

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Buffer Editor – Code Editor (iPhone/iPad)A Buffer Editor egy korszerű, mobil eszközökre fejlesztett kód- és szövegszerkesztő, amely ideális társ lehet mindennapi programozáshoz vagy jegyzeteléshez útközben...

MA 07:08

A visszavont indie díjak botránya: minden, amit tudni érdemes

🚨 A Clair Obscur: Expedition 33 fejlesztői alig ünnepelhették a frissen elnyert Év Játéka és Legjobb Debütáló Játék díjat az Indie Game Awards-on, mert a szervezők hamar visszavonták mindkét elismerést...

MA 07:02

Az egyházelhagyás súlyosabb következményekkel jár, mint hinnénk

Az utóbbi évtizedekben drámaian emelkedett a reménytelenséghez, kábítószer-túladagoláshoz, öngyilkossághoz vagy alkoholos májbetegséghez köthető halálesetek száma – a jelenség korántsem pusztán az opioidválságnak köszönhető...

MA 06:57

Az űrben már egymásnak esnek a katonai műholdak

Az amerikai USA–270 megfigyelőműhold éppen két, újonnan felbocsátott kínai űreszközt közelített meg 35 400 kilométeres magasságban, amikor az egyik kínai műhold váratlanul lelassított...

MA 06:44

Az XRP 2026-ban ismét eléri az 1100 forintos csúcsot?

2025 utolsó hónapjaira a vezető kriptovaluták számára gyenge év körvonalazódott. Ezek közül az XRP látta talán a leglátványosabb fordulatot: nyáron rövid időre 3,56 dollárig (kb...

MA 06:37

Az összefonódott kvantumdrónok forradalmasíthatják a katasztrófakezelést

🤖 Ha ma információt osztasz meg, legyen az e-mail, üzenet vagy bármilyen adat, az áthalad az interneten, ahol elkaphatják vagy lehallgathatják...

MA 06:29

A memóriák árrobbanása még sokáig velünk marad

📈 Az utóbbi években szinte hihetetlen magasságokba emelkedtek a memóriaárak, és a jelek szerint a közeljövőben sem várható fordulat...

MA 06:22

A filléres Steam Deck LCD-nek végleg befellegzett

😞 A legolcsóbb Steam Deck, a 256 GB-os LCD-modell, már nem kapható a Valve amerikai áruházában, és a gyártását is leállították...

MA 06:15

Az Apple 2025: három diadal, három nagy bukta

2025 újabb viharos évet hozott a techiparban, amelyet a gyorsan fejlődő MI és Donald Trump elnök vámjai által okozott gazdasági bizonytalanság is fűtött...

MA 06:05

Történelmi események a mai napon (December 21.)

Röviden: pápaválasztás, városostrom, sorsfordító csaták és sötét ipari katasztrófák jelölték ezt a napot...

MA 06:01

Az OpenAI áttörése: a ChatGPT most már szinte emberi

🚀 A ChatGPT mostantól személyre szabhatóbb, mint valaha. Az OpenAI legújabb frissítése lehetővé teszi, hogy mindenki beállítsa, mennyire legyen melegszívű vagy lelkes a bot – és akár azt is megmondhatod neki, hogy kevesebb emojit használjon...

szombat 20:48

A Firefoxban végre teljesen kikapcsolhatod az MI-t

A Mozilla új vezérigazgatója a héten bejelentette, hogy a Firefox modern MI-böngészővé válik, de a cég most azt is elárulta, hogy hamarosan egy teljes MI-kapcsolót vezetnek be...

szombat 20:34

A nagy csavar: az álmocskagomba nem is gomba

Sűrű, mohával borított erdők mélyén, Tajvan hegyeiben, Japán belsejében és Okinawa szubtrópusi lombjai alatt rejtőzik egy igencsak szokatlan élőlény...

szombat 20:18

Az MI forradalma a streamingben: végre tényleg nézhető lesz?

🎬 Érdemes megvizsgálni, hogy hamarosan teljesen új korszak köszönt be a videóstreaming világában...

szombat 20:02

Az öngyógyító kvantumszámítógép: mekkora az MI szénlábnyoma?

Kutatók áttörést értek el a kvantumszámítógépek fejlesztésében: elkészült az első, önmagát javítani képes rendszer...

szombat 19:18

A zöld miniszigetek felpezsdítik Dunedin belvárosát

Tényleg számítanak a legkisebb zöldterületek is: a Dunedin belvárosában megvalósított zöldítő projekt során utcai virágládákkal tették élőbbé és változatosabbá a környezetet...

szombat 19:01

A valódi ok, amiért hol nő, hol csökken a jövedelmed

📈 Érdemes megvizsgálni, mi mozgatja valójában a jövedelmek változását: hogyan lehet anyagilag előrelépni, és mi okozza a lecsúszást?..

szombat 18:50

Az új felfedezés mindent átírhat Titán rejtélyéről

Az eddigi elképzelések szerint a Szaturnusz legnagyobb holdja, a Titán, hatalmas óceánt rejt vastag, fagyott kérge alatt...