2025. 09. 13., 16:03

Amit a webedből a mesterséges intelligencia robotok valóban keresnek

Amit a webedből a mesterséges intelligencia robotok valóban keresnek
Az elmúlt évtizedekben a keresőmotorok egyfajta szimbiózist alakítottak ki a weboldalak üzemeltetőivel: ha jól szerepelt a tartalmad a találati listákon, cserébe hozzád irányították a forgalmat, így reklámbevételekre is szert tehettél. Azonban ebbe a modellbe az utóbbi néhány évben markánsan beavatkoztak az MI platformok. A nyilvánosan elérhető nagy nyelvi modellek (például a ChatGPT) és az általuk kínált összefoglaló válaszok egyre inkább kiszorítják a hagyományos keresést – a felhasználók gyakran már eszük ágában sincs átkattintani az eredeti forráshoz, nemhogy ott reklámokra kattintani. Az MI továbbra is igényli a weboldalak tartalmát, annak letöltésére ugyanúgy igényt tart, viszont cserébe már nem hoz látogatókat.

Honnan jön az MI-forgalom, és mi a célja?

Lényeges hangsúlyozni, hogy az MI képzési célú letöltőrobotjai (MI-botok) fokozott intenzitással pásztázzák az internetet, gyakran figyelmen kívül hagyva a robots.txt direktívákat, amelyek más, „hagyományos” keresőrobotokat visszatartanak. Az MI platformok főként két céllal járják a webet: egyrészt adatot gyűjtenek a modellek tanításához, másrészt már működő MI-alapú keresők katalógusát töltik fel, vagy éppen konkrét felhasználói kérésre kutatnak információ után.

Az MI-robotok tevékenysége négy fő cél köré csoportosul: Képzés (Training), Keresés (Search), Felhasználói művelet (User action) és Nem deklarált (Undeclared – amikor nincs információ a működtetőtől) kategóriákban mérhető. A legfrissebb adatok szerint a képzési célú forgalom felel az MI-botok aktivitásának mintegy 80 százalékáért, amely meglehetősen hektikus: a napi vagy heti ciklusokban nincs egyértelmű ismétlődés. Ezzel szemben a felhasználói műveletekből származó, illetve a nem deklarált célú forgalomban jelentkeznek ciklikus mintázatok, de ezek együttesen is alig érik el az 5 százalékot.

Kiemelt botok és forgalmi mintázatok

Ha részletesebben nézzük, a ChatGPT-User bot felelt júliusban az ilyen célú kérések közel háromnegyedéért – tipikus „kérdezz-felelek” mintázatot mutatva: a napi aktivitás hullámzása jól látható a grafikonokon, és a hónap során is folyamatosan nő az ilyen aktivitások száma. Ha a ChatGPT-Usert kivesszük a képből, a Perplexity-User hasonló aktivitást mutat. Az adatelemzés lehetőséget ad arra, hogy ne csak botok, de konkrét felhasználási cél (például tanítás, keresés stb.) szerint is vizsgáljuk az adatokat akár hónapról hónapra, vagy visszamenőleg is.

Ágazati különbségek: kit mennyire „harapnak le” a botok?

Érdemes megvizsgálni, hogy az MI-robotok tevékenységének intenzitása hogyan oszlik meg az iparágak szerint: kihez hány letöltés után jutnak vissza humán látogatók?
Az AI Insights szekcióban iparági bontásban is láthatóvá vált, hogy egyes ágazatokban mennyit köszönhetsz az MI-botoknak – vagy éppen mennyire érezheted, hogy egyszerűen „elszippantják” a tartalmadat. Az adatok alapján például augusztus első hetében – amikor nincs kiválasztott ágazat vagy cél – a ClaudeBot és a GPTBot generálja az összes MI-alapú letöltés közel felét, a Meta-ExternalAgent pedig az öt legaktívabb robot közül az egyetlen, amelynél egyáltalán felfedezhető valamiféle mintázat.

Az arányok egészen eltérőek, ha kiválasztod a Hírek és kiadványok (News and Publications) szektort. Itt sokkal kiegyenlítettebb a top 5 robot forgalmának eloszlása: a ChatGPT-User 14,9 százalékos, a GPTBot 17,4 százalékos részesedéssel bír. Ráadásul a crawl-to-refer arány is alacsonyabb: az Anthropic botja 2 500:1, az OpenAI-nál 152:1, a Perplexitynél 32,7:1 – vagyis átlagosan ennyi robotforgalomból lesz egy visszairányított humán látogatás.

A Számítástechnika és elektronika (Computer and Electronics) ágazatban újabb sorrend alakul ki: GPTBot az első helyen, Amazonbot a másodikon; együtt a teljes forgalom több mint 40 százalékát adják. Az arányok itt is alacsonyak: az Anthropicknál „csak” 8 800:1, az OpenAI-nál 401,7:1, Perplexitynél 88:1.

A részletes Data Explorer felületen pedig teljesen személyre szabottan vizsgálhatók ezek az arányok, akár egy adott vertikumon, azon belül pedig konkrét iparág szerint is. Például a pénzügyi (Finance) vertikumban, a kriptovaluta (Cryptocurrency) ágazatban a teljes letöltési forgalom háromnegyede négy bothoz köthető, és ebből 80 százalék tanítási célú.


Mit tehetsz most és mi várható?

Összefoglalva megállapítható, hogy az MI-botok és feltérképező robotok forgalma ma már teljesen átszövi az internetes tartalomszolgáltatók életét, és már messze túlmutat a puszta gépi tanuláson. Jelenleg zajlik a szabványok kidolgozása arra vonatkozóan, hogyan jelezheti egy weboldal, hogy milyen módon használhatják fel vagy tiltják le adatait az automatizált rendszerek. Fontos hangsúlyozni, hogy ezek a szabványok ugyan már formálódnak, de iparági bevezetésük és alkalmazásuk még időt vesz igénybe. Addig is érdemes figyelemmel kísérni a MI Insights oldal legfrissebb elemzéseit, ahol naprakész információkat találhatsz az MI-botok aktivitásáról és az iparági trendekről.

2025, adminboss, blog.cloudflare.com alapján

Legfrissebb posztok

MA 14:04

Az Avata 360: drónforradalom, vagy csak pörgünk körbe-körbe?

🚀 A DJI legfrissebb dobása, az Avata 360 drón nemcsak a panorámadrónozás világát forgatja fel, hanem az otthoni filmezés, vlogolás és kalandvideók piacát is...

MA 13:57

Az Intel Battlemage végre megérkezett, de a játékosok csalódhatnak

Az Intel hosszú várakozás után bemutatta új grafikus kártyáját, az Arc Pro B70-et, amely a régóta pletykált Big Battlemage GPU-ra épül, ám ezúttal nem a játékosokat, hanem az MI-alkalmazásokat célozza meg...

MA 13:45

Az Uber robotaxijai megrohanják Horvátországot – kínai technikával

Zágráb utcáira érkezik az Uber és a kínai Pony.ai közös robotaxi-szolgáltatása, amelyet egy horvát cég, a Verne fog össze – ők gondoskodnak a teljes működési rendszer kiépítéséről...

MA 13:23

Az Exynos 2800: végre tanult a hibáiból a Samsung?

Érdemes megvizsgálni, milyen változások várhatók a Samsung következő generációs mobilchipjénél. Az Exynos 2800 koncepciója mostanra körvonalazódik, és úgy tűnik, a vállalat ezúttal a stabilitást helyezi előtérbe a Galaxy S28 szériánál...

MA 12:01

Az új PolyShell-támadás a Magento-áruházak felét fenyegeti

Fontos megérteni, hogy az utóbbi napokban tömeges támadássorozat indult a Magento Open Source és az Adobe Commerce rendszereket érintő, súlyos PolyShell-sebezhetőség kihasználására...

MA 11:56

Az MI megeszi az adatközpontok akkumulátorait – új korszakot nyit a Panasonic

A nagy memóriagyártók már minden idei moduljukat eladták, így hiányok és áremelkedések alakultak ki a piacon...

MA 11:45

Az új Razer Blade 16: karcsú, brutális és piszkosul drága

A Razer legújabb, 16 hüvelykes laptopja látványos hardverfrissítéssel érkezik: az Intel vadonatúj Core Ultra lapkáival és ultragyors, 9600 MHz-es LPDDR5X memóriával kapható, legalább 32 GB-tal szerelve...

MA 11:34

Az új Galaxy A57 végre könnyebben javítható

🔧 A Samsung Galaxy A57 5G-t már a bemutató előtt, néhány órával szét is szedték, és ami a leginkább feltűnő: a telefont végre a könnyű javíthatóság jegyében tervezték...

MA 11:12

A techóriások pórul jártak: kétmilliárdos bírság a közösségi oldalaknak

💸 Egy amerikai esküdtszék történelmi döntése értelmében a Meta és a YouTube összesen 6 millió dollár (közel 2,2 milliárd forint) kártérítést köteles fizetni egy ma 20 éves fiatal nőnek és édesanyjának...

MA 11:02

Az elektronikus hadviselés felforgatta a Perzsa-öböl rendjét

A Perzsa-öböl térségében az utóbbi hetekben a helymeghatározó rendszerek zavarása szinte mindennapossá vált...

MA 10:58

Az Intel új Arc Pro kártyái forradalmat hoznak a munkaállomások piacán

Az Intel most masszív lendületet ad az Arc B-sorozatú videokártyáinak, két új modellel: megérkezett az Arc Pro B70 és az Arc Pro B65...

MA 10:51

Az amerikai Hold-állomásról indul az atommeghajtású Mars-küldetés

🚀 Érdekes felvetés, hogy mi lesz a sorsa annak a több milliárd dollárért fejlesztett Hold körüli űrállomásnak, amelynek építését az Egyesült Államok most jegeli, hogy az erőforrásokat inkább más, nagyobb szabású célokra összpontosítsa...

MA 10:43

A Ring új videócsengői végre vezeték nélküliek és 4K-sak

A Ring új szintre emelte kültéri biztonsági eszközeit: elérhetővé váltak a vezeték nélküli, akkumulátoros verziók a 4K-s és 2K-s felbontású videócsengőkből is, már 29 000 Ft-tól...

MA 10:36

Az Insta nem játék: a nagyok rászoktatták, 3 millió dollárt kaszált

💸 A kaliforniai bíróság most tényleg odacsapott: két techóriást, a Metát és a Google-t is felelőssé tették, amiért addiktív dizájnnal szippantották be a fiatalokat...

MA 10:29

Az X kriptóvezért igazolt a pénzügyi áttöréshez

Különösen igaz ez akkor, ha a közösségi médiaóriások pénzügyi szolgáltatások irányába terjeszkednek...

MA 09:57

A rendőrség új szuperdrónja Starlinket is cipel

A dróntechnológia új korszakába lépett, amikor a BRINC bemutatta legújabb fejlesztését, a Guardian nevű, kifejezetten rendőrségi célokra szánt drónt...

MA 09:29

Az éber álom lehet a pihentető alvás titka?

😴 Éjszaka nemcsak testünk pihen, agyunk is különös utakat jár be. Egy friss kutatás szerint ugyanis a színes, élénk álmok nem csupán szórakoztatnak, hanem hozzájárulhatnak ahhoz is, hogy reggel valóban kipihentnek érezzük magunkat — sőt, az intenzív álmodás azoknak az éjszakáknak a titka, amikor a legmélyebbnek érezzük az alvást, függetlenül attól, mennyire aktív maradt közben az...

MA 09:16

A nagy leleplezés: mit naplóz rólad valójában a VPN-ed?

👀 Fontos kérdés, hogy mennyi adatot gyűjt rólad egy VPN, miközben elvileg éppen azt ígéri, hogy megvédi a magánszférádat...

MA 09:08

Az űrtávcsövek lélegzetelállító fotókon tárják fel a Szaturnuszt

🛰 A NASA frissen közzétett képei segítségével a Szaturnusz eddig soha nem látott részletességben tárul elénk...

MA 08:50

Az Apple lehagyhatja a Samsungot a 200 megapixeles iPhone-kamerával

Az Apple évek óta kivár a mobilkamerák terén, de most végre felrázhatja a piacot: tesztelés alatt áll egy 200 megapixeles főkamera, amely nagyobb lehet, mint a Samsung Galaxy S26 Ultra 200 megapixeles érzékelője...

MA 08:43

Az igazság ára: egy volt NASA-klímakutató megrázó vallomása

💬 Fontos kérdés, hogy mi történik akkor, amikor a tudományos élet válságba kerül, és azok is távoznak, akik egyszer a kutatás iránti elkötelezettséget mindennél előbbre valónak tartották...

MA 08:36

Az új trükk: virtuális telefonokkal csapnak le a csalók

Ilyen eset például, amikor a csalók nem valódi telefonokat, hanem virtuális okostelefonokat használnak, hogy teljesen hiteles felhasználónak tűnjenek...

MA 08:29

Az új, rettegett vírus lecsap a kriptopénzedre, és ellopja a jelszavaidat

Egy új, folyamatosan fejlődő kártevő, a Torg Grabber már 850 böngészőbővítményből képes érzékeny adatokat ellopni, ebből 728 kifejezetten kriptopénztárcákhoz kapcsolódik...

MA 07:57

Az új tömegspektrométer egyszerre milliárdnyi molekula titkát fedi fel

🔬 Az elmúlt évtizedekben a tömegspektrometria alapvető eszközzé vált a tudományos kutatásban, ám a technika egyik legnagyobb korlátja, hogy a legtöbb jelenleg használt műszer egyszerre csak néhány molekulát képes elemezni...

MA 07:50

Az MI‑ellátási lánc új réme: hamis papírral is támadnak

🛑 A szoftverellátási lánc sebezhetőségei eddig főként kártevők és zsarolóvírusok révén kerültek be a köztudatba, azonban most egy lényegesen egyszerűbb módszer is elérhetővé vált a támadóknak: rosszindulatú vagy hamisított API-dokumentációval is megvezethetők az MI-alapú kódoló ügynökök...

MA 07:36

Az amerikai tél halálos ára: évente 40 ezer infarktus

Az USA-ban a zimankós hónapok alatt ugrásszerűen megnő a szív- és érrendszeri halálozások száma...

MA 07:22

Az MI-s Bubble-alkalmazások új húzása: tömeges Microsoft-fióklopás

A bűnözők legújabb trükkje, hogy a Bubble nevű, no-code, MI-alapú alkalmazáskészítő platformot használják Microsoft-fiókok elleni adathalász támadásokhoz...

APP
MA 07:11

APPok, Amik Ingyenesek MA, 3/26

Fizetős iOS appok és játékok, amik ingyenesek a mai napon...

MA 07:08

A Reddit az emberekért küzd: jön az emberazonosítás

👤 A Reddit új lépést tett a gyanús aktivitás kiszűrésére: hamarosan arra kötelezi azokat a fiókokat, amelyek automatizált vagy egyébként gépies viselkedést mutatnak, hogy igazolják, valóban ember kezeli őket...