Amit a webedből a mesterséges intelligencia robotok valóban keresnek

Amit a webedből a mesterséges intelligencia robotok valóban keresnek
Az elmúlt évtizedekben a keresőmotorok egyfajta szimbiózist alakítottak ki a weboldalak üzemeltetőivel: ha jól szerepelt a tartalmad a találati listákon, cserébe hozzád irányították a forgalmat, így reklámbevételekre is szert tehettél. Azonban ebbe a modellbe az utóbbi néhány évben markánsan beavatkoztak az MI platformok. A nyilvánosan elérhető nagy nyelvi modellek (például a ChatGPT) és az általuk kínált összefoglaló válaszok egyre inkább kiszorítják a hagyományos keresést – a felhasználók gyakran már eszük ágában sincs átkattintani az eredeti forráshoz, nemhogy ott reklámokra kattintani. Az MI továbbra is igényli a weboldalak tartalmát, annak letöltésére ugyanúgy igényt tart, viszont cserébe már nem hoz látogatókat.

Honnan jön az MI-forgalom, és mi a célja?

Lényeges hangsúlyozni, hogy az MI képzési célú letöltőrobotjai (MI-botok) fokozott intenzitással pásztázzák az internetet, gyakran figyelmen kívül hagyva a robots.txt direktívákat, amelyek más, „hagyományos” keresőrobotokat visszatartanak. Az MI platformok főként két céllal járják a webet: egyrészt adatot gyűjtenek a modellek tanításához, másrészt már működő MI-alapú keresők katalógusát töltik fel, vagy éppen konkrét felhasználói kérésre kutatnak információ után.

Az MI-robotok tevékenysége négy fő cél köré csoportosul: Képzés (Training), Keresés (Search), Felhasználói művelet (User action) és Nem deklarált (Undeclared – amikor nincs információ a működtetőtől) kategóriákban mérhető. A legfrissebb adatok szerint a képzési célú forgalom felel az MI-botok aktivitásának mintegy 80 százalékáért, amely meglehetősen hektikus: a napi vagy heti ciklusokban nincs egyértelmű ismétlődés. Ezzel szemben a felhasználói műveletekből származó, illetve a nem deklarált célú forgalomban jelentkeznek ciklikus mintázatok, de ezek együttesen is alig érik el az 5 százalékot.

Kiemelt botok és forgalmi mintázatok

Ha részletesebben nézzük, a ChatGPT-User bot felelt júliusban az ilyen célú kérések közel háromnegyedéért – tipikus „kérdezz-felelek” mintázatot mutatva: a napi aktivitás hullámzása jól látható a grafikonokon, és a hónap során is folyamatosan nő az ilyen aktivitások száma. Ha a ChatGPT-Usert kivesszük a képből, a Perplexity-User hasonló aktivitást mutat. Az adatelemzés lehetőséget ad arra, hogy ne csak botok, de konkrét felhasználási cél (például tanítás, keresés stb.) szerint is vizsgáljuk az adatokat akár hónapról hónapra, vagy visszamenőleg is.

Ágazati különbségek: kit mennyire „harapnak le” a botok?

Érdemes megvizsgálni, hogy az MI-robotok tevékenységének intenzitása hogyan oszlik meg az iparágak szerint: kihez hány letöltés után jutnak vissza humán látogatók?
Az AI Insights szekcióban iparági bontásban is láthatóvá vált, hogy egyes ágazatokban mennyit köszönhetsz az MI-botoknak – vagy éppen mennyire érezheted, hogy egyszerűen „elszippantják” a tartalmadat. Az adatok alapján például augusztus első hetében – amikor nincs kiválasztott ágazat vagy cél – a ClaudeBot és a GPTBot generálja az összes MI-alapú letöltés közel felét, a Meta-ExternalAgent pedig az öt legaktívabb robot közül az egyetlen, amelynél egyáltalán felfedezhető valamiféle mintázat.

Az arányok egészen eltérőek, ha kiválasztod a Hírek és kiadványok (News and Publications) szektort. Itt sokkal kiegyenlítettebb a top 5 robot forgalmának eloszlása: a ChatGPT-User 14,9 százalékos, a GPTBot 17,4 százalékos részesedéssel bír. Ráadásul a crawl-to-refer arány is alacsonyabb: az Anthropic botja 2 500:1, az OpenAI-nál 152:1, a Perplexitynél 32,7:1 – vagyis átlagosan ennyi robotforgalomból lesz egy visszairányított humán látogatás.

A Számítástechnika és elektronika (Computer and Electronics) ágazatban újabb sorrend alakul ki: GPTBot az első helyen, Amazonbot a másodikon; együtt a teljes forgalom több mint 40 százalékát adják. Az arányok itt is alacsonyak: az Anthropicknál „csak” 8 800:1, az OpenAI-nál 401,7:1, Perplexitynél 88:1.

A részletes Data Explorer felületen pedig teljesen személyre szabottan vizsgálhatók ezek az arányok, akár egy adott vertikumon, azon belül pedig konkrét iparág szerint is. Például a pénzügyi (Finance) vertikumban, a kriptovaluta (Cryptocurrency) ágazatban a teljes letöltési forgalom háromnegyede négy bothoz köthető, és ebből 80 százalék tanítási célú.


Mit tehetsz most és mi várható?

Összefoglalva megállapítható, hogy az MI-botok és feltérképező robotok forgalma ma már teljesen átszövi az internetes tartalomszolgáltatók életét, és már messze túlmutat a puszta gépi tanuláson. Jelenleg zajlik a szabványok kidolgozása arra vonatkozóan, hogyan jelezheti egy weboldal, hogy milyen módon használhatják fel vagy tiltják le adatait az automatizált rendszerek. Fontos hangsúlyozni, hogy ezek a szabványok ugyan már formálódnak, de iparági bevezetésük és alkalmazásuk még időt vesz igénybe. Addig is érdemes figyelemmel kísérni a MI Insights oldal legfrissebb elemzéseit, ahol naprakész információkat találhatsz az MI-botok aktivitásáról és az iparági trendekről.

2025, adminboss, blog.cloudflare.com alapján


Legfrissebb posztok

MA 11:02

Legmenőbb angol szlengek 2025-re

mastige Londonban született reklámszó. Amikor azt akarod mondani, hogy egy termék egyszerre presztízs és tömegcucc — például egy olyan elektronikai kütyü, amit ugyan drágának tartanak, mégis rengetegen megveszik...



MA 16:37

Az MI újabb átverése: Kamu Nvidia-bemutató szedte áldozatait

Majdnem 100 ezer ember nézte végig, ahogy egy hamis, MI által megalkotott Jensen Huang prezentált egy Nvidia GTC főelőadást, amely valójában kriptovaluta-átverés volt...



MA 16:29

Tényleg erre vágyunk, hogy minden kütyüben MI legyen?

Kevin Rose egyszerű, de annál szemléletesebb szűrőt használ, amikor MI-hardverekbe fektet: ha valakit legszívesebben orrba vágnál azért, mert valamilyen kütyüt visel, inkább kerüld el azt a terméket – és jobb, ha nem ölsz pénzt ilyen fejlesztésbe sem...

MA 16:18

Az apró elektromotor, amely négy Teslát is lepipál

A brit YASA egy új, elképesztően kicsi elektromotort alkotott, amely teljesítményével bőven túlszárnyalja a jelenlegi rekorder motorokat...

MA 16:10

Az MI-chatbotok új generációjával mindenhol ott lehetsz

Az MI-alapú chatbotok forradalma elhozta azt a pillanatot, amikor bárki könnyedén létrehozhat saját, testreszabott virtuális asszisztenst, amely mindenhol bevethető – legyen szó weboldalról, közösségi platformokról vagy vállalati csapatmunkáról...

MA 16:00

Az Amazon elektromos furgonjai végre Kanadában is feltűntek

Az Amazon most először vetette be a Rivian által gyártott elektromos kiszállító furgonokat Kanadában: a Vancouver környékén már 50 ilyen jármű dolgozik...



MA 15:56

Az MI-vel készült zene tényleg olyan, mint az emberi?

🎵 Az MI által készített zene egyre közelebb áll ahhoz, hogy megkülönböztesse magát az emberi alkotástól – legalábbis, ami a hangzást illeti...

MA 15:46

Az MI bakija: Kamuhírekkel kevert szenátorbotrány a Google-nél

A Google kénytelen volt eltávolítani Gemma nevű MI-modelljét az AI Studio platformról, miután Marsha Blackburn amerikai szenátor panaszt tett: a rendszer hamis és súlyos vádakkal illette őt...



MA 15:37

Az 1 petabájtos SSD-k útja: a Meta új tárhelyvíziója

💾 A Meta új korszakot nyitna az adattárolásban és a GPU-kiszolgáló-infrastruktúrában, amikor 1 PB (1024 TB) kapacitású, E2 formátumú SSD-ket vezetne be...

MA 15:28

Az Nvidia óriási pénzzel dobja meg a Poolside-ot

Az Nvidia akár 360 milliárd forinttal is beszállhat a mesterséges intelligenciával foglalkozó Poolside nevű startupba...



MA 15:20

Amikor az állatvilág trükkösen félrevezeti az érzékelést

👀 Az optikai illúziók nem csupán az emberek kiváltsága: számos állat is észleli, sőt, ki is használja őket...



MA 14:46

Egy új vérteszt végre igazolja a krónikus fáradtság szindrómát

Tudósok a University of East Anglia és az Oxford BioDynamics közreműködésével olyan vértesztet fejlesztettek ki, amely 96 százalékos pontossággal képes kimutatni a krónikus fáradtság szindrómát (Myalgic Encephalomyelitis, ME/CFS)...



MA 14:38

A nagyvállalatok profitja már nem függ a dolgozók számától

📈 A technológiai szektorban drámai átalakulás zajlott le az elmúlt évtizedekben: már nem igaz, hogy a bevételnövekedéshez arányosan több dolgozóra van szükség...

MA 14:29

Új aranyláz, őrült roham a ritkaföldfémekért

Lényeges szempont, hogy a világgazdaság újabb nagy átalakuláson megy keresztül. Most nem az arany, nem az olaj, hanem a ritkaföldfémek pörgetik az árfolyamokat, és a befektetők szemében ezek értéke soha nem látott magasságokba emelkedik...



MA 14:19

Miért lassulhat az internet, a CGNAT mindannyiunkat érinti

📡 Ahogy rohamosan fogynak az IPv4-címek a világban, a szolgáltatók forradalmi, de nem problémamentes megoldáshoz fordultak: egyesek már több száz, vagy akár ezer felhasználót tesznek egyetlen IP-cím mögé a Carrier-Grade NAT (CGNAT) technológiával...

MA 14:03

Az Aqara G100 mindent tudó, olcsó biztonsági kamera

📺 A biztonsági kamerák piaca egyre zsúfoltabb, de kevés olyan eszköz akad, amely egyszerre ennyire megfizethető és sokoldalú, mint az Aqara legújabb modellje, a G100...

MA 13:46

Megjött az év legnagyobb Kickstarter-sikere: itt a Snapmaker U1

🚀 A Snapmaker végre bemutatta régóta várt U1 3D nyomtatóját, amely rekordot döntött a Kickstarteren: több mint 20 000 támogatóval közel 7,3 milliárd forintnyi előrendelést gyűjtött...

MA 13:28

Az önvezető taxik harca: a Baidu utolérte a Waymót

A Baidu Apollo Go szolgáltatása heti 250 ezer önvezető robotaxi-fuvart teljesít Kínában, így mostanra beérte az Alphabet Waymóját (Waymo), amely tavasszal szintén ekkora forgalmat jelentett be az Egyesült Államokban...



MA 13:19

Az MI-ügynökök védelme még mindig gyenge

🛡 Az utóbbi időben két új, figyelemre méltó tanulmány is napvilágot látott a nagy nyelvi modellek (LLM) biztonságával és a prompt injection támadásokkal kapcsolatban...