Amit a webedből a mesterséges intelligencia robotok valóban keresnek

Amit a webedből a mesterséges intelligencia robotok valóban keresnek
Az elmúlt évtizedekben a keresőmotorok egyfajta szimbiózist alakítottak ki a weboldalak üzemeltetőivel: ha jól szerepelt a tartalmad a találati listákon, cserébe hozzád irányították a forgalmat, így reklámbevételekre is szert tehettél. Azonban ebbe a modellbe az utóbbi néhány évben markánsan beavatkoztak az MI platformok. A nyilvánosan elérhető nagy nyelvi modellek (például a ChatGPT) és az általuk kínált összefoglaló válaszok egyre inkább kiszorítják a hagyományos keresést – a felhasználók gyakran már eszük ágában sincs átkattintani az eredeti forráshoz, nemhogy ott reklámokra kattintani. Az MI továbbra is igényli a weboldalak tartalmát, annak letöltésére ugyanúgy igényt tart, viszont cserébe már nem hoz látogatókat.

Honnan jön az MI-forgalom, és mi a célja?

Lényeges hangsúlyozni, hogy az MI képzési célú letöltőrobotjai (MI-botok) fokozott intenzitással pásztázzák az internetet, gyakran figyelmen kívül hagyva a robots.txt direktívákat, amelyek más, „hagyományos” keresőrobotokat visszatartanak. Az MI platformok főként két céllal járják a webet: egyrészt adatot gyűjtenek a modellek tanításához, másrészt már működő MI-alapú keresők katalógusát töltik fel, vagy éppen konkrét felhasználói kérésre kutatnak információ után.

Az MI-robotok tevékenysége négy fő cél köré csoportosul: Képzés (Training), Keresés (Search), Felhasználói művelet (User action) és Nem deklarált (Undeclared – amikor nincs információ a működtetőtől) kategóriákban mérhető. A legfrissebb adatok szerint a képzési célú forgalom felel az MI-botok aktivitásának mintegy 80 százalékáért, amely meglehetősen hektikus: a napi vagy heti ciklusokban nincs egyértelmű ismétlődés. Ezzel szemben a felhasználói műveletekből származó, illetve a nem deklarált célú forgalomban jelentkeznek ciklikus mintázatok, de ezek együttesen is alig érik el az 5 százalékot.

Kiemelt botok és forgalmi mintázatok

Ha részletesebben nézzük, a ChatGPT-User bot felelt júliusban az ilyen célú kérések közel háromnegyedéért – tipikus „kérdezz-felelek” mintázatot mutatva: a napi aktivitás hullámzása jól látható a grafikonokon, és a hónap során is folyamatosan nő az ilyen aktivitások száma. Ha a ChatGPT-Usert kivesszük a képből, a Perplexity-User hasonló aktivitást mutat. Az adatelemzés lehetőséget ad arra, hogy ne csak botok, de konkrét felhasználási cél (például tanítás, keresés stb.) szerint is vizsgáljuk az adatokat akár hónapról hónapra, vagy visszamenőleg is.

Ágazati különbségek: kit mennyire „harapnak le” a botok?

Érdemes megvizsgálni, hogy az MI-robotok tevékenységének intenzitása hogyan oszlik meg az iparágak szerint: kihez hány letöltés után jutnak vissza humán látogatók?
Az AI Insights szekcióban iparági bontásban is láthatóvá vált, hogy egyes ágazatokban mennyit köszönhetsz az MI-botoknak – vagy éppen mennyire érezheted, hogy egyszerűen „elszippantják” a tartalmadat. Az adatok alapján például augusztus első hetében – amikor nincs kiválasztott ágazat vagy cél – a ClaudeBot és a GPTBot generálja az összes MI-alapú letöltés közel felét, a Meta-ExternalAgent pedig az öt legaktívabb robot közül az egyetlen, amelynél egyáltalán felfedezhető valamiféle mintázat.

Az arányok egészen eltérőek, ha kiválasztod a Hírek és kiadványok (News and Publications) szektort. Itt sokkal kiegyenlítettebb a top 5 robot forgalmának eloszlása: a ChatGPT-User 14,9 százalékos, a GPTBot 17,4 százalékos részesedéssel bír. Ráadásul a crawl-to-refer arány is alacsonyabb: az Anthropic botja 2 500:1, az OpenAI-nál 152:1, a Perplexitynél 32,7:1 – vagyis átlagosan ennyi robotforgalomból lesz egy visszairányított humán látogatás.

A Számítástechnika és elektronika (Computer and Electronics) ágazatban újabb sorrend alakul ki: GPTBot az első helyen, Amazonbot a másodikon; együtt a teljes forgalom több mint 40 százalékát adják. Az arányok itt is alacsonyak: az Anthropicknál „csak” 8 800:1, az OpenAI-nál 401,7:1, Perplexitynél 88:1.

A részletes Data Explorer felületen pedig teljesen személyre szabottan vizsgálhatók ezek az arányok, akár egy adott vertikumon, azon belül pedig konkrét iparág szerint is. Például a pénzügyi (Finance) vertikumban, a kriptovaluta (Cryptocurrency) ágazatban a teljes letöltési forgalom háromnegyede négy bothoz köthető, és ebből 80 százalék tanítási célú.


Mit tehetsz most és mi várható?

Összefoglalva megállapítható, hogy az MI-botok és feltérképező robotok forgalma ma már teljesen átszövi az internetes tartalomszolgáltatók életét, és már messze túlmutat a puszta gépi tanuláson. Jelenleg zajlik a szabványok kidolgozása arra vonatkozóan, hogyan jelezheti egy weboldal, hogy milyen módon használhatják fel vagy tiltják le adatait az automatizált rendszerek. Fontos hangsúlyozni, hogy ezek a szabványok ugyan már formálódnak, de iparági bevezetésük és alkalmazásuk még időt vesz igénybe. Addig is érdemes figyelemmel kísérni a MI Insights oldal legfrissebb elemzéseit, ahol naprakész információkat találhatsz az MI-botok aktivitásáról és az iparági trendekről.

2025, adminboss, blog.cloudflare.com alapján


Legfrissebb posztok

MA 09:54

Az okosotthonok bukása: egyre többen kapcsolnak vissza analógra

A legújabb lakberendezési trend szerint egyre többen szabadulnak meg az okosotthonoktól, és térnek vissza az egyszerű, analóg berendezésekhez...

MA 09:50

Dél-Afrikában bukkantak rá az első fenékhúzásos ősleletre

Délnyugat-Afrika tengerpartján, a Fokföld régióban egyedülálló őslénytani felfedezést tettek: a világ első fosszilis „fenékhúzásos” nyomát azonosították, amelyet egy szőrös, elefánthoz távolról hasonlító rokon, a sziklanyúl (dassie) hagyott hátra – 126 000 évvel ezelőttről...



MA 09:43

Az igazi T. rex unokatestvér a porondon: új dínó vagy csak tini?

🐅 Egy Montana államban kiásott teljes dinoszaurusz-csontváz ismét felkavarja a szakértők kedélyeit: vajon egy fiatal T...



MA 09:37

Az európai természetvédelem sorsát az agráripar dönti el

Az európai Natura 2000 védett területek jövője szorosan összefügg a mezőgazdasági gyakorlatokkal...



MA 09:25

Az MI is tud rágalmazni? A Google nagy dilemmája

A Google kénytelen volt eltávolítani a Gemma nevű MI-modelljét az AI Studio platformjáról, miután Marsha Blackburn, Tennessee republikánus szenátora súlyos vádakkal illette a rendszert...

MA 09:20

Első lépések a gyerekek testi biztonságának megtanításához

🔒 Az elmúlt hetekben ismét rengeteg családot rázott meg a hír: csaknem 150, kisgyermekekkel foglalkozó dolgozót vádoltak vagy ítéltek el szexuális visszaélés, illetve helytelen viselkedés miatt...



MA 09:02

Az okos otthon helyett digitális hirdetőtáblák vesznek minket körül

Az elmúlt évtizedekben a technológiai óriáscégek azt ígérték, hogy digitális életünk kiszabadul a monitorok és telefonok világából, és átszövi majd az egész környezetünket: konyhai kijelzők, hűtőszekrények, autóműszerfalak, okostévék lesznek mindenhol...



MA 08:56

Az MI nem gondolkodik helyettünk, de kié a felelősség

🤔 A legújabb, egyre kifinomultabb MI-modellek elképesztő gyorsasággal és pontossággal írnak szövegeket, egyre kevesebb hibával vagy valótlansággal...

MA 08:25

Óriási meglepetés, a kanári-szigeteki pók megfelezi a genetikai állományát

🔬 A Kanári-szigeteken élő Dysdera tilosensis nevű pókfaj valóságos evolúciós rejtélyt szolgáltatott a tudósoknak: mindössze néhány millió év alatt mintegy felére csökkent a genomjának mérete, miközben genetikai sokfélesége mégis meghaladja a kontinensen élő rokonfajokét...



MA 08:06

Az OpenAI túl nagy lett, hogy elbukjon?

Az OpenAI hatalmas reményeket keltett az MI jövőjét illetően, de még nem termelt nyereséget, miközben éves bevétele csupán az Amazon forgalmának mintegy 2 százaléka...

MA 07:55

A túl nagy aláírás önimádatot jelez?

🖌 Donald Trump hatalmas, feltűnő aláírása régóta borzolja a kedélyeket, és tökéletesen illeszkedik önimádatáról híres múltjához...

MA 07:31

Az internet tényleg ennyire törékeny? Megdöbbentő Cloudflare-jelentés

📶 Július és szeptember között több mint 125 országban voltak kisebb-nagyobb internetkimaradások, a háttérben pedig sokszor egészen hétköznapi vagy éppen aggasztó okok álltak...

MA 07:25

Az igazságügy új csodafegyvere: ujjlenyomat a kilőtt töltényhüvelyen

🔍 Két ír kutató forradalmi eljárást dolgozott ki, amellyel sikerült ujjlenyomatot visszanyerni akár kilőtt töltényhüvelyről is – amit eddig szinte lehetetlennek tartottak...

MA 07:19

Az első kínai víz alatti adatközpont lenyomja a Microsoftot

A Sanghaj melletti Lin-gang különleges gazdasági övezetben felépítették a világ első, teljesen kereskedelmi víz alatti adatközpontját...

MA 07:13

A Penn Egyetemet ért brutális adatszivárgás: 1,2 millió donor adatai kerültek ki

A Pennsylvaniai Egyetem (University of Pennsylvania) múlt heti „meghackeltek minket” figyelmeztetése után robbant a hír: egy betörőcsoport szerint sokkal nagyobb mértékű adatlopás történt, mint amit az egyetem elismert...

APP
MA 07:13

APPok, Amik Ingyenesek MA, 11/3

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Hours Clocker (iPhone/iPad)A Hours Tracker egy sokoldalú alkalmazás, amely megkönnyíti a munkaórák rögzítését, a kereset kiszámítását és a munkabeosztás áttekintését...

vasárnap 19:46

Miért nem számítanak a fogak csontnak, itt az igazság

🙂 A fogak és a csontok első ránézésre nagyon hasonlítanak: kemények, fehérek, tele vannak kalciummal...



vasárnap 19:36

Az intersztelláris üstökös, amely kívülről érkezett hozzánk

🪐 A James Webb-űrteleszkóp először készített felvételt a 3I/ATLAS nevű üstökösről, amely körül óriási szén-dioxid-felhőt észleltek...

vasárnap 19:28

Az egész Karib-térség gyászol: 50 halott Melissa hurrikánja után

😪 A Karib-térségre lecsapó Melissa hurrikán következtében eddig legalább 50-en haltak meg, és a mentőalakulatok még magasabb számokra számítanak...