A MI-botok titkos háborúja a weben: a tartalomlopás új arca

A MI-botok titkos háborúja a weben: a tartalomlopás új arca
A közelmúltban egyre több weboldal üzemeltetője panaszkodik arra, hogy oldalaikat ismeretlen MI-botok pásztázzák, még akkor is, ha ezt kifejezetten tiltják. Az amerikai Perplexity nevű MI-kereső startup különösen szemtelennek bizonyult: botjaik nemcsak figyelmen kívül hagyják a tiltásokat, hanem meg is próbálják eltitkolni jelenlétüket.

Trükköző botok és a robots.txt jelentősége

A robots.txt fájl célja, hogy a weboldal-tulajdonosok szabályozzák, mely tartalmakhoz férhetnek hozzá az egyes botok. Bár a szabvány önkéntes, hosszú ideig viszonylag nagy volt az egyetértés a betartásában. Azonban egyes MI-botok pimaszul áthágják ezt. Különösen fontos kiemelni, hogy a Cloudflare hálózati cég szerint a Perplexity nemcsak figyelmen kívül hagyja a tiltó szabályokat, hanem amikor blokkolják őket, megváltoztatják az általuk használt azonosítókat és IP-címtartományokat. Ezzel kijátsszák a tiltásokat, és naponta akár több millió lekérést is kezdeményeznek, gyakran úgy, mintha egy Google Chrome böngészőt használó MacOS-felhasználó lennének.

Botok és a tartalomlopás gazdasági hatása

Az egykor kölcsönösen előnyös helyzet mára drasztikusan megváltozott. Korábban például a Google keresőbotja növelte az oldalak látogatottságát, és ezzel a reklámbevételeket is. Az MI-botok azonban leginkább elvesznek, semmit sem adnak vissza: az összegyűjtött tartalmakat újrahasznosítva, saját szolgáltatásaikon keresztül kínálják, miközben semmilyen kompenzációt nem nyújtanak a forrásoldalaknak. A TollBit nevű botblokkoló cég felmérése szerint idén az első negyedévben 87%-kal ugrott meg a tartalomlopási kísérletek száma. Mindemellett egyre több bot már a robots.txt-t is figyelmen kívül hagyja: arányuk 3,3%-ról 12,9%-ra nőtt, márciusi adatok alapján pedig 26 millió MI-alapú letöltés hagyta figyelmen kívül ezt az iránymutatást.

RAG, az MI-adatszomj és a tartalomtulajdonosok helyzete

Az MI-cégek újabban nemcsak tanulásra használják a begyűjtött tartalmakat, hanem a Lekérdezésalapú Tartalombővítés (Retrieval Augmented Generation, RAG) nevű megközelítést is alkalmazzák, amely során a legfrissebb információkat kérik le. Például a Google MI-áttekintők (Google AI Overviews) vagy a Perplexity Kereső (Perplexity Search) naprakész válaszokat szolgáltatnak a felhasználóknak ilyen módon. A TollBit arról számolt be, hogy a RAG-alapú scrape-elés mára meghaladta a tanulás céljából végzett adattolvajlást: egy év alatt 49%-kal nőtt az ilyen típusú lekérdezések száma egy weboldalon, szemben a tanító botok 18%-os bővülésével.


Ki fizet az ellopott tartalomért?

Az MI által közvetített szolgáltatás során a forrásnak kell viselnie a lekérdezések okozta költségeket, miközben a tényleges látogatószám nem növekszik. Például a Perplexity esetében az arány 369:1, vagyis 369-szer annyi bot érkezik az oldalra, mint valódi felhasználó. Az Anthropicnál ez az arány elképesztő, 8692:1!

A nagy cégek, mint a Google, az OpenAI vagy a Meta, sorra kötnek egyezségeket a legnagyobb tartalomtulajdonosokkal, miközben a kisebb oldalak nem jutnak szóhoz. Így az olyan közvetítő szereplők, mint a Cloudflare vagy a TollBit, technikai védelmet kínálnak a kiszolgáltatott weboldalaknak.

Hová vezet az MI tartaloméhsége?

Összességében elmondható, hogy az internetes tartalomgyűjtés kérdése egyre feszültebbé válik. Vagy sikerül fenntartható üzleti modellt találniuk az MI-cégeknek és a tartalomszolgáltatóknak, vagy az online információk egyre nagyobb része falak mögé, előfizetéses rendszerbe kerül. A legrosszabb esetben pedig az MI-buborék kipukkadhat, és az internetet elárasztja a mesterséges, értéktelen szemét.

2025, adminboss, go.theregister.com alapján

  • Te szerinted mennyire etikus, ha egy MI-cég szándékosan kijátssza a tiltásokat?
  • Te mit tennél, ha a saját oldaladról folyamatosan lopnák a tartalmat botok?
  • Szerinted lehet igazságos megállapodás a kis tartalomszolgáltatók és nagy MI-cégek között?


Legfrissebb posztok

MA 11:50

Az MI-alapú játéktutorialok rémálma: a Sony új szintre lép

🤓 A videojátékok tutorialjai régóta okoznak fejfájást a játékosoknak és fejlesztőknek egyaránt...

MA 11:34

Az Alphabet tarolt a Wall Streeten: MI-őrület és pénzeső

💵 Az Alphabet lehengerlő, 65%-os árfolyam-emelkedéssel zárta a 2025-ös évet, amire 2009 óta nem volt példa...

MA 11:17

Az űr pezsgője: elképesztő galaxisütközésre bukkantak

🌌 A Champagne-halmaz névre keresztelt csillagászati jelenség szilveszter éjszakáján történt felfedezése óta ejti ámulatba a szakértőket: két hatalmas galaxishalmaz ütközése mutatkozik meg benne, a képeken pedig szinte pezsgőbuborékszerű foltok formájában láthatók a felforrósodott gázok...

MA 10:57

A januári PS Plusban autóőrület, Mickey‑újrafestés és barlangi túlélés – azonnal töltsd!

Új év, új játékok: 2026 januárjában három izgalmas címmel bővül a PlayStation Plus Essential kínálata...

MA 10:49

A NASA legnagyobb könyvtára lehúzza a rolót – hová kerül a tudás?

A NASA súlyos költségmegszorítások és telephely-összevonások közepette kénytelen bezárni a legnagyobb könyvtárát, így veszélybe kerül tízezernyi történelmi és tudományos dokumentum, amelyek jelentős része még nem digitalizált...

MA 10:43

Az amerikai dollár jövője: összeomlás vagy fordulat 2026-ban?

Az idei év kifejezetten gyengén alakult a dollár számára, hiszen a valuta több mint 9 százalékot veszített értékéből a főbb devizákkal szemben – ilyen rossz évet legutóbb nyolc éve látott...

MA 10:35

Az ütköző spirálgalaxisok még soha nem voltak ilyen lélegzetelállítóak

Lenyűgöző részletességgel sikerült megörökíteni két ütköző spirálgalaxist a NASA James Webb-űrteleszkópja (James Webb Space Telescope, JWST) és a Chandra röntgenobszervatórium (Chandra X-ray Observatory) adatainak egyesítésével...

MA 10:30

Az MI 2026-ban: Már megkerülhetetlen a digitális inas

🤖 Az elmúlt év végleg átalakította az MI helyét: a kezdeti mutatványokból állandó társunk lett a mindennapokban, és az emberek már nem csupán újdonságként tekintenek rá...

MA 10:23

Az új brit dróntörvények 2026-tól mindent fenekestül felforgatnak

Érdemes megérteni, hogy az Egyesült Királyságban jelentősen átalakultak a drónokra vonatkozó szabályok, amelyek 2026...

MA 10:15

Az MI 2026-ra tényleg elveszi a munkánkat?

🤔 Egyre nagyobb a bizonytalanság a munkaerőpiacon az MI rohamos fejlődése miatt...

MA 10:10

Az év, amikor a játékosok álma valóra válik: 2026

2026 már most bombasikerű gamer évnek ígérkezik: seregnyi folytatás, új franchise, nagy visszatérő és izgalmas sztori vár mindenkire...

MA 09:57

Az ősi perui trófeafej rejtélyének kulcsa: egy ritka rendellenesség

Egy mumifikálódott fej vizsgálata új megvilágításba helyezi az andoki társadalmak hozzáállását a születési rendellenességekkel élőkhöz...

MA 09:50

A hiányzó fehérje, amely felgyorsítja immunrendszered idő előtti öregedését

Ahogyan telnek az évek, az ősz hajszálak és a gyengülő izmok mellett az immunrendszerünk is változik...

MA 09:44

Az univerzum mégis kockajáték: Bohr diadalmaskodott Einstein felett

🎲 Egy lényeges szempont, hogy a kínai tudósoknak most először sikerült megvalósítaniuk azt a híres gondolatkísérletet, amellyel Albert Einstein majdnem száz éve próbálta cáfolni Niels Bohr elméletét a kvantummechanikában...

MA 09:36

Az Nvidia H200-ért kitört a vásárlási őrület Kínában

🔥 Az Nvidia H200-as gyorsítókra sosem látott kereslet alakult ki Kínában, miután enyhítettek az amerikai exportkorlátozásokon...

MA 09:30

Az új New York-i polgármester beiktatásán száműzik a techkütyüket

🚫 A 2026-os New York-i polgármesteri beiktatáson, ahol Zohran Mamdani lép hivatalba, szigorú tiltólistát hirdettek, amelyen meglepő módon külön megnevezték a Flipper Zero-t és a Raspberry Pi-t...

MA 09:22

Az Eaton lemaradt az MI‑őrületről – most jön a nagy visszatérés?

🚀 Érdekes, hogy az MI-berobbanás éveiben szerzett lendület ellenére az Eaton részvényárfolyama 2025-ben nem tudta tartani a lépést a többi ipari óriással...

MA 09:16

A fény hajtja az arany nanorészecskéket: tisztább ammónia a végeredmény

💡 A kutatók azt vizsgálják, miként lehetne fenntarthatóbban előállítani az egyik legfontosabb ipari vegyületet, az ammóniát, amely a műtrágyák, tisztítószerek és robbanóanyagok gyártásának is alapja...

MA 09:09

Az Amazon rejtett filmes gyöngyszemei, amikről nem hallottál

🎥 Az Amazon Prime Video kínálata valóságos kincsesbánya azok számára, akik szeretik a mozifilmeket – különösen a 2011 előtti alkotásokat...