A MI-botok titkos háborúja a weben: a tartalomlopás új arca

A MI-botok titkos háborúja a weben: a tartalomlopás új arca
A közelmúltban egyre több weboldal üzemeltetője panaszkodik arra, hogy oldalaikat ismeretlen MI-botok pásztázzák, még akkor is, ha ezt kifejezetten tiltják. Az amerikai Perplexity nevű MI-kereső startup különösen szemtelennek bizonyult: botjaik nemcsak figyelmen kívül hagyják a tiltásokat, hanem meg is próbálják eltitkolni jelenlétüket.

Trükköző botok és a robots.txt jelentősége

A robots.txt fájl célja, hogy a weboldal-tulajdonosok szabályozzák, mely tartalmakhoz férhetnek hozzá az egyes botok. Bár a szabvány önkéntes, hosszú ideig viszonylag nagy volt az egyetértés a betartásában. Azonban egyes MI-botok pimaszul áthágják ezt. Különösen fontos kiemelni, hogy a Cloudflare hálózati cég szerint a Perplexity nemcsak figyelmen kívül hagyja a tiltó szabályokat, hanem amikor blokkolják őket, megváltoztatják az általuk használt azonosítókat és IP-címtartományokat. Ezzel kijátsszák a tiltásokat, és naponta akár több millió lekérést is kezdeményeznek, gyakran úgy, mintha egy Google Chrome böngészőt használó MacOS-felhasználó lennének.

Botok és a tartalomlopás gazdasági hatása

Az egykor kölcsönösen előnyös helyzet mára drasztikusan megváltozott. Korábban például a Google keresőbotja növelte az oldalak látogatottságát, és ezzel a reklámbevételeket is. Az MI-botok azonban leginkább elvesznek, semmit sem adnak vissza: az összegyűjtött tartalmakat újrahasznosítva, saját szolgáltatásaikon keresztül kínálják, miközben semmilyen kompenzációt nem nyújtanak a forrásoldalaknak. A TollBit nevű botblokkoló cég felmérése szerint idén az első negyedévben 87%-kal ugrott meg a tartalomlopási kísérletek száma. Mindemellett egyre több bot már a robots.txt-t is figyelmen kívül hagyja: arányuk 3,3%-ról 12,9%-ra nőtt, márciusi adatok alapján pedig 26 millió MI-alapú letöltés hagyta figyelmen kívül ezt az iránymutatást.

RAG, az MI-adatszomj és a tartalomtulajdonosok helyzete

Az MI-cégek újabban nemcsak tanulásra használják a begyűjtött tartalmakat, hanem a Lekérdezésalapú Tartalombővítés (Retrieval Augmented Generation, RAG) nevű megközelítést is alkalmazzák, amely során a legfrissebb információkat kérik le. Például a Google MI-áttekintők (Google AI Overviews) vagy a Perplexity Kereső (Perplexity Search) naprakész válaszokat szolgáltatnak a felhasználóknak ilyen módon. A TollBit arról számolt be, hogy a RAG-alapú scrape-elés mára meghaladta a tanulás céljából végzett adattolvajlást: egy év alatt 49%-kal nőtt az ilyen típusú lekérdezések száma egy weboldalon, szemben a tanító botok 18%-os bővülésével.


Ki fizet az ellopott tartalomért?

Az MI által közvetített szolgáltatás során a forrásnak kell viselnie a lekérdezések okozta költségeket, miközben a tényleges látogatószám nem növekszik. Például a Perplexity esetében az arány 369:1, vagyis 369-szer annyi bot érkezik az oldalra, mint valódi felhasználó. Az Anthropicnál ez az arány elképesztő, 8692:1!

A nagy cégek, mint a Google, az OpenAI vagy a Meta, sorra kötnek egyezségeket a legnagyobb tartalomtulajdonosokkal, miközben a kisebb oldalak nem jutnak szóhoz. Így az olyan közvetítő szereplők, mint a Cloudflare vagy a TollBit, technikai védelmet kínálnak a kiszolgáltatott weboldalaknak.

Hová vezet az MI tartaloméhsége?

Összességében elmondható, hogy az internetes tartalomgyűjtés kérdése egyre feszültebbé válik. Vagy sikerül fenntartható üzleti modellt találniuk az MI-cégeknek és a tartalomszolgáltatóknak, vagy az online információk egyre nagyobb része falak mögé, előfizetéses rendszerbe kerül. A legrosszabb esetben pedig az MI-buborék kipukkadhat, és az internetet elárasztja a mesterséges, értéktelen szemét.

2025, adminboss, go.theregister.com alapján

  • Te szerinted mennyire etikus, ha egy MI-cég szándékosan kijátssza a tiltásokat?
  • Te mit tennél, ha a saját oldaladról folyamatosan lopnák a tartalmat botok?
  • Szerinted lehet igazságos megállapodás a kis tartalomszolgáltatók és nagy MI-cégek között?



Legfrissebb posztok

Az első molekulák meglepő titkai: megdöntött elméletek

MA 13:26

Az első molekulák meglepő titkai: megdöntött elméletek

🔬 Nem mindennapi áttörést értek el a tudósok: laboratóriumi körülmények között alkották újra az univerzum első molekuláit, és ezzel alapjaiban kérdőjelezik meg a csillagok keletkezéséről szóló eddigi elképzeléseinket. A...

Az ősi vírus-baktérium háború: Megmenthetik-e a fágok az emberiséget?

MA 13:01

Az ősi vírus-baktérium háború: Megmenthetik-e a fágok az emberiséget?

💀 Az antibiotikumok korában azt hihetnénk, hogy a baktériumok és az emberiség közötti háborút mi nyerjük, azonban egyre több baktérium válik ellenállóvá a gyógyszerekkel szemben. Az úgynevezett antimikrobiális rezisztencia...

Az új trükk: most a YouTube is másol

MA 12:50

Az új trükk: most a YouTube is másol

A YouTube új funkcióval kísérletezik, amely lehetővé teszi a tartalomgyártók számára, hogy közvetlenül megjelöljék együttműködő partnereiket a videóikban. Így a nézők könnyebben fedezhetik fel és követhetik a közreműködő...

Az Apple Perplexity MI-őrületet venne?

MA 12:25

Az Apple Perplexity MI-őrületet venne?

👀 Az Apple vezetői egy belső fórumon arról egyeztetnek, hogy ajánlatot tegyenek-e a gyorsan növekvő Perplexity MI-cég megvásárlására. A Perplexity az egyik legfelkapottabb MI-alapú webes kereső, melynek értéke a...

Az Apple-nek most tényleg be kell húznia az MI-t

MA 12:00

Az Apple-nek most tényleg be kell húznia az MI-t

🤖 Egy nemrég tartott, egyórás vállalati megbeszélésen Tim Cook, az Apple vezérigazgatója kijelentette, hogy az Apple-nek mindenképpen nyernie kell a mesterséges intelligencia (MI) területén. Cook hangsúlyozta: az Apple meg...


MA 11:50

A műanyagkrízis éve: már mindenkit károsít

A műanyagok jelentette veszély alulértékelt, de egyre súlyosabb, és már a világ lakosságának egészségét is fenyegeti – újszülöttkortól az öregkorig. A termelés drasztikusan nőtt: 1950 óta több mint...

Az elképesztő múlt: Egy távoli galaxis titkai a JWST távcső alatt

MA 11:26

Az elképesztő múlt: Egy távoli galaxis titkai a JWST távcső alatt

A James Webb űrtávcső (JWST) minden eddiginél részletesebben vizsgálta meg az egyik legtávolabbi galaxist, a JADES-GS-z14-1-et. Ez a galaxis az eddig ismert leghalványabb, spektroszkópiailag igazolt galaxis, vöröseltolódása mintegy...


MA 11:00

Az MI már a kínai hivatalokban ügyködik?

Kínában ismét felgyorsultak az MI-fejlesztések: az innovatív technológiának már nem pusztán a jövő álmának kell lennie, hanem a mindennapok részévé kell válnia, legyen szó gyárakról, kórházakról vagy akár...

Az esemény utáni tabletta: amit tényleg tudnod kell

MA 10:53

Az esemény utáni tabletta: amit tényleg tudnod kell

A védekezés nélküli szex utáni terhességmegelőzés egyik leggyorsabb megoldása az esemény utáni tabletta, ám a hatékonyságát jelentősen befolyásolja a testsúly, illetve az, hogy mikor veszed be. Az egyik...