A MI-botok titkos háborúja a weben: a tartalomlopás új arca

A MI-botok titkos háborúja a weben: a tartalomlopás új arca
A közelmúltban egyre több weboldal üzemeltetője panaszkodik arra, hogy oldalaikat ismeretlen MI-botok pásztázzák, még akkor is, ha ezt kifejezetten tiltják. Az amerikai Perplexity nevű MI-kereső startup különösen szemtelennek bizonyult: botjaik nemcsak figyelmen kívül hagyják a tiltásokat, hanem meg is próbálják eltitkolni jelenlétüket.

Trükköző botok és a robots.txt jelentősége

A robots.txt fájl célja, hogy a weboldal-tulajdonosok szabályozzák, mely tartalmakhoz férhetnek hozzá az egyes botok. Bár a szabvány önkéntes, hosszú ideig viszonylag nagy volt az egyetértés a betartásában. Azonban egyes MI-botok pimaszul áthágják ezt. Különösen fontos kiemelni, hogy a Cloudflare hálózati cég szerint a Perplexity nemcsak figyelmen kívül hagyja a tiltó szabályokat, hanem amikor blokkolják őket, megváltoztatják az általuk használt azonosítókat és IP-címtartományokat. Ezzel kijátsszák a tiltásokat, és naponta akár több millió lekérést is kezdeményeznek, gyakran úgy, mintha egy Google Chrome böngészőt használó MacOS-felhasználó lennének.

Botok és a tartalomlopás gazdasági hatása

Az egykor kölcsönösen előnyös helyzet mára drasztikusan megváltozott. Korábban például a Google keresőbotja növelte az oldalak látogatottságát, és ezzel a reklámbevételeket is. Az MI-botok azonban leginkább elvesznek, semmit sem adnak vissza: az összegyűjtött tartalmakat újrahasznosítva, saját szolgáltatásaikon keresztül kínálják, miközben semmilyen kompenzációt nem nyújtanak a forrásoldalaknak. A TollBit nevű botblokkoló cég felmérése szerint idén az első negyedévben 87%-kal ugrott meg a tartalomlopási kísérletek száma. Mindemellett egyre több bot már a robots.txt-t is figyelmen kívül hagyja: arányuk 3,3%-ról 12,9%-ra nőtt, márciusi adatok alapján pedig 26 millió MI-alapú letöltés hagyta figyelmen kívül ezt az iránymutatást.

RAG, az MI-adatszomj és a tartalomtulajdonosok helyzete

Az MI-cégek újabban nemcsak tanulásra használják a begyűjtött tartalmakat, hanem a Lekérdezésalapú Tartalombővítés (Retrieval Augmented Generation, RAG) nevű megközelítést is alkalmazzák, amely során a legfrissebb információkat kérik le. Például a Google MI-áttekintők (Google AI Overviews) vagy a Perplexity Kereső (Perplexity Search) naprakész válaszokat szolgáltatnak a felhasználóknak ilyen módon. A TollBit arról számolt be, hogy a RAG-alapú scrape-elés mára meghaladta a tanulás céljából végzett adattolvajlást: egy év alatt 49%-kal nőtt az ilyen típusú lekérdezések száma egy weboldalon, szemben a tanító botok 18%-os bővülésével.


Ki fizet az ellopott tartalomért?

Az MI által közvetített szolgáltatás során a forrásnak kell viselnie a lekérdezések okozta költségeket, miközben a tényleges látogatószám nem növekszik. Például a Perplexity esetében az arány 369:1, vagyis 369-szer annyi bot érkezik az oldalra, mint valódi felhasználó. Az Anthropicnál ez az arány elképesztő, 8692:1!

A nagy cégek, mint a Google, az OpenAI vagy a Meta, sorra kötnek egyezségeket a legnagyobb tartalomtulajdonosokkal, miközben a kisebb oldalak nem jutnak szóhoz. Így az olyan közvetítő szereplők, mint a Cloudflare vagy a TollBit, technikai védelmet kínálnak a kiszolgáltatott weboldalaknak.

Hová vezet az MI tartaloméhsége?

Összességében elmondható, hogy az internetes tartalomgyűjtés kérdése egyre feszültebbé válik. Vagy sikerül fenntartható üzleti modellt találniuk az MI-cégeknek és a tartalomszolgáltatóknak, vagy az online információk egyre nagyobb része falak mögé, előfizetéses rendszerbe kerül. A legrosszabb esetben pedig az MI-buborék kipukkadhat, és az internetet elárasztja a mesterséges, értéktelen szemét.

2025, adminboss, go.theregister.com alapján

  • Te szerinted mennyire etikus, ha egy MI-cég szándékosan kijátssza a tiltásokat?
  • Te mit tennél, ha a saját oldaladról folyamatosan lopnák a tartalmat botok?
  • Szerinted lehet igazságos megállapodás a kis tartalomszolgáltatók és nagy MI-cégek között?



Legfrissebb posztok

Kína klímavállalása, most tényleg érdemes figyelni
MA 00:00

Kína klímavállalása, most tényleg érdemes figyelni

🌍 Különösen fontos hangsúlyozni, hogy amikor Kína klímacélokat tűz ki, arra a világnak érdemes odafigyelnie. A pekingi vezetés ugyanis általában csak olyasmit ígér meg, amit valóban szándékában áll teljesíteni,...

csütörtök 23:30

Az MI-vezérelt műholdas net mostantól mindenhol elérhető

A T-Mobile T-Satellite szolgáltatása, amely a Starlink műholdakat használja, már nemcsak SMS-ekhez működik, hanem több alkalmazást is támogat. Mostantól például az AllTrails, az AccuWeather, az X (korábban Twitter),...

Új felfedezések az Enceladuson, lehet ott élet a Szaturnusz holdján
csütörtök 23:02

Új felfedezések az Enceladuson, lehet ott élet a Szaturnusz holdján

🚀 A Szaturnusz jeges holdja, az Enceladus ismét felkeltette a tudósok figyelmét, köszönhetően a Cassini űrszonda adatainak friss elemzéséhez. A felszín alatt rejtőző óceánból feltörő jégszemcsékben szokatlanul összetett szerves...

csütörtök 22:58

Az MI tuning új korszaka: bárki finomhangolhatja a gépi tanulást

A Thinking Machines Lab, amelyet az OpenAI egykori vezéralakjai, köztük Mira Murati alapítottak, első termékével robban be az MI világába. Az újdonság neve Tinker, és célja, hogy kutatók,...

Az OpenShift AI-t bárki feltörheti: komoly hiba veszélyeztet
csütörtök 22:01

Az OpenShift AI-t bárki feltörheti: komoly hiba veszélyeztet

⚠ A Red Hat OpenShift AI szolgáltatásában súlyos, 9,9-es veszélyességű sebezhetőséget fedeztek fel, amely lehetőséget ad távoli támadóknak arra, hogy minimális jogosultsággal is átvegyék az egész platform irányítását. Ez...

Az MI-sokkoló: A robotok még nem vették el a munkádat
csütörtök 21:59

Az MI-sokkoló: A robotok még nem vették el a munkádat

🤖 A Yale Egyetem közgazdászai alaposan megvizsgálták, mi történt az amerikai munkaerőpiacon azóta, hogy 2022 novemberében megjelent a ChatGPT és a többi generatív MI-rendszer. Megnyugtató következtetésük szerint az MI-forradalom...

Az Apple elengedi a könnyebb Vision Pro-t, jönnek az okosszemüvegek
csütörtök 21:30

Az Apple elengedi a könnyebb Vision Pro-t, jönnek az okosszemüvegek

Az Apple jelentősen felgyorsította az okosszemüvegek fejlesztését, miközben félretette a régóta tervezett, könnyebb Vision Pro headset elkészítését. A cég legalább kétféle szemüvegen dolgozik: az egyik egy kijelző nélküli...

Már most olcsóbban vehetünk robotporszívót, méghozzá jelentős kedvezménnyel
csütörtök 21:02

Már most olcsóbban vehetünk robotporszívót, méghozzá jelentős kedvezménnyel

Az őszi nagy vásárlási láz még el sem kezdődött, de a robotporszívók piacán már most komoly akciókba futhat bele az, aki előre gondolkodik. Idén az olyan ismert gyártók,...

csütörtök 21:01

A szaturnuszi hold izgalmas titka: újabb jelek az élet lehetőségére

Enceladus, a Szaturnusz hatodik legnagyobb holdja ismét a tudományos érdeklődés középpontjába került. A Cassini űrszonda (Cassini) 2017-ben befejeződött küldetése során fedezte fel, hogy a hold déli pólusán hatalmas...