A MI-botok titkos háborúja a weben: a tartalomlopás új arca

A MI-botok titkos háborúja a weben: a tartalomlopás új arca
A közelmúltban egyre több weboldal üzemeltetője panaszkodik arra, hogy oldalaikat ismeretlen MI-botok pásztázzák, még akkor is, ha ezt kifejezetten tiltják. Az amerikai Perplexity nevű MI-kereső startup különösen szemtelennek bizonyult: botjaik nemcsak figyelmen kívül hagyják a tiltásokat, hanem meg is próbálják eltitkolni jelenlétüket.

Trükköző botok és a robots.txt jelentősége

A robots.txt fájl célja, hogy a weboldal-tulajdonosok szabályozzák, mely tartalmakhoz férhetnek hozzá az egyes botok. Bár a szabvány önkéntes, hosszú ideig viszonylag nagy volt az egyetértés a betartásában. Azonban egyes MI-botok pimaszul áthágják ezt. Különösen fontos kiemelni, hogy a Cloudflare hálózati cég szerint a Perplexity nemcsak figyelmen kívül hagyja a tiltó szabályokat, hanem amikor blokkolják őket, megváltoztatják az általuk használt azonosítókat és IP-címtartományokat. Ezzel kijátsszák a tiltásokat, és naponta akár több millió lekérést is kezdeményeznek, gyakran úgy, mintha egy Google Chrome böngészőt használó MacOS-felhasználó lennének.

Botok és a tartalomlopás gazdasági hatása

Az egykor kölcsönösen előnyös helyzet mára drasztikusan megváltozott. Korábban például a Google keresőbotja növelte az oldalak látogatottságát, és ezzel a reklámbevételeket is. Az MI-botok azonban leginkább elvesznek, semmit sem adnak vissza: az összegyűjtött tartalmakat újrahasznosítva, saját szolgáltatásaikon keresztül kínálják, miközben semmilyen kompenzációt nem nyújtanak a forrásoldalaknak. A TollBit nevű botblokkoló cég felmérése szerint idén az első negyedévben 87%-kal ugrott meg a tartalomlopási kísérletek száma. Mindemellett egyre több bot már a robots.txt-t is figyelmen kívül hagyja: arányuk 3,3%-ról 12,9%-ra nőtt, márciusi adatok alapján pedig 26 millió MI-alapú letöltés hagyta figyelmen kívül ezt az iránymutatást.

RAG, az MI-adatszomj és a tartalomtulajdonosok helyzete

Az MI-cégek újabban nemcsak tanulásra használják a begyűjtött tartalmakat, hanem a Lekérdezésalapú Tartalombővítés (Retrieval Augmented Generation, RAG) nevű megközelítést is alkalmazzák, amely során a legfrissebb információkat kérik le. Például a Google MI-áttekintők (Google AI Overviews) vagy a Perplexity Kereső (Perplexity Search) naprakész válaszokat szolgáltatnak a felhasználóknak ilyen módon. A TollBit arról számolt be, hogy a RAG-alapú scrape-elés mára meghaladta a tanulás céljából végzett adattolvajlást: egy év alatt 49%-kal nőtt az ilyen típusú lekérdezések száma egy weboldalon, szemben a tanító botok 18%-os bővülésével.


Ki fizet az ellopott tartalomért?

Az MI által közvetített szolgáltatás során a forrásnak kell viselnie a lekérdezések okozta költségeket, miközben a tényleges látogatószám nem növekszik. Például a Perplexity esetében az arány 369:1, vagyis 369-szer annyi bot érkezik az oldalra, mint valódi felhasználó. Az Anthropicnál ez az arány elképesztő, 8692:1!

A nagy cégek, mint a Google, az OpenAI vagy a Meta, sorra kötnek egyezségeket a legnagyobb tartalomtulajdonosokkal, miközben a kisebb oldalak nem jutnak szóhoz. Így az olyan közvetítő szereplők, mint a Cloudflare vagy a TollBit, technikai védelmet kínálnak a kiszolgáltatott weboldalaknak.

Hová vezet az MI tartaloméhsége?

Összességében elmondható, hogy az internetes tartalomgyűjtés kérdése egyre feszültebbé válik. Vagy sikerül fenntartható üzleti modellt találniuk az MI-cégeknek és a tartalomszolgáltatóknak, vagy az online információk egyre nagyobb része falak mögé, előfizetéses rendszerbe kerül. A legrosszabb esetben pedig az MI-buborék kipukkadhat, és az internetet elárasztja a mesterséges, értéktelen szemét.

2025, adminboss, go.theregister.com alapján

  • Te szerinted mennyire etikus, ha egy MI-cég szándékosan kijátssza a tiltásokat?
  • Te mit tennél, ha a saját oldaladról folyamatosan lopnák a tartalmat botok?
  • Szerinted lehet igazságos megállapodás a kis tartalomszolgáltatók és nagy MI-cégek között?



Legfrissebb posztok

Az OpenAI végre tényleg “nyitott” MI-t adott ki

MA 23:01

Az OpenAI végre tényleg “nyitott” MI-t adott ki

Az OpenAI hosszú idő után először hozott nyilvánosságra szabadon elérhető, nagy nyelvi MI-t az új GPT-OSS formájában. Két modellméret készült el: egy 117 milliárd paraméteres, amely teljesítményében megközelíti...

Az Apple végre elkészült a saját MI-chatbotjával

MA 22:50

Az Apple végre elkészült a saját MI-chatbotjával

🤖 Az Apple mostanában lemaradt az MI-fejlesztésben: miközben a Google nagyot lépett előre, a cupertinóiak eddig csak óvatosan kísérleteztek néhány MI-alapú eszközzel. Most viszont Robby Walker vezetésével létrejött az...

A békák lenyűgöző titka: bőrön át lélegeznek és isznak

MA 22:26

A békák lenyűgöző titka: bőrön át lélegeznek és isznak

🐸 A békák bőre egészen különleges: vékony, nyálkás, tele van mirigyekkel, és rendkívül áteresztő. Ez lehetővé teszi számukra, hogy ne csak a tüdejükkel lélegezzenek, hanem a bőrükön keresztül is...

A kanadai erdőtüzek füstje fojtogatja a Középnyugatot

MA 22:01

A kanadai erdőtüzek füstje fojtogatja a Középnyugatot

🌱 Északnyugati szelek Kanadából sűrű, füsttel teli levegőt fújnak az amerikai Középnyugat fölé, jelentősen rontva a levegő minőségét. Egyre nagyobb területeken, főleg Minnesota, Iowa és Illinois államban, extrém sűrű...

Az eltűnt sarkvidéki állatvilág titkát norvég barlangban találták meg

MA 21:51

Az eltűnt sarkvidéki állatvilág titkát norvég barlangban találták meg

Norvégia északi partvidékén, egy rejtett barlang mélyén több mint harminc évig szunnyadtak a Jégkorszak egyik melegebb időszakának állati emlékei. Most a tudósok a világ egyik legidősebb, 75 000...

A globális Dél fekete szénszennyezése sokkal súlyosabb, mint hittük

MA 21:26

A globális Dél fekete szénszennyezése sokkal súlyosabb, mint hittük

A fekete szén, amely a fosszilis tüzelőanyagok tökéletlen égésének koromszerű mellékterméke, jelentős szerepet játszik az éghajlatváltozásban és az emberi egészségre gyakorolt hatásokban. A Washingtoni Egyetem kutatói megdöbbentő eredményre...

Az MI megpörgeti a klímakutatást: de meddig bírjuk még árammal?

MA 21:01

Az MI megpörgeti a klímakutatást: de meddig bírjuk még árammal?

⚡ A mesterséges intelligencia (MI) eddig nem látott ütemben növeli a klímakutatás hatékonyságát, miközben a szélsőséges időjárás és a kutatási források zsugorodása egyre nagyobb kihívást jelent Amerikában és világszerte...


MA 20:50

A filléres, reklámmentes streaming forradalom: itt a Howdy

A Roku elindította legújabb, reklámmentes streaming szolgáltatását, amelyet Howdy névre keresztelt, és mindössze 1100 forintért kínál havonta. A kínálatban licencelt filmek és sorozatok mellett saját gyártású Roku Originals...

Az MI-csetbot a tinik új legjobb barátja – jó ez nekünk?

MA 20:26

Az MI-csetbot a tinik új legjobb barátja – jó ez nekünk?

Ahogy a technológia mindennapossá vált, az MI-csetbotok is utat találtak a tizenévesek életébe. Ezek a digitális társak a valódi barátok alternatívájaként jelennek meg, ám ennek ára is van....