2026. 04. 18., 13:03

Az MI-tanító botokat mostantól tényleg te irányítod

Az MI-tanító botokat mostantól tényleg te irányítod
Tipikus eset, amikor egy fejlesztői platform rosszul dokumentált, elavult információkat tartalmaz, és ezek az adatok rendre bekerülnek a mesterséges intelligenciát betanító rendszerek tudástárába is. A fejlesztők évek óta küzdenek azzal, hogy az MI-botok vagy keresőmotorok valós időben, automatikusan gyűjtik az összes elérhető tartalmat, függetlenül attól, friss-e vagy már régóta elavult. Bíztak abban, hogy elég a noindex meta tag, a deprecation-bannerek és a kanonikus hivatkozások, a tapasztalatok azonban azt mutatják: az MI-tanító botokat nem hatja meg semmilyen jelzés, nekik minden tartalom egyformán hasznosnak tűnik.

Az MI-ügynököket nem érdekli a figyelmeztetés

Nem kizárt, hogy az MI-tanító botok százszor, ezerszer is lekérik ugyanazt az elavult dokumentációt, még akkor is, ha jól látható rajta a figyelmeztető sáv vagy a noindex tag. Az MI-tanító algoritmusok ugyanis főleg a teljes szöveg alapján tanulnak, a figyelmeztetéseket pedig csak egy újabb bekezdésnek érzékelik. Ha pedig letiltod a hozzáférést egy adott útvonalhoz, az MI-bot nem kap útmutatást arról sem, hogy helyette melyik a friss változat – azaz egy információs űrt hozol létre.

A helyzetet súlyosbítja, hogy a robots.txt is csak korlátozott védelmet nyújt, a lekérő botokat nehéz azonosítani, ráadásul minden tartalomfrissítés vagy struktúraváltás új szabályozást igényel. Az MI-modellképző botoknak arra lenne szükségük, hogy világosan megmondd: hol található a hiteles, aktuális információ.

Mit jelent a valóban kanonikus tartalom?

A HTML-címke standardizált megoldásként jelzi a keresőmotorok felé, hogy egy adott oldal melyik URL-címen tekintendő a hivatalos változatnak – ezt a legtöbb CMS automatikusan generálja, a weboldalak közel 70%-án eleve megtalálható. A Cloudflare mostantól automatikusan át tudja irányítani minden ellenőrzött MI-tanító botot az ilyen kanonikus címekre: vagyis ha van frissebb vagy hivatalosabb tartalom, akkor az MI-tanító bot nem az elavult oldalakat fogja letölteni, hanem rögtön a naprakész változathoz jut.

Így működik az új rendszer

A Redirects for AI Training rendszer két kulcselemre támaszkodik: egyrészt felismeri az MI-tanító botokat (például a GPTBotot, ClaudeBotot, Bytespidert), másrészt a HTML-kódban lévő kanonikus hivatkozásokat. Ha egy azonosított MI-tanító bot elavult oldalra érkezik, a Cloudflare automatikusan HTTP 301 átirányítást ad vissza a kanonikus célállomásra, és a botszoftver már csak az új, hivatalos oldalt kapja meg. Emberi felhasználót, keresőindexelést és más botokat ez nem érint, nekik továbbra is válaszol az eredeti oldal.

Például ha egy GPTBot a Wrangler CLI régi dokumentációját próbálja elérni, HTTP/1.1 301-es választ kap, amely az aktuális API-dokumentumhoz irányítja át. Így az MI-tanító bot kizárólag a naprakész tartalmat tölti le.


Az átirányítás nem mindenható

Fontos tudni, hogy a rendszer csak a jövőben érkező, MI-tanító kategóriába eső, ellenőrzött botokra hat, és nem javítja visszamenőleg azokat az adatokat, amiket a botok már letöltöttek. Az emberi felhasználók vagy más MI-ügynökök továbbra is megnézhetik az elavult oldalakat. Nem irányít át más domainen lévő (cross-origin) kanonikus hivatkozás esetén sem, és azokat a címkéket is figyelmen kívül hagyja, amelyek önmagukra mutatnak.

Miért nem elég a hagyományos átirányítási szabály?

Egyéni átirányítási szabályokat meg lehet adni böngészőazonosító alapján is, de ha sok elavult útvonalad van, ezt nehéz kézben tartani: minden változás új szabályozást igényel, a botokat külön kell követni, ráadásul a szokásos domain-migrációt és a kampány-URL-eket is terheli. Arról nem beszélve, hogy könnyen eltérhetnek a valós tartalmi változásoktól, mivel az admin ténylegesen kézzel újrakódolja azt, amit a kanonikus címke már deklarált.

Tapasztalatok a saját oldalon

A Cloudflare saját fejlesztői dokumentációs oldalán mérhető eredmények születtek: 2026 márciusában az OpenAI botja kb. 46 000-szer, az Anthropic 3 600-szor, a Meta pedig 1 700 alkalommal olvasott elavult, kivezetett dokumentációt. Ennek az lett az eredménye, hogy egy MI-asszisztens 2026 áprilisában még egy régi szintaxist javasolt a Wrangler CLI-hez, miközben már új eljárás szerint kellett volna dolgozni.

A Redirects for AI Training funkció bekapcsolása után az MI-tanító botok 100%-át sikerült átirányítani a frissebb dokumentációra már az első hét napban.

Bekapcsolás és ellenőrizhetőség

Ha egy weboldalon már létezik kanonikus címke, akkor a Cloudflare vezérlőpultján egyetlen kapcsolóval aktiválható a funkció, és onnantól minden ellenőrzött MI-tanító bot csak a legfrissebb információkat fogja látni. Az adminfelületen minden domainnél: AI Crawl Control > Quick Actions > Redirects for AI Training > kapcsoló bekapcsolása.

Útvonal-specifikus szabályozáshoz további beállításokat a fejlesztői dokumentációban lehet találni.

Így reagál a web az MI-botokra

A 301-es „Átirányítás” státuszkód minden MI-tanító kérésre az elvárt tartalomhoz vezeti a botokat, de összességében a böngészők és botok statisztikái azt mutatják: a weben az MI-botok kéréseinek 74%-a sikeres választ kap, 13,7%-a kliensoldali hibába, 11,3%-a átirányításba, 1,2%-a pedig szerverhibába ütközik. A GPTBot esetén ez még jobb arány – 83% sikeres, 4,7% átirányított, 2,7% nem található.

A Cloudflare Radar API teljes részletességgel mutatja, hogyan válaszolnak a webhelyek az MI-botokra, akár szegmensenként is elemezhető a forgalom. Így pontosan látható, melyik iparág vagy weboldal tiltja, irányítja át vagy szolgálja ki az MI-tanítókat.

A Redirects for AI Training lehetővé teszi, hogy szabályozd, milyen tartalomhoz férjenek hozzá az MI-tanító botok, míg a Radar analitikája arról ad képet, hogyan működik ez a teljes weben. Használd bátran az új funkciókat, hogy az MI ne csak az elavult történelemkönyvekből tanuljon!

2026, adminboss, blog.cloudflare.com alapján

Legfrissebb posztok

APP
MA 09:11

APPok, Amik Ingyenesek MA, 6/17

Fizetős iOS appok és játékok, amik ingyenesek a mai napon.     Planetary Hours + Widget (iPhone/iPad) Risp: Budget & Savings (iPhone/iPad) ICD-10 Dictionary (iPhone/iPad) Between Dates Calendar Math (iPhone/iPad) Monthly Dystopia (iPhone/iPad) War Mongrels (iPhone/iPad) ContactVault Pro (iPhone/iPad) FormatX: Video Audio Converter (iPhone/iPad) ImgRef (iPhone/iPad) Inkflow Plus Visual Notebook (iPhone/iPad) CrestWall – 4K Wallpapers...

kedd 19:34

A Wharton szerint később ürülhet ki a TB-kassza

A pennsylvaniai Wharton Egyetem új kutatása szerint a társadalombiztosítás nyugdíjalapja a vártnál később apadhat el...

kedd 19:23

A Star Wars-legenda Mark Hamill kulcsszerepben a Twisted Metalban

🤓 Mark Hamill, akit a Csillagok háborúja (Star Wars) világából Luke Skywalkerként őrzünk emlékezetünkben, csatlakozik a Csavart fém (Twisted Metal) sorozat harmadik évadához...

kedd 19:12

A Firefox 152 megújul: jön a JPEG XL, új beállítások

A Firefox böngésző legfrissebb, 152-es verziója több fontos fejlesztést hoz. A leglátványosabb változás a teljesen átalakított beállítási felület, amely átláthatóbbá és egyszerűbben kezelhetővé teszi a böngésző személyre szabását...

kedd 19:02

Az első nukleáris óra elindult – jön az ötödik kölcsönhatás?

⚡ Tipikus eset, amikor egy évtizedeken át lehetetlennek hitt ötlet hirtelen valósággá válik...

kedd 18:57

Az új Pókember-film sztárjai: a Galaxy Z Flip 7 és Fold 7

🚀 A Samsung legújabb büszkeségei, a Galaxy Z Flip 7 és a Galaxy Z Fold 7 komoly szerepet kaptak a Pókember: Vadonatúj nap (Spider-Man: Brand New Day) című filmben...

kedd 18:45

Az ultramély kutatás: Sakana AI 100 oldalas jelentést készít 8 óra alatt

🔬 Tokióban egy új MI-alapú vállalkozás, a Sakana AI dobta piacra a Marlint, első kereskedelmi termékét, amely forradalmasíthatja a vállalati kutatási jelentéseket...

kedd 18:24

Az új Ebola-járvány mekkora veszélyt jelent?

A Kongói Demokratikus Köztársaságot sújtó új Ebola-járvány már a harmadik legnagyobbnak számít a világon...

kedd 18:02

A CISA figyelmeztet: újabb cPanel-bővítmény-hibát aktívan kihasználnak

Az amerikai kiberbiztonsági hivatal, a CISA háromnapos határidőt adott az állami szerveknek, hogy frissítsék a LiteSpeed cPanel felhasználói bővítményét, miután ismertté vált egy aktívan kihasznált sérülékenység, amellyel a szervereket támadják...

kedd 17:11

A Hold-méretű, száguldó ütköző, amely felforgatta a Vénusz forgását

Ami először apróságnak tűnt, mára a Vénusz egyik legnagyobb rejtélyévé vált: a bolygó rendkívül lassú, ráadásul ellentétes irányú tengely körüli forgása...

kedd 17:01

A zsarolóbandák a Microsoft Teams reléivel álcázzák forgalmukat

Érdemes megvizsgálni, milyen kifinomult módszereket alkalmaznak a bűnözők, amikor eltüntetik rosszindulatú forgalmukat a védekezésre berendezkedett rendszerek elől...

kedd 16:55

Az okos medál, ami jelzi, meddig napozhatsz leégés nélkül

A legtöbb viselhető kütyü a lépéseidet, a pulzusodat vagy a véroxigénszintedet méri, de most érkezett egy olyan eszköz, ami teljesen másra fókuszál: a bőröd egészségére és a napsugárzás követésére...

kedd 16:45

Hány elemi részecske létezik valójában?

😰 Fontos kérdés, hogy hányféle elemi részecske létezik valójában. A fizikában ez nem is olyan egyszerű, mint amilyennek elsőre tűnhet...

kedd 16:12

A Threads már havi félmilliárd felhasználónál jár

Felmerül a kérdés, hogy mi állhat a Meta új szöveges közösségi hálójának hatalmas népszerűsége mögött...

kedd 15:56

A nő, aki Elon Musk mellett óriássá tette a SpaceXet

🚀 Gwynne Shotwell nevét a nagyközönség ritkán hallja, pedig nélküle elképzelhetetlen volna a SpaceX hihetetlen felemelkedése...

kedd 15:45

Az Nvidia 25 milliárd dolláros kötvénykibocsátással turbózza az MI-versenyt

Megemlíthető, hogy az Nvidia, a világ egyik vezető chipgyártója, öt év után először ismét jelentős kötvénykibocsátásra készül: több mint 25 milliárd dollár (kb...

kedd 15:25

A Samsung S95H OLED: lenyűgöző, de nem a várt Frame TV

Minden évben hatalmas felhajtás övezi a legújabb televíziókat, és mostanra a Samsung S95H OLED igazi különlegességnek számít ebben a mezőnyben...

kedd 15:01

A SprySOCKS új Windows-változata kormányzati rendszereket támad világszerte

A SprySOCKS néven ismert kártékony szoftver elsőként Linux rendszereken tűnt fel, de a közelmúltban megjelentek Windows-változatai is, amelyek kormányzati szervezeteket céloznak több országban, köztük Tajvanban, Thaiföldön, Pakisztánban és Hondurasban...

kedd 14:44

A Gmail AI-összegzései már mindenkinél futnak – így kapcsolod ki

Többek között már nem kell magadnak elolvasnod az e-maileket: a Gemini ezentúl átnézi őket helyetted – akár akarod, akár nem...

kedd 13:57

A 2026-os Razer Blade 18 letarolja a mezőnyt – ha meg tudod fizetni

🚀 A Razer Blade 18 (2026) ismét új szintre emeli, mit jelent egy valódi gamer laptop...

kedd 13:34

A Fortinet FortiSandbox kritikus sebezhetőségeit már aktívan kihasználják

⚠ Felmerül a kérdés, mennyire vagyunk biztonságban, ha még a legnagyobb kiberbiztonsági cégek termékei is súlyos hibákat rejtenek...

kedd 13:23

Az új COVID-oltások továbbra is óvják a szívet, kutatás szerint

Bár a legtöbb amerikai már nem igényli a szezonális COVID-19-oltásokat, a legújabb vakcinák továbbra is jelentős védelmet nyújtanak a szív- és érrendszeri megbetegedések ellen, különösen a 75 év felettieknek és a krónikus betegségben szenvedőknek...

kedd 13:01

Az iRhythm közölte: hackerek ellopták a betegek adatait

🔒 A digitális egészségügyi szolgáltató iRhythm Holdings súlyos adatlopást jelentett be, miután hackerek érzékeny személyes és egészségügyi adatokat tulajdonítottak el a cég által használt külső üzleti alkalmazásokból...

kedd 12:46

Az Atacama közepe a hittnél 20 millió évvel korábban száradt ki

🌍 Chile északi részén, a Föld egyik legszárazabb területén húzódik az Atacama-sivatag, amely évente átlagosan kevesebb mint 5 milliméter csapadékot kap...

kedd 12:34

Az Xbox Game Studios vezetője és stábfőnöke távozik – jön a reset?

Lényeges szempont, hogy a vezetői szintű távozások megrázhatják az egész játékipart, különösen akkor, ha azokat komoly változások előzik meg...

kedd 12:24

Az amerikaiak miért utálják egyre jobban az MI-adatközpontokat?

Az idei év elején egy hatalmas, hat darab, egyenként 21 méter magas épületből álló adatközpont terveit ejtették Észak-Karolinában, miután a fejlesztőt szigorodó szabályok és a helyi lakosság tiltakozása miatt visszalépésre kényszerítették...

kedd 11:56

A Philips Hue új Play lámpákkal, gyertyaizzókkal és kapcsolókkal támad

Az okos izzók és fényszalagok (Lightstrip) mellett mostantól a hagyományos csillárok és retró lámpák is integrálhatók a Philips Hue rendszerébe...

kedd 11:34

A Starlink mellett veszélyesen darabokra hullott egy kínai rakéta

Egy kínai magánvállalat által fejlesztett Zhuque-2E rakéta felső fokozata a fellövés után néhány órával széthullott, mindössze néhány száz kilométerre a Föld felszínétől, ahol a Nemzetközi Űrállomás, valamint számos Starlink-műhold kering...