Mostantól te dönthetsz arról, ki láthatja a webes tartalmaidat

Mostantól te dönthetsz arról, ki láthatja a webes tartalmaidat
A nyílt és szabad internet megőrzése hosszú ideje kihívás: a tartalomkészítők számára nehéz eldönteni, miként védjék információikat az illetéktelen felhasználástól, miközben szeretnék azokat mindenki számára elérhetővé tenni. A legtöbben eddig két rossz között választhattak: vagy mindenki hozzáférhetett a tartalomhoz – vállalva az ezzel járó visszaélések kockázatát –, vagy jelszavas védelem mögé rejtették azt, ezzel viszont értékes látogatókat veszítettek. Fontos, hogy a Cloudflare új Content Signals Policy nevű kezdeményezése most valódi választási lehetőséget ad a weboldaltulajdonosoknak.

Mit tud a robots.txt – és mit nem?

A robots.txt fájl a weboldal gyökérmappájában található, és meghatározza, hogy mely robotok, keresőmotorok és automatizált szoftverek léphetnek be a site egyes területeire. Egy alapbeállítás mindenki számára hozzáférést engedhet a teljes webhelyhez, vagy épp tiltást állíthat be bizonyos mappákra, például az archívumra.

A robots.txt fájlban a # karakter utáni szöveg csak ember számára értelmezhető megjegyzés, a botok figyelmen kívül hagyják. Szűkíteni is lehet a hozzáférést például csak a Googlebot számára, vagy akár a teljes archívumot tilthatjuk le egyes szoftverek elől.

Ez azonban nem elég: bár kontrollálható, hogy ki fér hozzá, arról már nem küldünk üzenetet, hogy az adott szereplő mit tehet a már megszerzett tartalommal. Erre kínál új, közérthető és gép által olvasható szabályrendszert a Content Signals Policy.

Miért most érkezett el az idő?

Az elmúlt években a magukat MI-alapúként hirdető cégek óriási adatállományokat szipkáznak fel nap mint nap a weboldalakról. Ezzel a weboldaltulajdonosok úgy szenvednek veszteséget, hogy cserébe sem pénzt, sem látogatókat, sem hivatkozást nem kapnak. Egyre inkább ingyenélő mentalitás veszi át a hatalmat: előrejelzések szerint 2029-re a webes forgalom nagy részét már nem is emberek, hanem botok generálják majd, 2031-re pedig a botforgalom túlszárnyalhatja az egész jelenlegi internetforgalmat.

Régen ez másként volt: ha valaki átvette a tartalmadat, legalább feltüntette forrásként, vagy visszalinkelt az oldaladra. Ez még szellemi értéket is teremtett: az „attribúció”, vagyis a szerzői elismerés alapvető része volt az internet működésének, sőt ezt ma is előírják az MIT és a Creative Commons licencek. Ma ez a fair play háttérbe szorult, ezért sokan vagy teljesen bezárják tartalmaikat, vagy beletörődnek abba, hogy azokkal bárki visszaélhet, és elvesztik a forgalmat is.

Ha az alkotók kizárólag a teljes tiltás eszközéhez folyamodnak, az gátolja az új ötletek és a nyílt kommunikáció terjedését, valamint az MI-ökoszisztéma fiatal szereplőinek esélyeit is rombolja.

A Content Signals Policy működése

A megoldás: a robots.txt fájl kommentjeiben (tehát #-tel kezdődő sorokban) az üzemeltető egyszerűen jelezheti a gépek számára is, hogy milyen célra használható fel a tartalom a letöltést követően. Három fő tartalomszignált különböztetnek meg: “keresés” (search), “MI-bemenet” (ai-input), “MI-tanítás” (ai-train).

A szabályok értelmezése világos: a “yes” engedélyt, a “no” tiltást jelent, a hiányzó érték pedig sem nem engedélyez, sem nem tilt. Példa: ha egy site engedélyezi, hogy keresőmotorok indexeljék tartalmát (keresés=yes, search=yes), de kifejezetten tiltja annak MI-tréningre való felhasználását (MI-tanítás=no, ai-train=no), az így nézhet ki:

User-Agent: *
Content-Signal: search=yes, ai-train=no
Allow: /

Így a webhely üzemeltetője nyilvánvalóvá teheti szándékait anélkül, hogy minden egyes célhoz külön nyilatkozatot kellene fűznie. Fontos: ezek csak ajánlások, technikailag nem akadályozzák meg a tartalom felhasználását, de világos üzenetet adnak a civilizált botoknak – a többiek ellen továbbra is érdemes WAF-szabályokat és botmenedzsmentet alkalmazni.


Hogyan lehet beállítani?

A tartalomszignálok telepítése annyira egyszerű, mint bemásolni a szükséges sort a robots.txt fájlba. A Cloudflare automatikusan frissíti a több mint 3,8 millió olyan domain robots.txt-jét, ahol ezt a cég kezeli: ott alapból engedik a keresést, és tiltják az MI-tanítást.

A standard szöveg, valamint a saját szabályok összeállítása egyszerűen másolható a ContentSignals.org oldalról, vagy pár kattintással aktiválható.

A lényeget érdemes hangsúlyozni: a tartalomszignál inkább preferencia, mint szigorú szabály, de ma már ez is számít. A Cloudflare mindenki számára szabadon elérhetővé tette a Content Signals Policy-t egy CC0 licenc alatt.

Mi jöhet még?

A döntés joga visszakerül a tartalomtulajdonoshoz: ki engedi be a szuperintelligenciát, ki nem. Akik szeretik az MI-ket, beengedik őket, akik tartanak tőlük, kizárhatják – a lényeg, hogy végre ők maguk dönthetnek.

A tartalomszignálok korszerű eszközt adnak ahhoz, hogy világosan meg lehessen határozni, egy weboldal üzemeltetője mit enged és mit nem a tartalmával. A módszer csak akkor lesz igazán hasznos, ha egységesen elfogadottá válik; a Cloudflare ezért is dolgozik a nemzetközi szabványosításán.

Továbbra is mindenkit arra bátorítanak, hogy csatlakozzanak a kezdeményezéshez, hiszen a nyílt web még mindig megérdemli, hogy megvédjük.

2025, adminboss, blog.cloudflare.com alapján

Legfrissebb posztok

MA 16:03

Az első SARS-beteg nyomában: a COVID előtti pandémia titkai

🔮 2002 novemberében Foshan városában, Kínában egy éttermi dolgozó tüdőgyulladásszerű tünetekkel jelentkezett, ám csak két hónappal később derült ki, hogy valójában egy új, gyorsan terjedő betegség áll a háttérben...

MA 15:49

Az emberszabásúak józan esze: tényleg majdnem olyanok, mint mi?

🐒 Az ugandai Ngamba-szigeti csimpánzrezervátumban végzett friss kutatás rávilágít, mennyi közös van az emberek és a csimpánzok gondolkodásában...

MA 15:34

A mindent eldöntő magyar–ír ütközet a vb-kijutásért

Erre utal többek között az is, hogy a labdarúgó-világbajnoki selejtezők F csoportjában minden korábbinál kiélezettebb a harc – vasárnap Magyarország és Írország között dőlhet el, ki marad versenyben a 2026-os tornáért...

MA 15:18

Az osztalékbajnokok visszatértek: ezeket veszik most a profik

📈 Az amerikai részvénypiac jelenleg ingadozó, amiben a technológiai és MI-cégek magas értékeltsége és a bizonytalan gazdasági körülmények is közrejátszanak...

MA 15:02

A nagy okosizzó-áttörés: tényleg olcsóbb, egyszerűbb, menőbb?

💡 A Mashable olvasói között végzett felmérésből kiderült, melyek a legnépszerűbb okosizzók a piacon...

MA 14:50

A legnépszerűbb okos biztonsági kamerák, amiket érdemes megvenni

🔐 A Mashable olvasói most először szavazhattak kedvenc okosotthon-eszközeikről, köztük a biztonsági kamerákról is...

MA 14:33

Mostantól az új áramigényt csak a nap és a szél fedezi

2025 első három negyedévében a nap- és szélenergia olyan ütemben növekszik világszerte, hogy teljes egészében fedezni tudja a globális áramigény-növekedést...

MA 14:01

A szabadalomsértésért 230 milliárd forintos bírságot kapott az Apple

💸 Egy kaliforniai esküdtszék döntése szerint az Apple-nek 230 milliárd forintot (634 millió dollárt) kell kifizetnie a Masimo nevű orvostechnológiai cégnek, mert jogtalanul használta fel a vállalat szabadalmaztatott véroxigénszint-mérő technológiáját az Apple Watch funkcióiban...

MA 13:50

A tökéletes beszálló: Most érdemes Microsoftot és Nike-t venni

Hihetetlen, de mégis igaz, hogy még a legjobb cégek részvényei is erősen eshetnek, gyakran ok nélkül...

MA 13:17

Az adatközpontok sorsa az áramon múlik: bukás vagy megváltás?

⚡ Az MI rohamos térhódítása az adatközpontok működését teljesen átalakította. Eddig elegendő volt néhány szervert beüzemelni egy korszerű, légkondicionált teremben, és gondoskodni az áramellátásról...

MA 13:02

Az elfeledett Finger-protokoll újra a hackerek fegyvere

🕵 Fontos kérdés, hogy vajon mennyire biztonságosak az évtizedekkel ezelőtt készült rendszerszolgáltatások a mai kibertámadásokkal szemben...

MA 12:36

Az új SwitchBot S20 felmosásban zseniális, de akadnak furcsaságai

A SwitchBot S20 robottakarító az otthoni padlótisztítás feltűnő újdonsága, főleg, ha valaki a felmosásra helyezi a hangsúlyt...

MA 12:01

Az Apple végre jutalékot szed a WeChat minialkalmazásaiból

💰 Az Apple történelmi megállapodást kötött a kínai Tencenttel, amelynek révén 15 százalékos jutalékot szedhet a WeChatben futó minialkalmazásokon belüli vásárlásokból...

MA 11:49

Közel a nagy áttörés: működhet a kvantumszámítógépek hibajavítása

A kvantumszámítógépek álma eddig főleg a hibajavítás nehézségein bukott meg, hiszen a qubitek rendkívül érzékenyek, és könnyen elveszítik információjukat...

MA 11:34

Az ősi kutyafajták nem a viktoriánus kor szüleményei

🐶 A háziasított kutyák a legsokszínűbb emlősök egyike a Földön. Az apró chihuahuától az óriási dán dogig, a lapos orrú mopsztól a hosszú pofájú borzoiig elképesztő változatosságot figyelhetünk meg a formákban és a méretekben...

MA 11:17

A Google most keményen lép fel: vége az SMS-csalásoknak?

A Google jogi hadjáratot indított az egyre szaporodó SMS-csalások megfékezésére, most először szóban és tettekben is keményen fellép a legnagyobb elkövetőkkel szemben...

MA 11:02

Az Apple-t súlyos kártérítés megfizetésére kötelezték okosóra-szabadalmakért

💳 Egy kaliforniai esküdtszék döntése alapján az Apple 230 milliárd forint (634 millió dollár) kártérítést köteles fizetni, mert megsértette a Masimo orvostechnikai cég véroxigénszint mérésére vonatkozó szabadalmát...

MA 10:59

A kutyák ősi szövetsége: tízezer éve velünk vándorolnak

🐶 A kutyák döbbenetes sokfélesége ma már mindennapos: a falusi keverékektől kezdve a toy uszkárokon át a hatalmas masztiffokig minden méret, szín és forma létezik...

MA 10:52

Az új Hyundaiokon a fékcsere tényleg csak szakembernek való?

Érdekes felvetés, hogy az elektromos autók, amelyek szerkezetileg egyszerűbbek, mint a benzines társaik, karbantartásukban mégis egyre több akadályba ütköznek az autótulajdonosok – főként a szoftverek miatt...