Mit őriznek meg valójában az MI-modellek – és miért számít?

Mit őriznek meg valójában az MI-modellek – és miért számít?
Például egyre többen gyanítják, hogy a chatrobot valójában ismeri-e egy teljes könyv szövegét. Ezt most már modern módszerekkel vizsgálni is lehet. A Carnegie Mellon Egyetem, az Instituto Superior Técnico és a Hydrox AI kutatói olyan eszközt fejlesztettek ki, amely hatékonyan képes kifaggatni a nagy nyelvi modelleket arról, mit jegyeztek meg tanulási folyamataik során. Ez nemcsak a szerzői jogi aggályok miatt fontos, hanem átláthatóbbá is teheti az MI-k működését, és segíthet az esetleges jogsértések tisztázásában.

Vajon mit is rejt a zárt MI-tanulás?

Az MI-t fejlesztő cégek általában titokban tartják, pontosan milyen adatokat használnak fel a tanítás során. Így a felhasználók, a szabályozók vagy a jogtulajdonosok számára átláthatatlan, hogy milyen tudás épült be ezekbe a modellekbe. A helyzetet tovább nehezíti, hogy a korábbi vizsgálati módszerek mára sokat veszítettek megbízhatóságukból. Az újabb finomhangolások miatt ezek a rendszerek szándékosan kerülik a megtanult tartalmak kiadását – gyakran még akkor is, ha a kért szöveg közkincsnek számít.

A történet itt éles fordulatot vett

Megszületett a RECAP névre keresztelt eszköz (nem összekeverendő a Free Law Project RECAP-jával), amely egy különleges ügynök: iteratív körökben próbál tartalmakat kinyerni az MI-ből, folyamatosan javítva a kérdéseit ott, ahol elutasításba ütközik. Még egy jailbreak-funkciót is tartalmaz: ez mindig újrafogalmazza a kérést, ha a rendszer visszautasítaná a választ. Az igazi újítás azonban az ügynöki visszacsatolás: az MI több próbálkozás után egyre pontosabban adja ki, amit tud, miközben egy másodlagos MI végig ellenőrzi, hogy a folyamat ne torzuljon célzott, szó szerinti idézetekkel.

Mire képes a RECAP?

A kutatók által fejlesztett EchoTrace-teszt alapján a RECAP 0,46-os átlagpontszámot ért el, amivel 78%-kal előzi meg a korábbi módszereket. Például a Harry Potter és a bölcsek kövéből (Harry Potter and the Philosopher’s Stone) a RECAP körülbelül 3000 szövegrészletet tudott kivarázsolni a Claude-3.7 modellből, míg a legjobb korábbi eljárás mindössze 75-öt. Nem véletlen, hogy közben a Claude-ot fejlesztő Anthropic épp idén állapodott meg írókkal szerzői jogi vitákban.


Következésképpen

Az új módszer nemcsak azt mutatja meg, hogy mennyire képesek a nagyméretű MI-modellek visszaidézni akár védett tartalmakat is, hanem segít átláthatóbbá tenni azt, mit integráltak eddig az MI-k tudásbázisába. Ez a fejlődés átfogóbb képet nyújthat a jövőbeli szabályozási, szerzői jogi és etikai vitákhoz, valamint hozzájárulhat ahhoz, hogy egyértelműbb felelősségi viszonyok alakuljanak ki ebben a gyorsan változó technológiai térben.

2025, adminboss, go.theregister.com alapján

Legfrissebb posztok

Top
hétfő 16:50

Egyetemet végzett milliárdosok – ki mit végzett?

A közvéleményben gyakran keringenek olyan történetek, amelyek a felsőoktatásból kimaradó vállalkozókról szólnak...

MA 10:57

A GL.iNet Comet PoE minitesztje: olcsó, mégis menő 4K-s távoli KVM

A GL.iNet Comet PoE, más néven GL-RM1PE, egy kicsi, egyszerű, de hatékony távoli KVM-eszköz...

MA 10:50

Az önmegsemmisítő pendrive mindent eltüntet, mégsem gyullad ki

🔥 Egyeseknek csak egy egyszerű Küldetés: Lehetetlen (Mission: Impossible) jelenet, másoknak álom: a T-Create Expert P35S névre keresztelt hordozható SSD gombnyomásra képes végleg megsemmisíteni magát, és törölni minden rajta lévő adatot...

MA 10:43

Az amerikai kormány meghátrál: vége a majomkísérleteknek

🐒 Az amerikai Járványügyi Központ (CDC) váratlan döntéssel leállítja a majmokon végzett összes kutatását, így mintegy 200 makákó sorsa is bizonytalanná vált...

MA 10:37

Az Asus-routerek rémálma: érintett vagy? Így derítheted ki

😱 Több ezer Asus-router vált kínai állami hackerek célpontjává, akik teljes ellenőrzést szereztek ezek felett az eszközök felett, miközben szándékaik egyelőre ismeretlenek...

MA 10:29

Az új Grafana-sebezhetőség bárkiből adminisztrátort csinálhat

A Grafana Labs figyelmeztet egy súlyos sérülékenységre (CVE-2025-41115) az Enterprise verzióban, ami miatt a rendszer új felhasználókat adminisztrátorként ismerhet fel, illetve jogosultságbővítéshez vezethet...

MA 10:22

A moha kilenc hónapig túlélte a világűr könyörtelen környezetét

👽 Már eddig is ismert volt, hogy a mohák jól tűrik a kiszáradást, a sugárzást és a szélsőséges környezetet, de most egy kutatócsoport ennél is továbbment: kilenc hónapig hagyták a mohaspórákat az űr vákuumában, és a legtöbbjük túlélte...

MA 10:16

Az évszázad vízalkuja: most dől el a Colorado folyó sorsa

Évtizedes tárgyalások után újabb akadály hárult el a Colorado folyó menti vízjogok történelmi jelentőségű átruházásának útjából...

MA 10:01

Az őszi Windows-frissítés tönkrevágja a játékélményt

Októberi Windows-frissítések miatt jelentősen visszaesett a játékok teljesítménye több mint egymillió, Windows 11 24H2-t és 25H2-t futtató PC-ken...

MA 09:36

Az űr üressége csodát tesz: csillagok üzemanyag nélkül születnek

💫 A mindössze 12 millió fényévre található törpegalaxis, az NGC 6789 rejtélybe burkolózik...

MA 09:29

Az új gyógyszer áttörést hozhat a kemoterápia okozta idegkárosodás ellen

A kemoterápia komoly mellékhatása, az úgynevezett perifériás neuropátia (CIPN) a kezelt betegek akár felét is érinti...

MA 09:15

A Melissa hurrikán brutálisan megdöntött minden eddigi szélrekordot

Különösen igaz ez akkor, ha a trópusokon tomboló hurrikánokról van szó, ahol újabb és újabb széllökési csúcsokat mérnek...

MA 09:08

A Pentagon hulladékából lesznek a jövő stratégiai fémjei

🪨 A Pentagon közel 11 milliárd forinttal támogatja azt a kezdeményezést, amely az Egyesült Államokban ipari hulladékból állítana elő nélkülözhetetlen galliumot és szkandiumot...

MA 08:57

Az ösztrogén rejtett kapcsolója: így formálja az agy tanulását

🧠 Kiderült, hogyan formálja az ösztrogén és a dopamin együttműködése az agy tanulási képességeit, és hogyan befolyásolhat pszichiátriai tüneteket is...

MA 08:50

Az új membrán átírja a hidrogénleválasztás rekordját

A gázelválasztó membránokat tervező kutatók eddig főként olyan anyagokat alkottak, amelyek kifejezetten vonzzák a célgázt...

MA 08:43

A Salesforce új botránya: kibertámadás, bosszú és adatlopás

A ShinyHunters nevű zsaroló hackercsoport újabb jelentős betörést vállalt magára: saját állításuk szerint már három hónapja bejutottak a Gainsight rendszerébe, és több száz Salesforce-ügyfél adataihoz fértek hozzá...

MA 08:35

A Google hirdetései már az MI-módot is elárasztják

A Google újabb lépést tett a hirdetések világában: már a Gemini MI-módban is megjelentek a szponzorált tartalmak...

MA 08:29

Mégsem az e‑mailjeiddel tanítja az MI-t a Google

Az utóbbi napokban elterjedt az interneten, hogy a Gmail‑felhasználóknak ki kell kapcsolniuk az „okos funkciókat”, hogy adataikat ne használja fel a Google MI-betanításra...

MA 08:22

Az áruló belülről üt: botrány, hackerek, kirúgás a kiberóriásnál

A CrowdStrike nevű kiberbiztonsági vállalat egy gyanús alkalmazottat rúgott ki, miután kiderült, hogy céges információkat szivárogtatott egy hírhedt hackercsoportnak...