
Vajon mit is rejt a zárt MI-tanulás?
Az MI-t fejlesztő cégek általában titokban tartják, pontosan milyen adatokat használnak fel a tanítás során. Így a felhasználók, a szabályozók vagy a jogtulajdonosok számára átláthatatlan, hogy milyen tudás épült be ezekbe a modellekbe. A helyzetet tovább nehezíti, hogy a korábbi vizsgálati módszerek mára sokat veszítettek megbízhatóságukból. Az újabb finomhangolások miatt ezek a rendszerek szándékosan kerülik a megtanult tartalmak kiadását – gyakran még akkor is, ha a kért szöveg közkincsnek számít.
A történet itt éles fordulatot vett
Megszületett a RECAP névre keresztelt eszköz (nem összekeverendő a Free Law Project RECAP-jával), amely egy különleges ügynök: iteratív körökben próbál tartalmakat kinyerni az MI-ből, folyamatosan javítva a kérdéseit ott, ahol elutasításba ütközik. Még egy jailbreak-funkciót is tartalmaz: ez mindig újrafogalmazza a kérést, ha a rendszer visszautasítaná a választ. Az igazi újítás azonban az ügynöki visszacsatolás: az MI több próbálkozás után egyre pontosabban adja ki, amit tud, miközben egy másodlagos MI végig ellenőrzi, hogy a folyamat ne torzuljon célzott, szó szerinti idézetekkel.
Mire képes a RECAP?
A kutatók által fejlesztett EchoTrace-teszt alapján a RECAP 0,46-os átlagpontszámot ért el, amivel 78%-kal előzi meg a korábbi módszereket. Például a Harry Potter és a bölcsek kövéből (Harry Potter and the Philosopher’s Stone) a RECAP körülbelül 3000 szövegrészletet tudott kivarázsolni a Claude-3.7 modellből, míg a legjobb korábbi eljárás mindössze 75-öt. Nem véletlen, hogy közben a Claude-ot fejlesztő Anthropic épp idén állapodott meg írókkal szerzői jogi vitákban.
Következésképpen
Az új módszer nemcsak azt mutatja meg, hogy mennyire képesek a nagyméretű MI-modellek visszaidézni akár védett tartalmakat is, hanem segít átláthatóbbá tenni azt, mit integráltak eddig az MI-k tudásbázisába. Ez a fejlődés átfogóbb képet nyújthat a jövőbeli szabályozási, szerzői jogi és etikai vitákhoz, valamint hozzájárulhat ahhoz, hogy egyértelműbb felelősségi viszonyok alakuljanak ki ebben a gyorsan változó technológiai térben.
